User:Splarka/alpha

Annoying invisible unicode
NO-BREAK SPACE U+00A0 -> {&#160;} SOFT HYPHEN U+00AD -> {&#173;} EN SPACE (U+2002) -> {&#x2002;} EM SPACE (U+2003) -> {&#x2003;} HAIR SPACE (U+200A) -> {&#x200a;} ZERO WIDTH SPACE (U+200B) -> {&#x200b;} LEFT-TO-RIGHT MARK (U+200E) -> {&#x200e;} RIGHT-TO-LEFT MARK (U+200F) -> {&#x200f;}

LEFT-TO-RIGHT EMBEDDING (U+202A) -> {&#x202a;} RIGHT-TO-LEFT EMBEDDING (U+202B) -> {&#x202b;} POP DIRECTIONAL FORMATTING (U+202C) -> {&#x202c;} LEFT-TO-RIGHT OVERRIDE (U+202D) -> {&#x202d;} RIGHT-TO-LEFT OVERRIDE (U+202E) -> {&#x202e;} NARROW NO-BREAK SPACE (U+202F) -> {&#x202f;}


 * unsuitable characters for markup
 * unicode spaces

Cyrillic
Аа Бб Вв Гг Дд Ее Жж Зз Ии Йй Кк Лл Мм Нн Оо Пп Рр Сс Тт Уу Фф Хх Цц Чч Шш Щщ Ьь Юю Яя

Conversion
Example: LEFT-TO-RIGHT EMBEDDING
 * Code: U+202A
 * URL encoding: %E2%80%AA or %26%238234%3B
 * HTML encoding: &amp;#x202a; or &amp;#8234;
 * JS encoding: \u202A or String.fromCharCode(8234)