User:Modus Vivendi/Arabic Alphabet English

The Arabic alphabet is the principal script used for writing the Arabic language.

Though often designated an "alphabet", just as with writing systems of other Semitic languages, the writing system for Arabic is in fact an abjad, a term denoting a writing system which writes (primarily) consonants and a minimal number of other sounds (mostly long vowels).

As the alphabet of the language of the Qur'an', holy amoung [[Muslim|Muslims], the influence of the Arabic alphabet has spread throughout the Islamic world, and it has been  used  for writing many other languages with no common heritage with Arabic (sometimes alongside another writing systems, othertimes by extending the alphabet with non-Arabic letters), such as
 * Persian (Farsi),
 * Turkish ,
 * Kashmiri,
 * Sindhi
 * Urdu
 * Kurdish

None of these languages are in the same languge family, and apart from Turkish, all the languages in the preceding list are Indo-European, making them more closely related to English than Arabic, although Persian and Urdu have many Arabic loan-words.

It was often necessary to add new letters or modify the meanings of existing letters to adapt this alphabet to the phonological system of the languages in question. Certain African languages, such as Hausa also used the Arabic alphabet in the past before adopting a latin script later

The Arabic alphabet is composed of 29 basic letters and is written from right to left. There is no difference between written and printed letters; the concepts of upper and lower case letters do not exist (thus the writing is unicase). On the other hand, most of the letters are attached to one another, even when printed, and their appearance changes as a function of whether they are preceded or followed by other letters or stand alone (that is, there is contextual variation). The Arabic alphabet is an abjad, a term describing writing in which the vowels are not explicitly written; so the reader must know the language in order to restore them. However, in editions of the Qur'an or in didactic works a vocalization notation in the form of diacritic marks is used. Moreover, in vocalized texts, there is a series of other diacritics of which the most modern are an indication of vowel omission (suk&#363;n) and the doubling of consonants (&#353;adda).

This alphabet can be traced back to the Nabataean version of the Aramaic alphabet, itself descended from the Phoenecian. The first example of a text in the Arabic alphabet appeared in 512 A.D. In the 7th century, marks were added above and below the letters to differentiate them, as Aramaic had fewer phonemes than Arabic. Thus, in the early writings a single letter might represent several phonemes.

The Arabic alphabet can be transliterated and transcribed in various ways. The preferred method in this document will be DIN-31635. It can be encoded using several character sets, including: ISO-8859-6 and Unicode, thanks to the "Arabic segment", entries U+0600 to U+06FF. However, these two sets do not indicate for each of the characters the in-context form they should take. It is left to the rendering engine to select the proper glyph to display for each character.

When one wants to encode a particular written form of a character, there are extra code points provided in Unicode which can be used to express the exact written form desired. The Arabic presentation forms A (U+FB50 to U+FDFF) and Arabic presentation forms B (U+FE70 to U+FEFF) contain most of the characters with contextual variation as well as the extended characters appropriate for other languages. It is also possible to use zero-width joiners and non-joiners. Note that the use of these presentation forms is deprecated in Unicode, and should generally only be used within the internals of text-rendering software,  or for backwards compatibility with implementations that rely on the hard-coding of glyph forms.

Finally, the Unicode encoding of Arabic is in logical order, that is, the characters are entered, and stored in computer memory, in the order that they are written and pronounced without worrying about the direction in which they will be displayed on paper or on the screen. Again, it is left to the rendering engine to present the characters in the correct direction. In this regard, if the Arabic words on this page are written left to right, it is an indication that the Unicode rendering engine used to display them is out-of-date. For more information about encoding Arabic, consult the Unicode manual available at http://www.unicode.org/

Presentation of the alphabet
The transcription and the transliteration mainly follow the DIN 31635 standard; the alternatives belonging to other standards are indicated after the oblique bar.

Notice that the superscript diacritic above the vowels can be easily replaced by a circumflex.

A transliteration from Arabic must clearly show the characters which are not pronounced or which are pronounced as others in order to avoid being ambiguous; a transcription indicates only the pronunciation. See below for more details. The phonetic transcription (somewhat simplified here) follows the conventions of the International Phonetic Alphabet: for more details concerning the pronunciation of Arabic, consult the article on Arabic pronunciation.

Primary letters
Letters lacking an initial or medial version are never tied to the following letter, even in a word. As to &#65152; hamza, it has only a single graphic, since it is never tied to a preceding or following letter. The hamza can also act as a diacritic (in this case it is said to have a carrier). For there is no Arabic word beginning with an &#702;alif, hamza is actually the first letter of the alphabet.

Writing the hamza
Initially, the letter &#702;alif indicated a occlusive glottal, or glottal stop, transcribed by [&#660;], in common with other alphabets of Phoenician origin. Now it is used in the same manner as in other abjads, with y&#257;&#702; and w&#257;w, as a mater lectionis. In fact, over the course of time its phonetic value has been obscured, since, &#702;alif serves principally to replace phonemes or to serve as a graphic support for certain diacritics.

The Arabic alphabet now mainly uses the hamza to indicate a glottal stop, which can appear anywhere in a word. This letter, however, does not function like the others: it can be written alone or on a support in which case it becomes a diacritic:


 * with a support : &#1569; ;
 * with a support : &#1573; ,&#1571; (above and under a &#702;alif), &#1572; (above a w&#257;w), &#1574; (above a y&#257;&#702; 'without points or y&#257;&#702; hamza).

The details of writing of the hamza are discussed below, after a discussion of vowels and then syllable-division marks, because their functions are interrelated.

Ligatures
l&#257;m+&#702;alif, etc.

Vowels
Generally, vowels (brief or long) are not written down, except in some holy or didactic texts where the latest are said to be « voiced ». A diacritic means brief vowel if it is located above or under the previous consonant in the syllabus, while long ones are noted by the diacritic of the equivalent brief one, followed by a consonnant (&#702;alif for the extension of /a/, y&#257;&#702; for /i/ and w&#257;w for /u/, i.e. a&#257; = &#257;, iy = &#299; and uw = &#363;) ; non voiced texts, long vowels are shown by the corresponding consonnants (&#257;, y, w). While no arabian syllabus begin with a vowel (e.g there is an initial consonnant in first name like Ali, &#703;Al&#299;, or word like &#702;alif), there is no independant representation.

Alphabet handles long vowels, written thanks to diagram, as a series of vowel+regular consonant, which requires the use of  suk&#363;n (Cf. thereafter) in a fully diacritical text.

For clarity's sake, vowles would be located over or below the letter &#65173; t&#257;&#702; ; thus you should read the results [ta], [ti], [tu], etc. However letters are not linked together: therefore a correct representation of &#257; is t&#257;, written &#1578;&#1614;&#8204;&#1575; instead of &#1578;&#1614;&#1575;.

Diphtongs [ay] & [au]
They are simply noted by a brief vowel, followed by a spirant consonnant [j] or [w]. Writing handle it like &#299; and &#363;, i.e. doesn't distinguish it from other series of vowels+consonants. You could classified among diphtongs those beginning with &#299;y and &#363;w&#160;as well; however they aren't voweld followed by a consonant. Like before, t precedes diphtongs and letters are not liked.

Voyelles casuelles
Lors de la flexion nominale, les noms peuvent recevoir trois désinences différentes, -a, -i, et -u. Celles-ci ne sont pas écrites dans un texte non vocalisé, sinon, les signes habituels sont employés. Cependant, si le mot est indéfini (sans article ni complément du nom), il prend (sauf exceptions) les désinences -an, -in, -un, nommées tanw&#299;n. Celles-ci sont notées par des diacritiques spéciaux qui remplacent la voyelle ainsi que la lettre -n attendue en fin de mot ; selon que le texte est vocalisé ou non, la notation change :
 * tanw&#299;n -an (tanw&#299;n al-fat&#7717;a) : &#1600;&#1600;&#1611;&#1600;&#160;; un &#702;alif est placé à la suite du tanw&#299;n, sauf si le mot se termine par &#1577; t&#257;&#702; marb&#363;&#7789;a [a(t)] (suffixe de féminin), ou par un hamza, &#1571; [a&#660;] ou &#1575;&#1569;, [&#257;&#660;], auquel cas le tanw&#299;n reste seul ; dans un texte non vocalisé, seul le &#702;alif est écrit, si c'est possible :
 * &#1585;&#1614;&#1580;&#1615;&#1604;&#1611;&#1575; ra&#487;ulan, « homme (cas direct) » ; non vocalisé : &#1585;&#1580;&#1604;&#1575;&#1611;,
 * &#1593;&#1614;&#1575;&#1583;&#1614;&#1577;&#1611; &#703;&#257;datan, « d'habitude » (noter l'utilisation du t&#257;&#702; marb&#363;&#7789;a prononcé ici [at] devant voyelle) ; non vocalisé : &#1593;&#1575;&#1583;&#1577; (pas d&#702;alif' après &#1577;),
 * tanw&#299;n -in (tanw&#299;n a&#7693;-&#7693;amma) : &#1600;&#1600;&#1613;&#1600;&#160;; il n'est pas écrit dans les textes non vocalisés :
 * &#1585;&#1614;&#1580;&#1615;&#1604;&#1613; ra&#487;ulin, « homme (cas indirect) » ; non vocalisé : &#1585;&#1580;&#1604;&#160;;
 * tanw&#299;n -in (tanw&#299;n al-kasra) : &#1600;&#1600;&#1612;&#1600; (il existe une deuxième graphie, ressemblant à « &#8221; » suscrit) ; il n'est pas écrit dans les textes non vocalisés :
 * &#1585;&#1614;&#1580;&#1615;&#1604;&#1612;, « homme (cas sujet) » : non vocalisé : &#1583;&#1580;&#1604; (le cas sujet et le cas indirect ne se distinguent donc pas).

Dans la pratique, le [n] des tanw&#299;n n'est pas prononcés (sauf des expressions adverbiales figées). Il appartient à la langue littéraire de l'arabe classique.

Signes de syllabation et autres
De même que pour les signes de vocalisation, les signes de syllabation ne sont pas obligatoirement écrits. Ils permettent cependant une grande précision et s'utilisent parfois quand le texte n'est pas vocalisé.

Suk&#363;n
An Arabic syllable can be open (ended by a vowel) or closed (ended by a consonant).
 * open: C[onsonant]V[owel];
 * closed: CVC(C).

Quand la syllabe est fermée, on peut indiquer que la consonne qui la ferme ne porte aucune voyelle en plaçant au dessus un signe nommé suk&#363;n, de la forme « ° », pour lever tout ambiguïté, surtout quand le texte n'est pas vocalisé : il faut se souvenir qu'un texte standard n'est composé que de suites de consonnes ; ainsi, le mot qalb, « c&#339;ur », est écrit qlb. Les suk&#363;n permettent de savoir où ne pas placer une voyelle : qlb (&#1602;&#1604;&#1576;) pourrait en effet être lu /qVlVbV/, mais écrit avec un suk&#363;n sur le l et sur le b, il ne peut être interprété que sous la forme /qVlb/ (quant à savoir quelle est la voyelle /V/, il faut pour cela connaître le mot) ; on écrit donc &#1602;&#1604;&#1618;&#1576;&#1618; (sans ligatures : &#1602;&#8204;&#1604;&#1618;&#8204;&#1576;&#1618;). De fait, dans un texte vocalisé le suk&#363;n se semble pas nécessaire, puisque le placement des voyelles est sûr : &#1602;&#1616;&#1604;&#1618;&#1576;&#1618; est quelque peu redondant.

L'on peut faire de même pour l'écriture des voyelles longues et des diphtongues, puisque celles-ci sont notées par une voyelle suivie d'une consonne : ainsi m&#363;s&#299;q&#257;, « musique », s'écrit de manière non vocalisée mwsyq&#257; (&#1605;&#1608;&#1587;&#1610;&#1602;&#1609; avec un &#702;alif maq&#7779;&#363;ra en fin de mot) ; pour éviter une lecture /mVwVsVyVq&#257;/, il est possible d'indiquer que w et y ferment leur syllabe respective : &#1605;&#1608;&#1618;&#1587;&#1610;&#1618;&#1602;&#1609;&#1618; (noter que &#702;alif maq&#7779;&#363;ra est considéré comme une consonne et qu'il porte donc aussi le suk&#363;n). Le mot, entièrement vocalisé, est écrit &#1605;&#1615;&#1608;&#1618;&#1587;&#1616;&#1610;&#1618;&#1602;&#1614;&#1609;&#1618;. De même pour les diphtongues : le mot zau&#487;, « mari », peut être écrit simplement zw&#487;&#160;: &#1586;&#1608;&#1580;, avec suk&#363;n&#160;: &#1586;&#1608;&#1618;&#1580;&#1618;, avec suk&#363;n et voyelle : &#1586;&#1614;&#1608;&#1618;&#1580;&#1618;. Dans la pratique, le suk&#363;n n'est pas placé au-dessus des lettres servant à indiquer l'allongement de la voyelle qui précède : m&#363;s&#299;q&#257; sera plus simplement écrit &#1605;&#1615;&#1608;&#1587;&#1616;&#1610;&#1602;&#1614;&#1609;. De même, il n'est que rarement placé en fin de mot quand la dernière syllabe est fermée.

&#352;adda
Ce signe, de forme «&#160;&#1617;&#160;&#160;» sert à faire l'économie d'une lettre quand deux consonnes identiques se suivent : c'est le cas lorsqu'une syllabe fermée terminée par une consonne X précède une autre syllabe débutant par cette consonne X. On place la &#353;adda au-dessus d'une des consonnes, tandis que l'autre n'est pas écrite : ainsi, le mot &#353;adda lui-même est orthographié &#1588;&#1583;&#1617; au lieu de&#160;&#1588;&#1583;&#1583; ; le mot, vocalisé, donne &#1588;&#1614;&#1583;&#1617;&#1614;. Il n'y a donc plus besoin d'utiliser un suk&#363;n&#160;; sinon, l'on écrirait *&#1588;&#1614;&#1583;&#1618;&#1583;&#1614;.

La &#353;adda se rencontre très fréquemment dans les cas d'assimilation de la consonne [l] de l'article devant consonne solaire : ainsi, « la lune » s'écrit &#1571;&#1614;&#1604;&#1618;&#1602;&#1614;&#1605;&#1614;&#1585; &#702;al-qamar, mais « le soleil » est noté &#1571;&#1614;&#1604;&#1588;&#1617;&#1614;&#1605;&#1618;&#1587; &#702;a&#353;-&#353;ams (il est écrit en réalité &#702;al&#353;&#353;ams).

Noter le placement des signes de vocalisation :
 * fat&#7717;a [a] et &#7693;amma [u] sont écrits au-dessus de la &#353;adda tandis que kasra est écrite soit régulièrement sous la consonne qui la porte, soit sous la &#353;adda&#160;: il ne faut donc pas confondre &#64754; et &#64756;&#160;;
 * les tanw&#299;n [an] et [un] suivent les mêmes principes (au-dessus de la &#353;adda), mais le tanw&#299;n [in] ne se place qu'au-dessous de sa lettre (et non sous la &#353;adda).

Writing of the hamza
On l'a dit, la hamza peut se présenter sans ou avec support. Les règles d'écritures dépendent en fait du vocalisme et de la syllabation. It is necessary to consider the place of the word where the hamza appears::

1. hamza à l'initiale : 2. Hamza à la finale :
 * elle a toujours le support &#702;alif et elle est toujours suivie d'une voyelle ;
 * elle se place au-dessous du &#702;alif si la voyelle qui suit est /i/, long ou bref, que le texte soit vocalisé ou non : &#1573;&#1616; et &#1573; notent tous deux &#702;i, comme dans le prénom &#702;Ibr&#257;h&#299;m, écrit &#1573;&#1616;&#1576;&#1618;&#1585;&#1614;&#1575;&#1607;&#1616;&#1610;&#1605;&#160;ou &#1573;&#1576;&#1585;&#1575;&#1607;&#1610;&#1605; ;
 * elle se place au-dessus du &#702;alif dans les autres cas : &#702;a est not&#233; &#1571;&#1614; ou &#1571;, tandis que &#702;u est écrit &#1571;&#1615; ou &#1571;, par exemple ; ainsi &#1571;&#1614;&#1606;&#1618;&#1578;&#1614; ou &#1571;&#1606;&#1578; &#702;anta, « toi (masculin) » ; &#1571;&#1615;&#1587;&#1618;&#1576;&#1615;&#1608;&#1593; ou &#1571;&#1587;&#1576;&#1608;&#1593; &#702;usb&#363;&#703;, « semaine » ; &#1571;&#1614;&#1610;&#1618;&#1606;&#1614; ou &#1571;&#1610;&#1606; &#702;ayna, « où ? », etc.
 * son support varie selon le timbre de la voyelle qui précède ;
 * si c'est /a/, /i/ ou /o/ suivis de hamza, les supports sont respectivement &#702;alif, y&#257;&#702; hamza (sans points), w&#257;w&#160;: &#1605;&#1615;&#1576;&#1618;&#1578;&#1614;&#1583;&#1614;&#1571; "mubtada&#702;'', « commencement » ;
 * dans les autres cas (avant suk&#363;n, lettre d'allongement, etc.), hamza n'a pas de support : &#1588;&#1614;&#1610;&#1618;&#1569; &#353;ay&#702;, « chose » ; &#1576;&#1614;&#1575;&#1618;&#1569; b&#257;&#702;, « lettre B », &#1590;&#1614;&#1608;&#1618;&#1569; &#7693;aw&#702;, « lumière ».

Letters used for other languages

 * to be written

Regarding transliteration

 * to be written