Home About us Products Services Contact us Bookmark
:: wikimiki.org ::
Alphabet Pan-nigérian

Alphabet pan-nigérian

L'alphabet pan-nigérian est une ensemble de caractères latins comprenant des lettres diacritées et des lettres supplémentaires. Il a été conçu pour que l'on puisse, en théorie, écrire toutes les langues du Nigeria (plus de 250 selon la méthode de décompte, parmi lesquelles le yorouba, le haoussa, l'igbo, le peul, l'édo etc.) au moyen d'un même ensemble de signes. Outre les diacritiques créant de nouvelles lettres, il en existe d'autres, plus ou moins souvent utilisés, permettant de noter les tons des langues, comme l'accent aigu, l'accent grave, l'accent circonflexe, le macron, etc. En pratique, l'alphabet pan-nigérian ne permet pas la transcription écrite de toutes les langues du Nigeria mais a pu servir de référence à la mise en place d'autres alphabets pour l'Afrique, comme l'alphabet international de Niamey.

Histoire

C'est dans les années 80 que le gouvernement du Nigeria, et plus précisément son National Language Centre, a décidé, pour uniformiser à l'écrit une situation linguistique complexe (on peut recenser plus de 250 langues dans ce pays, qui ne sont pas forcément écrites), de mettre au point un ensemble de caractères susceptibles de transcrire toutes les langues du territoire. Il fallait aussi prévoir un alphabet que l'on pût retrouver sur les machines à écrire, outil administratif important. Lors d'un colloque consacré à la question des machines à écrire tenu en 1983 à Bénin, la maquette proposée en 1981 par le professeur de linguistique Kay Williamson et retouchée par des linguistes nigérians a été officiellement considérée comme le point de départ d'une recherche formelle. Hermann Zapf, professeur et calligraphe allemand, en a donné la version définitive.

Graphèmes

Il n'y a, dans cet alphabet théorique (toutes les langues n'utilisent bien sûr pas toutes les lettre possibles), aucun digramme. Le modèle a été finalisé par Hermann Zapf. Le voici sans les diacritiques annexes (É é, È è et Ê ê) : Le voici tel que présenté dans les années 80 par la firme Olivetti au National Language Centre du Nigeria pour un projet de machine à écrire :

Remarques

Le diacritique souscrit des lettres qu'on a citées là sous la forme , , etc., n'est normalement pas un point souscrit mais une barre verticale souscrite. On devrait donc écrire , , etc. Les graphies avec le point, cependant, sont de plus en plus courantes, des caractères précomposés étant prévus par Unicode, au contraire des graphies avec barre souscrite. On remarque une influence directe de la linguistique dans la création de l'alphabet : des symboles comme ɓ, ɗ, ǝ et ƙ sont en effet directement empruntés à l'alphabet phonétique international avec la même valeur phonétique. L'absence de symboles comme ŋ, ɛ et ɔ, largement repris dans d'autres alphabets latins d'Afrique (consulter Alphabet international de Niamey), est cependant notable. C'est sans doute ces lacunes qui expliquent son faible succès. Actuellement, le stock de caractères nécessaire pour les orthographes des langues du Nigeria est le suivant :
ā a̱ ạ ḅ ɓ ḍ ɗ e̱ ẹ ɛ ə ḥ ị ɨ ƙ ṅ ṇ ŋ ñ n̄ o̱ ọ ɔ ʌ ṣ ụ ʼw ʼy ẓ ʼ

Articles connexes


- Alphabet international de Niamey ou « alphabet africain de référence » ;
- langues d'Afrique ;
- alphabet latin, diacritiques de l'alphabet latin, lettres supplémentaires de l'alphabet latin ;
- alphabet phonétique international. Catégorie:Méthode de transcription Catégorie:Clavier Pan-nigerian

Alphabet latin

L'alphabet latin est l'alphabet qu'on utilise majoritairement pour écrire les langues d'Europe occidentale ainsi que dans les pays qui ont été colonisés par les Européens. C'est, en concurrence avec l'alphabet cyrillique et, dans une bien moindre part, l'alphabet grec, l'écriture occidentale par défaut et maintenant – en raison de l'importance économique et culturelle de pays l'utilisant (comme les États-Unis) une écriture internationale : on peut trouver des mots écrits en lettres latines dans les rues du Japon comme dans celles de l'Égypte. On nomme cet alphabet ainsi car c'était, à l'origine, celui des Romains et de leur langue, le latin.

Lettres

L'alphabet latin, comme la majorité de ceux issus de l'alphabet grec, est bicaméral : on utilise deux graphies pour chaque graphème (ou lettre), l'une dite minuscule, l'autre capitale. Dans la majorité des cas, chaque lettre possède les deux variantes. Il existe cependant quelques exceptions, comme la lettre ß (eszett ; utilisée en allemand et autrefois dans d'autres langues, dont le français), qui, en capitales, est remplacée par SS. L'expansion – tant géographique que temporelle – de cet alphabet en fait l'un des plus riches en variantes nationales. Ainsi :
- chaque langue donnée utilise un jeu plus ou moins complet de lettres fondamentales ;
- chacune peut en posséder des lettres modifiées qui s'y ajoutent ;
- parmi les lettres modifiées, certaines sont considées, selon les langues, comme des lettres à part entière ou comme des variantes d'une autre lettre. Par exemple, les alphabets utilisés pour le français et pour le castillan ne sont pas identiques (ainsi, la lettre ç ne s'emploie pas en castillan et le français, à l'inverse ne se sert pas de á), bien que tous deux puissent être ramenés à l'alphabet latin. En sorte, il ne serait pas faux de parler d'un alphabet français et d'un alphabet castillan. On le voit, il n'existe rien tel qu'un alphabet latin figé et constant ; il est cependant possible d'isoler les graphèmes fondamentaux utilisés dans une majorité de langues : ce sont ceux de l'alphabet des origines (voir plus bas, section « Histoire ») plus j et u ainsi que g et w, soient :

Graphèmes fondamentaux

cellpadding="8" |+ Capitales |- style="font-size:20px;" | A || B || C || D || E || F || G || H || I || J || K || L || M |- style="font-size:20px;" | N || O || P || Q || R || S || T || U || V || W || X || Y || Z |{{XIXe siècle{entête tableau simple style|text-align: center;

Diacritiques de l'alphabet latin

L'alphabet latin a connu, d'abord dans le monde occidental puis après les différentes périodes de colonisation, partout dans le monde, une extension géographique considérable : tout au long de son histoire, il a été conservé ou emprunté par de nombreux peuples qui s'en sont servi pour noter leur langue. À l'origine destiné à la langue des Romains, qu'il ne transcrivait déjà pas très fidèlement, son nombre réduit de lettres en a montré les limites : les langues l'utilisant ont dû, pour étendre les possibilités d'une transcription plus fidèle, soit façonner de nouvelles lettres, soit créer de nouvelles unités au moyen de plusieurs signes (comme les digrammes) soit, enfin, modifier des lettres existantes au moyen de diacritiques. Les signes obtenus peuvent être considérés comme de nouveaux graphèmes (ils sont dans ce cas inclus dans l'alphabet de la langue), ou comme des variantes du graphème fondamental qui les porte (ils ne sont alors pas répertoriés dans l'alphabet). Cette distinction est très importante pour le classement alphabétique des mots d'un dictionnaire, par exemple. Ainsi, en castillan, la lettre diacritée ñ (n tildé) est considérée comme une lettre indépendante, classée à la suite de n, tandis qu'en français aucune des variantes diacritées de e (soient é, è, ê et ë) n'est classée autrement que si elle ne portait aucun diacritique. En castillan, toujours, á, é, í, ó, et ú ne sont cependant pas considérées comme des graphèmes mais comme des variantes. L'alphabet phonétique international fait grand usage de diacritiques ; ceux qui lui sont propres seront aussi traités dans cette série d'articles. Enfin, les diacritiques utilisés en français font l'objet d'articles supplémentaires.

Introduction

L'utilisation de diacritiques s'est avérée très féconde et le mouvement s'est accéléré au XVIIIe siècle quand il s'est agi de transmettre rigoureusement des textes ou des énoncés de langues lointaines qu'on découvrait : les transcriptions et translittérations en lettres latines, c'est-à-dire la romanisation, a nécessité l'utilisation en nombre important de diacritiques. Il ne serait en effet pas aisé de lire une transcription dans laquelle certaines lettres seraient inventées. Les divers alphabets phonétiques, issus des recherches nouvelles en phonétique et phonologie, ont eux aussi eu recours à ce procédé pour étendre leur nombre de caractères. Sachant, enfin, que de nombreuses langues ne sont pas écrites ou depuis peu, c'est maintenant presque exclusivement en alphabet latin étendu qu'elles sont notées par les linguistes, au moyen d'outils comme l'alphabet phonétique international. L'alphabet pan-nigérian est à cet égard représentatif.

Apex et i long latins

Dans les premiers temps de l'alphabet latin, il n'existait pour ainsi dire aucune ponctuation (si l'on exclut l'usage sporadique du point médian séparateur de mots), aucun diacritique. C'est cependant dès la fin du IIe siècle avant l'ère chrétienne qu'apparaît un premier diacritique, dit apex (en latin : « pointe »), qui n'est pas d'usage systématique, loin s'en faut, ni toujours utilisé à « bon » escient, si son rôle est bien d'indiquer la présence de voyelles longues. Il est assez courant sous l'Empire. L'apex, qui ressemble à un accent aigu, ne se place cependant pas sur la lettre I qui, elle, est tracée plus grande que la normale. Noter que l'apex est légèrement décalé sur la droite de la voyelle qui le porte et que li long dépasse en hauteur mais ne descend pas sous la ligne de base. Détail d'une stèle funéraire avec deux i longs Détail d'une stèle funéraire avec un apex Détail d'une inscription latine avec apex Dans les images ci-dessus, on lit :
- CORVINUS et SILANUS (à gauche) ;
- FÉCIT (au centre) ;
- RÓMVLVS·MÁRTIS·FILIVS·VRBEM·RÓMAM (à droite ; noter les points médians séparateurs). Dans les ouvrages didactiques, on marque la quantité longue des voyelles latines au moyen du macron, signe inventé par les grammairiens grecs : on aurait dans ce cas
Corvīnus, fēcit, Rōmulus Mārtis fīlius Urbem Rōman. L'apex et li long apportent des informations importantes sur la phonologie latine : en effet, outre par la connaissance de la phonétique historique de cette langue, c'est très souvent par la scansion des vers latins qu'on connaît les quantités vocaliques des mots. Or, la scansion ne révèle que la quantité des syllabes : pour la métrique latine, /mar/, dans Martis, est une syllabe longue (car fermée) quelle que soit la quantité du /a/. L'apex sur la lettre A indique ici que la syllabe longue est composée d'une voyelle longue.

Signes abréviatifs et éditoriaux devenus des diacritiques

L'apex et le i long ne se sont pas suffisamment répandus pour être passés dans les usages postérieurs et se limitent au seul latin. Ce qui, en revanche, a pris une ampleur importante depuis les débuts de l'alphabet latin, ce sont les marques indicant des abréviations présentes en épigraphie puis, et surtout, dans les manuscrits. Au départ, les signes et procédés utilisés pour signaler de telles abréviations ne sont certes pas des diacritiques au sens réel du terme mais, changeant de fonction au fil des années, il ont pu par la suite (généralement au Moyen Âge) le devenir, les scribes étant de plus en plus souvent confrontés au problème de la notation de leur langue natale par un alphabet qui s'y prête mal. En effet, la langue latine, après la chute de l'Empire romain, avait cessé d'être – pour ainsi dire – la seule qui fut écrite. Parmi les signes abréviatifs réutilisés, on compte le titulus (« titre » ; le mot est devenu tilde), trait suscrit (devenu ensuite un trait ondulé) utilisé pour indiquer qu'une lettre, le plus souvent une nasale, a été omise pour des raisons d'économie de place (ou de matériau). Par exemple, annu(m) a pu être écrit an̅u dans les manuscrits espagnols pour devenir enfin año, « an », en castillan, puisque /nn/ latin est passé à /ɲ/ (de gnon) dans cette langue. Des lettres suscrites ou souscrites sont aussi utilisées dans une fonction diacritique ; c'est le cas du z qui, d'abord placé après un c pour signaler qu'il devait se prononcer /ts/ (maintenant /s/) devant des voyelles comme a, o et u, a été finalement écrit au-dessous du c. Ce z souscrit, nommé zedilla en castillan, soit « petit z », est devenu notre cédille (cf. aussi Lettre diacritique). Il a cependant existé, avant la cédille, un diacritique graphiquement proche (ou proche d'un ogonek) attesté dès le VIe siècle en onciale sous le e, dit alors E caudatae doté d'une queue »), remplaçant parfois le digramme ae (écrit parfois æ, coutume qui s'est étendue par la suite) servant à noter le plus souvent un /ɛ/ ouvert. Il est notable que cette lettre, qu'on peut représenter ici par ę (avec un ogonek) ou ȩ (avec une cédille), ait été conservée dans la transcription des romanistes alors que c'est le digramme ae (maintenant présenté sous la forme liée æ et nommée ash) qui l'ait été dans la transcription des langues germaniques (sachant que ę était aussi utilisé dans les manuscrits en vieil anglais de l'onciale insulaire). Enfin, des symboles éditoriaux plus généraux (servant à indiquer des erreurs du copiste, par exemple) ont aussi pu accéder au statut de diacritiques ; le cas se présente avec le punctum delens (« point effaçant »), très fréquent dans les manuscrits irlandais, qui signale que la lettre le portant est une erreur et ne doit pas se faire entendre. Par extension, il signale ensuite les lettres muettes issues d'une mutation consonantique puis toutes les mutations consonantiques ; ainsi en gaéliquemo ḟele, « mon incantation », mo ċú, « mon chien » (écrits actuellement mo fhele, mo chú). Consulter Point suscrit pour plus de détails. Certains de ces signes ont donné des symboles typographiques, comme le croisillon (#), ancien N surmonté d'un titulus, abréviation pour numerus, « numéro ».

Liste des diacritiques

titulus

Suscrits

Les diacritiques suscrits sont placés au-dessus de la lettre qu'ils modifient:
- ó : accent aigu
- ő : double accent aigu
- ô : accent circonflexe
- ò : accent grave
- ȍ : double accent grave
- ŏ : brève
- ȏ : brève renversée
- : crochet en chef
- ƈ : crosse
- ǒ : háček ou caron
- : ligne verticale (voir également l'article sur l'apostrophe)
- ō : macron ou ligne suscrite
- ȯ : point en chef (voir aussi le point en ponctuation)
- : rond en chef, ou kroužek selon le terme tchèque
- õ : tilde
- ö : tréma ou, improprement, umlaut
- : chandrabindu : (note un type de nasalisation propre au sanskrit ; on le rencontre dans la transcription de la syllabe ॐ om̐, par exemple).

Souscrits

Les diacritiques souscrits sont placés en-dessous de la lettre qu'ils modifient:
- : cédille
- : point souscrit
- ǫ : ogonek
- : crochet palatal
- : crochet rétroflexe
- ɕ : boucle souscrite
- : tilde souscrit
- : accent circonflexe souscrit
- : ligne souscrite
- : virgule souscrite
- : brève souscrite
- : brève renversée souscrite
- : ligne verticale souscrite
- : rond souscrit

Adscrits

Les diacritiques adscrits sont placés sur le côté de la lettre qu'ils modifient:
- : apostrophe (en remplacement du háček dans certains cas) ;
- ơ : corne
- : crochet rhotique
- ŀ : point médian

Inscrits

Les diacritiques inscrits sont placés à travers la lettre qu'ils modifient:
- ɵ : barre inscrite
- ø : barre oblique
- : contre-barre oblique
- ɫ : tilde inscrit
- ɬ : sangle inscrite

Diacritiques en français

Le français utilise les diacritiques suivants (les liens renvoient vers des articles spécifiques à l'utilisation de ces diacritiques dans la langue française et non aux articles généraux) :
- l'accent aigu, sur la lettre e (é) ;
- l'accent grave, sur les lettres a (à), e (è) et u (ù). C'est à l'initiative de Corneille que cet accent a été introduit en français, afin de faire la différence entre la voyelle ouverte (è) et la voyelle fermée (é), qui étaient jusque là notées de la même manière (é ou e) ;
- l'accent circonflexe, sur les lettre a (â), e (ê), i (î), o (ô) et u (û), d'un usage relativement complexe ;
- le tréma, sur les lettres e (ë) et i (ï), o (ö) et u (ü) pour des mots empruntés à d'autres langues, pour forcer la prononciation d'une voyelle normalement muette parce qu'utilisée dans un digramme (maïs, aiguë...), ou encore sur y (ÿ) dans de très rares cas ;
- la cédille au-dessous du c (ç). Consulter aussi Diacritiques utilisés en français.

Articles connexes


- Diacritique ;
- diacritiques utilisés en français ;
- lettres supplémentaires de l'alphabet latin ;
- alphabet latin ;
- écriture ;
- typographie. Latin Catégorie:Diacritique de l'alphabet latin

Lettres supplémentaires de l'alphabet latin

L'alphabet latin, utilisé depuis des siècles pour noter la majorité des langues d'Europe occidentale (puis, après les colonisations, partout dans le monde), a souvent dû être complété : sa version historique ne possède en effet pas assez de graphèmes pour noter tous les phonèmes des langues qui l'utilisent. Pour ce faire, on lui a ajouté des lettres supplémentaires, soit par simple utilisation de digrammes et de diacritiques, soit par construction de nouveaux graphèmes. Les méthodes de transcriptions et translittérations de langues qui n'utilisent pas l'alphabet latin font également beaucoup appel à des lettres supplémentaires.

Caractères ajoutés

Cette table récapitule quelques graphèmes qui ont été ou sont encore utilisés et qui ne rentrent pas dans le cadre de l'alphabet latin standard. Sont précisées les langues qui utilisent chacun d'eux ; les langues mortes étant indiquées en italique. Les caractères spécifiques à l'alphabet phonétique international ne sont pas repris ici.

Caractères modifiés

Diacritiques

Article détaillé : Diacritiques de l'alphabet latin. Une façon simple de transcrire un phonème est d'utiliser un diacritique sur une lettre proche. Si en français les lettres diacritées ne sont pas considérées comme distinctes, il en va autrement pour d'autres langues.

Ligatures

Article détaillé : Ligature (typographie).

Voir aussi

Liens internes


- Alphabet latin
- Diacritiques de l'alphabet latin
- Digramme
- Lettres supplémentaires de l'alphabet grec
- Ligature (typographie)
- Ordre alphabétique
- Variante contextuelle
-


Yorouba

Le yoruba (nom local : yorùbá) est une langue tonale appartenant à la famille des langues nigéro-congolaises. Il est parlé par environ vingt cinq millions de personnes, au Nigeria, où il est l'une des trois langues nationales, mais aussi dans certaines régions du Bénin et du Togo. Il se subdivise en de nombreux dialectes. Il existe néanmoins aussi une langue standard. Selon les écoles linguistiques, elle est classée, soit dans les langues kwa, soit dans les langues bénoué-congolaises.

Écriture et orthographe

Alphabet

Le yoruba s'écrit au moyen d'un alphabet latin étendu par des diacritiques (point ou, mieux mais moins souvent disponible, barre verticale souscrits) ainsi qu'un digramme. Chacun des signes a le statut de graphème indépendant. L'alphabet yoruba est un sous-ensemble de l'alphabet pan-nigérian :
- capitales : A B D E Ẹ (E̩) F G GB H I J K L M N O Ọ (O̩) P R S Ṣ (S̩) T U W Y ;
- minuscules : a b d e ẹ (e̩) f g gb h i j k l m n o ọ (o̩) p r s ṣ (s̩) t u w y. Les lettres se lisent quasiment comme dans l'API. Noter cependant l'utilisation de la barre souscrite (ou du point) pour les voyelles ouvertes (s'accompagnant aussi, d'après l'analyse traditionnelle, d'un mouvement de rétraction de la racine de la langue) () = [ɛ̙], () = [ɔ̙] et pour le [ʃ], noté (). Enfin, le digramme gb note une occlusive labio-vélaire [gb͡] (qu'on prononce d'un seul mouvement et non comme s'il s'agissait d'une séquence [g] + [b]).

Signes annexes

On emploie trois diacritiques supplémentaires pour noter les tons de la langue : l'accent aigu (registre haut), l'accent grave (registre bas) et le macron (registre moyen). Ce dernier est généralement omis (une voyelle non marquée doit donc être lue comme portant un macron). De sorte, on trouve des combinaisons comme ẹ́ et ọ̀. Des combinaisons de registres donnant des tons modulés (consulter Langue tonale pour ces notions) pouvaient être notées par un háček pour la modulation montante (bas-haut) et un tilde pour d'autres. Dans les usages actuels, le háček est parfois remplacé par une écriture décomposée : ǒ = òó. Le tilde, quant à lui, est abandoné : õ = òó ou ōò (voire ), selon les cas. Enfin, les nasales pouvant être vocalisées, elles reçoivent aussi les marques tonales : ḿ et , par exemple.

Caractéristiques

Outre que le yoruba est une langue tonale à registres et combinaisons mélodiques de registres, il connaît aussi un mécanisme d'harmonie vocalique. Sa morphologie est riche, faisant, par exemple, un large emploi du redoublement.

Exemples

Voir aussi

Liens internes


- linguistique
  - dictionnaire des langues
    - langues par famille
      - langues nigéro-congolaises
      -
- groupe kwa

Liens externes

Catégorie:Langue isolante Catégorie:Langue nigéro-congolaise

Igbo

L'igbo est une langue parlée au Nigeria par environ trente cinq millions d'ibo, principalement dans le sud-est du pays indépendante quelques temps sous le nom de Biafra. L'alphabet latin est utilisé pour son écriture. Il existe de nombreux dialectes dérivés de l'igbo, pas forcément toujours mutuellement intelligibles : Idemili, Owerri, Ngwa, Umuahia, Nnewi, Onitsha, Awka, Abriba, Arochukwu, Nsukka, Mbaise, Ohafia, Wawa et Okigwe. Catégorie:Langue nigéro-congolaise

Édo (langue)

L'édo (aussi appelé benin, bini, addo, oviedo ou ovioba) est une langue de la famille des langues nigéro-congolaises. Elle est parlée par environ un million de personnes, principalement au Nigeria (régions d'Ovia, Oredo et Orhionmwon de l'État d'Edo) et sur l'archipel de Sao Tomé-et-Principe dans le golfe de Guinée. Elle est aussi la langue historique du royaume du Benin. L'édo est la principale forme d'un groupe de langues et dialectes, généralement désigné sous le vocable de langues "édoïdes". Les variantes de cette forme principale sont généralement suffisamment homogènes pour être mutuellement intelligibles. L'édo est surtout une langue de tradition orale, dont presque tous les locuteurs sont bilingues anglais ou pidgin; il existe cependant une littérature, ainsi que des dictionnaires et divers textes éducatifs ou historiques. L'alphabet utilisé est un sous-ensemble de l'alphabet latin : Á B D É È F G Í H K L M N Ó Ò P R S T Ú V W Y Z.

Voir aussi

Articles connexes


- linguistique
  - dictionnaire des langues
    - langues par famille
      - langues nigéro-congolaises Edo

Accent aigu

L'accent aigu est un diacritique de l'alphabet latin hérité de l'accent aigu grec. Il fait ses premières apparitions en français au , introduit par Geofroy Tory en 1529.

Français

En français, l'accent aigu est placé sur la lettre e (« é ») pour distinguer le phonème au timbre fermé /e/ du phonème /ə/. On le rencontre exceptionnellement sur e ouvert dans: aimé-je, je protégerai et dans certains mots comme allégement, événement(prononcés allègement, évènement). Remarque: l'arrêté du 28/12/1976 autorise l'accent grave au lieu de l'accent aigu dans les cas où la prononciation fait entendre un e ouvert: évènement, je protègerai.

Espagnol

Áá [a], Éé [e], Íí [i], Óó [o], Úú [u]. Il indique les accents toniques « irréguliers » par rapport à la structure accentuelle courante. Par exemple : explicación [eksplika'θjon] (« explication »), típico ['tipiko] (« tipique »). Il permet en outre de distinguer des homophones, notamment les pronoms interrogatif et exclamatif (accentués) du pronom relatif (non accentué). C'est dans ce cas un vrai usage diacritique. Par exemple :
- ¿Qué dice? : « Que dit-il ? ».
- Lo que dice : « Ce qu'il dit ». Parmi les autres cas se nombrent te (pronom réflexif « te ») et (« thé »), se (pronom réflexif « se ») et (« sois » ou « je sais »), et mas (« mais ») et más (« plus »). Pour plus de détails, consulter Accentuation de l'espagnol.

Vietnamien

Dans l'écriture vietnamienne Quôc ngu, l'accent aigu est appelé « sắc » et indique une intonation montante.

Alphabet phonétique international

Sur tout symbole de voyelle (ou de consonne vocalisée), il indique un tonème de registre haut.

Transcription en ASCII

L'ASCII de base (caractères 0 à 127) ne contient pas de lettre acentuée. À l'époque où c'était la seule page de code disponible, certains simulaient l'accent aigu en plaçant une apostrophe derrière la lettre : par exemple, ils écrivaient « e'te' » pour « été ». C'est d'ailleurs cette solution qui a été retenue pour le VIQR.

Articles connexes


- diacritique ;
  - diacritiques de l'alphabet latin ;
    - diacritiques utilisés en français ;
- alphabet latin. Catégorie:Diacritique de l'alphabet latin ja:アキュート・アクセント

Accent grave

L'accent grave est un diacritique que l'on retrouve dans divers alphabets.

Alphabet grec

L'accent grave grec n'apparaissait, en grec ancien, que sur la dernière syllabe d'un mot, dans les cas où l'intonation de celle-ci était grave. Le terme grave dérive d'ailleurs du latin gravis (lourd), lui même traduit du grec βαρύς, qui désignait cette intonation.

Alphabet latin

Dans l'alphabet latin, l'accent grave est directement emprunté à l'alphabet grec. Moins courant que l'accent aigu, on le trouve de manière générale sur les voyelles A, E, O et U, dans les langues suivantes :
- En catalan (accent greu ou obert), il indique la position de l'accent tonique et aussi l'aperture des voyelles /e/ et /o/ (qui peuvent être ouvertes ou fermées) :
  - à (català)
  - è (enciclopèdia)
  - ò (història)
- En écossais, il note une voyelle longue.
- En français :
  - à : pour distinguer certains homonymes (la et , ça et çà) ;
  - è : pour la prononciation du /e/ ouvert ;
  - ù : uniquement pour le mot , pronom relatif) ou adverbe interrogatif, afin de le distinguer de son homonyme ou, conjonction de coordination
- En gallois, l'accent grave est utilisé pour noter une voyelle courte dans un mot qui, dans le cas contraire, serait prononcé avec une voyelle longue, comme par exemple mẁg (« tasse ») et mwg (« fumée »).
- En italien, il indique, entre autres, la place de l'accent tonique :
  - à (libertà)
  - è (caffè)
  - ò
  - ù (virtù)
- En norvégien, l'accent grave indique que la syllabe qu'il diacrite est accentuée, afin de différencier certains mots comme og (« et ») et òg (« aussi »).
- En portugais :
  - à (à, àquele) : il indique la crase entre la préposition a soit avec l'article défini a, soit avec le pronom relatif aquele et ses formes fléchies.
- Dans quelques langues à tons, comme le vietnamien, l'accent grave indique un ton descendant.

Représentation informatique

Le jeu de caractères ASCII de base (caractères 0 à 127) ne contient pas de lettre accentuée. À l'époque où il s'agissait de la seule page de code disponible, il était possible d'émuler l'accent grave en plaçant une apostrophe inversée devant la lettre : par exemple, en écrivant « fi`ere » pour « fière ». En VIQR, l'apostrophe inversée était placée après, par exemple « e` » pour « è ». La norme ISO 8859-1 inclut les caracètres à, è, ì, ò, ù et leur formes capitales respectives. Plusieurs dizaines d'autres lettres portant un accent grave sont disponible avec Unicode. Cette norme inclut également un caractère accent grave pouvant se combiner avec d'autres caractères. Sur certains claviers, l'accent grave possède une touche réservée destinée à être combinée avec une voyelle.

Voir aussi


- Diacritique
- Diacritiques de l'alphabet grec
- Diacritiques de l'alphabet latin
- Diacritiques utilisés en français Catégorie:Diacritique de l'alphabet latin ja:グレイヴ・アクセント nb:Grav aksent

Macron

ja:マクロン Catégorie:Diacritique de l'alphabet latin Catégorie:Linguistique Le macron est un diacritique de l'alphabet latin et de l'alphabet grec. Il prend la forme d'une barre horizontale que l'on place le plus souvent au-dessus d'une voyelle. Son principal rôle est d'indiquer que le signe qui le porte reçoit une quantité vocalique longue ; il s'oppose en cela à la brève. Le letton, par exemple, utilise le macron au-dessus des voyelles a, e, i et u pour former ā, ē, ī et ū tandis que le lituanien ne l'utilise qu'au-dessus du u. Le couple macron ~ brève est d'un usage très fréquent en phonologie : c'est en effet un artifice philologique très ancien puisqu'on le fait remonter à l'époque byzantine, celle pendant laquelle les diacritiques de l'alphabet grec ont été rationnalisés. Exemple de macron : Tōkyō

Homonymie


- Macron est également le nom d'une marque d'un équipementier sportif italien : http://macron.com/m/

Articles connexes


- Diacritiques de l'alphabet latin et diacritiques de l'alphabet grec ;
- alphabet latin ;
- diacritique.

Digramme

En linguistique, un digramme est un assemblage de deux graphèmes (deux lettres dans les alphabets) représentant un phonème unique et devenant un nouveau graphème (un trigramme pour trois graphèmes, etc.). Par exemple dans le mot chou, le digramme ou correspond à une seule voyelle phonologique, /u/ et ch représente le phonème /ʃ/. On peut donc dire que ce mot contient quatre lettres et deux graphèmes. Pour qu'une suite de deux lettres soit considérée comme un digramme, il faut qu'elle soit bien attestée dans le système d'écriture, voire être productive. On peut, en français, noter n'importe quel nouveau mot utilisant le phonème /ʃ/ par ch, ce qui confirme son statut de graphème, donc de digramme. L'utilisation de digrammes ou de trigrammes dans un alphabet indique souvent qu'il est lacunaire en tant que tel car il lui manque un caractère propre permettant de noter un des phonèmes de la langue écrite par son biais. Note : les transcriptions sont en alphabet phonétique international.

Fausses diphtongues et anciennes diphtongues

Les digrammes peuvent être composés de voyelles ou de consonnes. Des digrammes de voyelles sont aussi appelés « fausses diphtongues » quand les deux voyelles ne notent qu'une voyelle simple. C'est le cas en français (ou = [u], ai = [ɛ], eu = [œ] ou [ø], etc.). Le grec ancien en connaît aussi : ου peut valoir [oː] et ει [eː]. De même en grec moderne pour αι = [e] ou encore ει, οι, υι = [i]. Dans les faits, il convient de distinguer les fausses diphtongues réelles des cas de monophtongaison : en grec ancien, les phonèmes /oː/ et /eː/ du dialecte ionien-attique ne pouvaient pas, en raison de l'absence de signes qui leur fussent propres après la réforme de 403 avant l'ère chrétienne, être notés autrement. Ce sont bien là des fausses diphtongues. En grec moderne et en français, les notations actuelles s'expliquent par le jeu d'une ancienne monophtongaison. Les deux processus ne sont pas identiques : c'est un moyen de pallier les lacunes d'une écriture dans le premier cas, un archaïsme dû à l'évolution secondaire de diphtongues anciennement prononcées comme tel dans le second.

Ligature et digramme

À la différence de la ligature, l'identité graphique des graphèmes fondamentaux combinés n'est pas altérée.

Le digramme dans l'ordre alphabétique

On ne confondra pas le graphème et la lettre : tout digramme est un graphème mais tout digramme n'est pas considéré comme une lettre. En effet, dans certaines langues le digramme reste considéré comme deux lettres séparées (il n'est pas comptabilisé dans l'ordre alphabétique). Au contraire, dans d'autres, les digrammes fonctionnent comme des lettres nouvelles qui ont leur propre place dans le classement alphabétique. Par exemple, le digramme ch en français n'est pas une lettre : il n'est pas compté dans l'alphabet et le mot cheval doit être classé, dans un dictionnaire, par exemple, entre des mots en ce et en ci. En vietnamien, cependant, ch est un digramme et une lettre. Ainsi, chiếc doit être cherché à la rubrique des mots en ch, placée après tous les mots commençant par c. On peut illustrer cela par des mots à classer :
- cela, chien, cil pour le français ;
- cải, cựu, che, pour le vietnamien.

Exemples de digrammes en français


- ch – [k]/[ʃ]
- ou – [u]
- ai – [ɜ]
- eu – [œ]

Articles connexes


- Typographie, écriture ;
- lettre conjointe ;
- ligature ;
- lettres supplémentaires de l'alphabet latin, lettres supplémentaires de l'alphabet grec ;
- diacritique. Catégorie:Linguistique als:Digraph ja:二重音字

Point souscrit

Catégorie:Diacritique de l'alphabet latin Le point souscrit est un diacritique de l'alphabet latin utilisée dans différentes notations, notamment pour les transcriptions de l'arabe et des langues de l'Inde : le hindi, la devanagari, le tamoul principalement.

Transcription de l'arabe

En arabe, le point souscrit note une consonne emphatique par exemple :
- ﺪ da (non emphatique)
- ﺾ ḍad (emphatique). On utilise donc les consonnes diacritées suivantes : Ḍḍ, Ḥḥ, Ṣṣ, Ṭṭ

Transcription des langues de l'Inde

Pour ces langues, le point souscrit note les consonnes rétroflexes. On utilise les consonnes diacritées suivantes : Ḍḍ, Ṇṇ, Ṣṣ, Ṭṭ

Dictionnaires de l'Allemand

En dictionnaires de l'Allemand, le point souscrit note les consonnes accentuées et tendues.

Unicode


- Point souscrit (̣) : U+323

Voir aussi

Articles connexes


- Point suscrit
- Diacritiques

Unicode

Unicode est un standard informatique développé par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d'écriture de langue un identifiant numérique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

But

Unicode, dont la première publication remonte à 1991, a été développé dans le but de remplacer l'utilisation de pages de code nationales. Ces pages de code présentaient en effet quelques problèmes. Par exemple lorsqu'était prévu un caractère « signe monétaire », le même texte autorisant aux USA une dépense en dollars pouvait une fois transmis par courrier électronique au Royaume-Uni autoriser la même dépense en livres sterling, sans que quoi que ce soit ait été modifié au texte ! Dans la pratique, tous les systèmes d'écriture ne sont pas encore présents, car un travail de recherche documentaire auprès de spécialistes peut encore s'avérer nécessaire pour des caractères rares ou des systèmes peu connus (parce que disparus, par exemple). Cependant, tous les systèmes les plus utilisés dans le monde sont représentés, ainsi que des règles sur la sémantique des caractères, leurs compositions et la manière de combiner ces différents systèmes (par exemple, comment insérer un système d'écriture de droite à gauche dans un système d'écriture de gauche à droite ?).

Normes et versions

Le travail sur Unicode est parallèle et synchronisé avec celui sur la norme ISO/CEI 10646 dont les buts sont les mêmes. L'ISO/CEI 10646, une norme internationale publiée en français et en anglais, ne précise cependant ni les règles de composition de caractère, ni les propriétés sémantiques des caractères. Unicode aborde cependant la problématique de la casse, du classement alphabétique, et de la combinaison d'accents et de caractères. Les caractères de la version 3.0 d'Unicode ont les mêmes identifiants que ceux de la norme ISO/CEI 10646:2000. La version 3.2 d'Unicode classe 95 221 caractères, symboles et directives. La version actuelle est la version 4.1 de 2005. Des problèmes semblent cependant exister, pour le codage des caractères chinois .

La limite de l'octet

Là où l'ASCII utilisait jadis 7 bits et ISO 8859-1 8 bits (comme la plupart des pages de codes nationales), Unicode, qui rassemble les caractères de chaque page de code, avait besoin d'utiliser plus que les 8 bits d'un octet. La limite fut dans un premier temps fixée à 16 bits puis est désormais placée entre 20 et 21 bits par caractère.

UTF, Unicode Transformation Format

Dans un but de compression simple et raisonnable, Unicode accepte plusieurs formes de présentation pour représenter un caractère (au sens de symbole). Citons :
- UTF-8 ;
- UTF-16 ;
- UTF-32. Le chiffre après UTF représente le nombre minimal de bits avec lequel un caractère est codé.

UTF-8

L'UTF-8, spécifié dans le RFC 2279, est le plus commun pour les applications Internet. Son codage de taille variable lui permet d'être en moyenne moins coûteux en occupation mémoire. Mais cela ralentit nettement les opérations où interviennent des extractions de sous-chaînes, car il faut compter les caractères depuis le début de la chaîne pour savoir où se trouve le premier caractère à extraire. L'UTF-8 assure aussi une compatibilité avec les manipulations simples de chaînes en ASCII dans les langages de programmation.

UTF-16

L'UTF-16 est un bon compromis lorsque la place mémoire n'est pas trop restreinte, car la très grande majorité des caractères Unicode assignés pour l'instant, qui sont les caractères les plus fréquemment utilisés, peut être représentée sur 16 bits. Il a l'avantage que tous les caractères prennent, au minimum, la même place (2 octets). C'est notamment l'encodage qu'utilise la plateforme Java en interne.

UTF-32

L'UTF-32 est utilisé lorsque la place mémoire n'est pas un problème et que l'on a besoin d'avoir accès à des caractères de manière directe et sans changement de taille (hiéroglyphes).

Les polices de caractères Unicode

Avant de parler de police Unicode, il faut bien comprendre un principe essentiel : dire qu'Unicode code des caractères revient à dire qu'il attribue un numéro à des symboles. Unicode ne code en revanche pas les descriptions des caractères, les glyphes, c'est-à-dire la représentation graphique du caractère. Il n'y a donc pas une bijection entre la représentation du caractère et son numéro comme c'est le cas dans une police ASCII ou latin-1 classique. Ainsi, le caractère français é peut-il être décrit de deux manières : soit en utilisant directement le numéro correspondant au é, soit en faisant suivre le numéro du 'e' par celui de l'accent aigu sans chasse. Quelle que soit l'option choisie le même glyphe sera affiché. On dira du premier caractère qu'il est précomposé, du second que c'est une composition (deux caractères forment un seul glyphe composé des deux). De nombreux glyphes sont dans ce cas et peuvent être codés de ces deux manières. Le plus souvent, le glyphe précomposé est préférable (c'est le cas pour le grec polytonique, par exemple, lequel, codé en décomposition, peut ne pas être satisfaisant graphiquement : selon les polices de caractères, les différents constituants du glyphe étant parfois mal disposés et peu lisibles). De même, certains systèmes d'écriture, comme la devânagarî ou les caractères arabes, nécessitent un traitement complexe des ligatures : les graphèmes changent en effet de forme en fonction de leur position et/ou par rapport à leurs voisines (cf. Variante contextuelle et Lettre conjointe). On comprend donc que le terme de police Unicode doit être utilisé très prudemment. Avoir une police qui représente un certain nombre ou toutes les représentations graphiques que l'on peut obtenir avec Unicode n'est pas suffisant, il faut en plus que le système d'affichage possède les mécanismes de représentation idoines (ce que l'on nomme le moteur de rendu) capable de gérer les ligatures, variantes contextuelles et formes conjointes de certaines écritures. Au contraire, une police qui ne représente que certains caractères mais qui sait comment les afficher mérite mieux le terme de police Unicode. Le moteur de rendu doit comporter dans certains cas des informations sur les coupures de lettres. Ainsi la lettre allemande s/z, lorsqu'elle se trouve sur une coupure, se traduit en deux s : un avant et un après la coupure.

Détails techniques

Bibliothèques logicielles

La bibliothèque multiplateforme ICU permet de manipuler des données unicodées. Un support d'Unicode spécifique à certaines plateformes (non compatible quant au code-source) est également fourni par les systèmes modernes (Java, MFC, GNU/Linux).

Partitionnement

Le partitionnement à jour peut être trouvé sur le site officiel d'Unicode. Cependant, vu le rôle important d'Unicode, (ISO 10646) on décrira ici les principaux blocs de caractères. Les noms français sont les noms officiels de l'ISO/CEI 10646, la norme internationale bilingue qui reprend les mêmes caractères qu'Unicode. Ils sont aussi officiels que les noms anglais. # Note: La casse des noms de bloc n'est pas normative. # « Latin de base » est donc équivalent à « LATIN DE BASE » # # # Code de début ..Code de fin; nom du Bloc 0000..007F; Latin de base 0080..00FF; Supplément Latin-1 0100..017F; Latin étendu A 0180..024F; Latin étendu B 0250..02AF; Alphabet phonétique international (API) 02B0..02FF; Lettres modificatives avec chasse 0300..036F; Diacritiques 0370..03FF; Grec et copte 0400..04FF; Cyrillique 0500..052F; Supplément cyrillique 0530..058F; Arménien 0590..05FF; Hébreu 0600..06FF; Arabe 0700..074F; Syriaque 0780..07BF; Thâna 0900..097F; Dévanâgarî 0980..09FF; Bengali 0A00..0A7F; Gourmoukhî 0A80..0AFF; Goudjerate 0B00..0B7F; Oriya 0B80..0BFF; Tamoul 0C00..0C7F; Télougou 0C80..0CFF; Kannara 0D00..0D7F; Malayalam 0D80..0DFF; Singhalais 0E00..0E7F; Thaï 0E80..0EFF; Lao 0F00..0FFF; Tibétain 1000..109F; Birman 10A0..10FF; Géorgien 1100..11FF; Jamos hangûl 1200..137F; Éthiopien 13A0..13FF; Chérokî 1400..167F; Syllabaires autochtones canadiens 1680..169F; Ogam 16A0..16FF; Runes 1700..171F; Tagalog ou tagal 1720..173F; Hanounóo 1740..175F; Bouhid 1760..177F; Tagbanoua 1780..17FF; Khmer 1800..18AF; Mongol 1900..194F; Limbu 1950..197F; Taï-le 19E0..19FF; Symboles khmers 1D00..1D7F; Supplément phonétique 1E00..1EFF; Latin étendu additionnel 1F00..1FFF; Grec étendu 2000..206F; Ponctuation générale 2070..209F; Exposants et indices 20A0..20CF; Symboles monétaires 20D0..20FF; Signes combinatoires pour symboles 2100..214F; Symboles de type lettre 2150..218F; Formes numérales 2190..21FF; Flèches 2200..22FF; Opérateurs mathématiques 2300..23FF; Signes techniques divers. 2336 à 237A = symboles APL 2400..243F; Pictogrammes de commande 2440..245F; Reconnaissance optique de caractères 2460..24FF; Alphanumériques cerclés 2500..257F; Filets 2580..259F; Pavés 25A0..25FF; Formes géométriques 2600..26FF; Symboles divers 2700..27BF; Casseau 27C0..27EF; Divers symboles mathématiques - A 27F0..27FF; Supplément A de flèches 2800..28FF; Combinaisons Braille 2900..297F; Supplément B de flèches 2980..29FF; Divers symboles mathématiques-B 2A00..2AFF; Opérateurs mathématiques supplémentaires 2B00..2BFF; Divers symboles et flèches 2E80..2EFF; Formes supplémentaires des clés CJC 2F00..2FDF; Clés chinoises (K'ang-hsi ou Kangxi) 2FF0..2FFF; Description idéophonographique 3000..303F; Symboles et ponctuation CJC 3040..309F; Hiragana 30A0..30FF; Katakana 3100..312F; Bopomofo 3130..318F; Jamos de compatibilité hangûl 3190..319F; Kanboun 31A0..31BF; Bopomofo étendu 31F0..31FF; Extension phonétique katakana 3200..32FF; Lettres et mois CJC cerclés 3300..33FF; Compatibilité CJC 3400..4DB5; Supplément A aux idéophonogrammes unifiés CJC 4DC0..4DFF; Hexagrammes du Classique des mutations ou Yi-king 4E00..9FA5; Idéophonogrammes unifiés CJC A000..A48F; Syllabaire yi des Monts frais A490..A4CF; Clés yi AC00..D7A3; Hangûl D800..DB7F; Demi-zone haute ☒DB80..DBFF; Partie à usage privé de la demi-zone haute DC00..DFFF; Demi-zone basse ☒E000..F8FF; Zone à usage privé F900..FAFF; Idéogrammes de compatibilité CJC FB00..FB4F; Formes de présentation alphabétiques FB50..FDFF; Formes A de présentation arabes FE00..FE0F; Sélecteurs de variante FE20..FE2F; Demi-signes combinatoires FE30..FE4F; Formes de compatibilité CJC FE50..FE6F; Petites variantes de forme FE70..FEFF; Formes B de présentation arabes FF00..FFEF; Formes de demi et pleine chasse FFF0..FFFF; Caractères spéciaux 10000..1007F; Syllabaire linéaire B ou syllabaire mycénien 10080..100FF; Idéogrammes du linéaire B 10100..1013F; Nombres égéens 10300..1032F; Alphabet italique 10330..1034F; Gotique 10380..1039F; Ougaritique 10400..1044F; Déséret 10450..1047F; Shavien 10480..104AF; Osmanya 10800..1083F; Syllabaire chypriote 1D000..1D0FF; Symboles musicaux byzantins 1D100..1D1FF; Symboles musicaux occidentaux 1D300..1D35F; Symboles du Classique du mystère suprême 1D400..1D7FF; Symboles mathématiques alphanumériques # 20000..2A6D6; Supplément B aux idéogrammes unifiés CJC 2F800..2FA1F; Supplément aux idéogrammes de compatibilité CJC # E0000..E007F; Étiquettes E0100..E01EF; Supplément de sélecteur de variante # ☒FFF80..FFFFF; Zone supplémentaire A à usage privé ☒10FF80..10FFFF; Zone supplémentaire B à usage privé Les zones à usage privé indiquées par le symbole ☒ ne contiennent pas les mêmes œils d'une police à l'autre et doivent donc être évités.

Voir aussi


- Caractère asiatiques
- Aide:Caractères spéciaux
- Caractères APL/APL2 en Unicode
- ASCII
- EBCDIC
- ISO/CEI 10646
- Aide:Unicode
- Wikipédia:Unicode/Test
- Table des caractères unicode (complète, très lourde : 671 Ko)
- Table des caractères unicode divisée :
  - de 0 à 4095 - de 4096 à 8191 - de 8192 à 12287 - de 12288 à 16383
  - de 16384 à 20479 - de 20480 à 24575 - de 24576 à 28671 - de 28672 à 32767
  - de 32768 à 36863 - de 36864 à 40959 - de 40960 à 45055 - de 45056 à 49151
  - de 49152 à 53247 - de 53248 à 57343 - de 57344 à 61439 - de 61440 à 65535

Liens externes


- [http://www.unicode.org Page d'accueil du consortium Unicode] (anglais);
- [http://hapax.qc.ca traduction française officielle de l'ISO/CEI 10646 et Unicode] (français);
- [http://www.decodeunicode.org/ DecodeUnicode - Unicode WIKI], chaque charactère du BMP d'Unicode avec 50.000 gifs dans trois tailles (anglais, allemand)
- Chapitres 2, 3, et 4 du livre [http://www.oreilly.fr/catalogue/284177273X.html Fontes et codages] ;
- [http://www.cs.uu.nl/~otfried/Mule/unihan.html essai] sur le problème han (en anglais) ;
- [http://www.tron.org page d'accueil de TRON] ;
- [http://www.alanwood.net/unicode/ site recensant les différents blocs d'Unicode avec pages de tests, conseils et liens vers les polices permettant d'afficher les blocs en question] ;
- [http://unicode.coeurlumiere.com/ table des caractères Unicode de 1 à 65535] ;
- [http://www.unicode.org/reports/tr10/ la question du tri] ;
- [http://hapax.qc.ca/BabelMap_fr.html graticiel BabelMap (éditeur de police Unicode UTF8, UTF16, UTF32)] ;
- [http://www.cl.cam.ac.uk/~mgk25/unicode.html UTF-8 and Unicode FAQ] de Markus Kuhn, article très complet (en anglais).
- [http://masculinehygiene.com/sburke/unicode_sliderule/ The Unicode Sliderule] : un outil web de saisie de caractères.

Autres références


- http://www.freenix.fr/unix/linux/HOWTO/Unicode-HOWTO-1.html
- http://sivanataraja.free.fr/config/test.htm : exemple d'utilisation d'Unicode.
- RFC3718, RFC3492, RFC2482, RFC2044, RFC1642, RFC1641 Catégorie:Unicode Catégorie:Norme ja:Unicode ko:유니코드 th:ยูนิโคด zh-min-nan:Thong-iōng-bé

Alphabet phonétique international

L'alphabet phonétique international (API) est un alphabet utilisé pour la transcription phonétique des sons du langage parlé. Contrairement aux nombreuses autres méthodes de transcription qui se limitent à des familles de langues, l'API est prévu pour couvrir l'ensemble des langues du monde. Développé par des phonéticiens britanniques et français sous les auspices de l'Association phonétique internationale, il a été publié en 1888. Sa dernière révision date de 1993. La transcription phonétique en API consiste à découper la parole en segments sonores supposés atomiques, et à employer un symbole unique pour chacun de ceux-ci, en évitant les combinaisons de lettres : par exemple, le son ch du français est noté [], le gli italien se transcrit []. Le nombre de caractères principaux de l'API est de 118 ce qui permet de couvrir les sons les plus fréquents. Ces caractères sont pour la plupart des lettres grecques ou latines ou des modifications de celles-ci : , , , tirés de r ; , tirés de e. Les sons moins fréquents sont transcrits à partir des précédents en indiquant une modification du mode ou du point d'articulation par le biais d'un ou plusieurs signes diacritiques (au nombre de 76) sur le caractère principal : par exemple, le b du castillan caber (« tenir, rentrer dans ») est transcrit [] pour indiquer une spirante au lieu de la fricative bilabiale sonore [β]. Il existe également des symboles spéciaux pour noter des phénomènes suprasegmentaux, comme les tons mélodiques ou l'accent tonique : [], transcription de l'allemand dulden (« supporter, tolérer ») indique un accent tonique d'intensité sur la première syllabe (') et un n final vocalisé ( ). On notera que l'usage linguistique est d'indiquer la transcription phonétique d'un mot entre crochets ; l'utilisation de barres obliques indique une transcription phonologique, c'est-à-dire qui oppose les traits pertinents des différents sons d'une langue donnée sans entrer dans le détail de leur prononciation. L'utilisation de l'API est maintenant établie dans l'enseignement, l'apprentissage et l'étude des langues. Notamment, la plupart des dictionnaires bilingues utilisent cet alphabet ou une transcription phonologique qui en est inspirée. L'API est également un outil essentiel pour rendre à l'écrit les langues jusqu'à présent non écrites : de nombreuses langues d'Afrique se sont dotées d'une orthographe utilisant comme signes complémentaires des caractères de l'API ; un exemple typique est l'alphabet pan-nigérian.

Histoire

L'API a été développé au départ par des professeurs de langue britanniques et français sous la direction de Paul Passy dans le cadre de l'Association phonétique internationale, fondée à Paris en 1886 sous le nom de Dhi Fonètik Tîcerz' Asóciécon. La première version de l'API, publiée en 1888, était inspirée de l'alphabet romique d'Henry Sweet, lui-même élaboré à partir de l'alphabet phonotypique d'Isaac Pitman et Alexander John Ellis. L'API a connu quatre révisions en 1900, 1932, 1989 et 1993.

Description de l'alphabet

Image : Fiche récapitulative de l'API. (en anglais)

Voyelles

Segments

L'API possède des caractères principaux pour les voyelles orales les plus courantes qui sont classées selon
- leur degré d'aperture : voyelles hautes (fermées), hautes inférieures, moyennes supérieures (mi-fermées), moyennes, moyennes inférieures (mi-ouvertes), basses supérieures, basses (ouvertes) ;
- leur point d'articulation : antérieur, quasi-antérieur, central, quasi-postérieur, postérieur ;
- leur caractère arrondi ou non.
Les autres sont transcrites à partir des voyelles prédéfinies par adjonction d'un ou plusieurs diacritiques modifiant l'articulation
Par exemple,
- les nasales du français standard sont (on), (hein), (un), (en) ;
- le /o/ bref du hongrois (par ex. kor, heure) est moins antérieur et légèrement plus ouvert que le /o:/ long (par ex. kór, maladie), une transcription soigneuse le donne comme [].

Quantité

La quantité des voyelles est indiquée comme suit :
Par exemple, Pose cette rose ! est souvent réalisé en français familier parisien [].

Tonèmes

La transcription des tonèmes suit le procédé ci-dessous.
- Pour certains tons dont le profil de hauteur est simple on utilise soit un diacritique soit un pictogramme représentant la hauteur du ton ou un accent (par exemple : ton de hauteur constante haut, mi-haut, médian, mi-bas, bas)
- Pour les tons dont le profil de hauteur est plus complexe seul un pictogramme représentant le profil du ton est prévu. Par exemple, il est possible de rendre le mandarin 我叫张 (« Je m'appelle Zhang ») par []1.
Notes : # Il n'existe pas encore de standard informatique permettant d'afficher correctement les pictogrammes pour les tons de hauteur variable ainsi que certains diacritiques correspondants ; ci-dessus sont affichés à la suite les pictogrammes correspondant aux différentes hauteurs prises par le ton. Le tracé correct des diacritiques et des pictogrammes est donné sur la fiche récapitulative de l'API. # La notation numérique des tons en exposant, par exemple 我姓张 [w214 515] est souvent utilisée pour pallier la piètre gestion des tons de l'API par les ordinateurs actuels. Cette notation n'est pas standard et son format dépend des familles de langues étudiées.

Consonnes

Segments

L'API classe les consonnes selon trois critères :
- le mode d'articulation ;
- le point d'articulation ;
- le caractère sourd ou voisé.
Comme pour les voyelles, des diacritiques permettent d'indiquer une modification du point ou du mode d'articulation afin transcrire des consonnes qui n'ont pas de symbole principal.
Par exemple,
- le t dental français est transcrit [] à partir de la plosive alvéolaire [t] ;
- le m dévoisé du français isthme est transcrit [] à partir de l'occlusive nasale voisée [m] ;
- la spirante bilabiale du castillan du mot caber (tenir dedans), allophone de /v/, est notée [] à partir de la fricative bilabiale [β].

Quantité

La quantité des consonnes est indiquée de la même manière que pour les voyelles. Le hongrois mit mondott? (qu'as-tu dit ?) sera transcrit [], phonologiquement /mit mondotː/.

Vocalisation

Une consonne vocalisée, c'est-à-dire servant de sommet à une syllabe, comporte un trait vertical souscrit :
- allemand reden (parler) : [] ;
- tchèque Brno (Brno) : [] ;
- anglais whistle (siffler) : [].

Syllabes

Les syllabes accentuées sont précédées d'une barre verticale :
- en exposant pour l'accent primaire : ;
- au niveau de la ligne de base pour les accents secondaires : . Un point (.) sépare les syllabes. Par exemple, l'allemand Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz (loi sur le transfert de responsabilité de la surveillance de l'étiquettage de la viande bovine) se transcrit :
[].

Unicode

Le jeu de caractères Unicode permet d'écire l'ensemble de l'API, à l'exception des indications tonales complexes. Les symboles et diacritiques se situent dans les blocs de caractères suivants :
- U+0000 à U+007F : latin de base ;
- U+0080 à U+00FF : supplément latin-1 ;
- U+0250 à U+02AF : alphabet phonétique international ;
- U+02B0 à U+02FF : lettres modificatives avec chasse ;
- U+0300 à U+036F : diacritiques ;
- U+0370 à U+03FF : grec et copte ;
- U+A700 à U+A71F : lettres tonales modificatives. Certains caractères précomposés (avec diacritiques) sont accessibles dans les blocs suivants :
- U+0080 à U+00FF : supplément latin-1 ;
- U+0100 à U+017F : latin étendu A ;
- U+0180 à U+024F : latin étendu B ;
- U+1E00 à U+1EFF : supplément latin étendu.

Voir aussi

Bibliographie


- API
  - Handbook of the International Phonetics Association: A Guide to the Use of the International Phonetic Alphabet ISBN 0-521-63751-1
  - Élements de linguistique générale, André Martinet, ISBN 2-200-26573-5
- exemples linguistiques
  - allemand : Duden, die Grammatik, ISBN 3-411-04046-7
  - anglais : [http://dictionary.cambridge.org/ Cambridge Dictionary of American English], ISBN 0-521-77974-X
  - mandarin : [http://www.mandarintools.com/cedict.html CEDICT]

Liens internes


- linguistique
  - phonologie
  - phonétique
    - segment
    - accent tonique
    - ton
  - transcription
    - liste des méthodes de transcription
    - SAMPA, une transcription de l'API en caractères ASCII
    - Kirshenbaum, une transcription de l'API en caractères ASCII
  - alphabet
    - caractère
    - diacritique
- confusions possibles
  - alphabet radio

Liens externes


- [http://www2.arts.gla.ac.uk/IPA/ipa.html Site officiel de l’Association phonétique internationale] (en anglais).
- API en HTML
  - tableau officiel
    - [http://www.linguiste.org/phonetics/ipa/chart/ API sur www.linguiste.org] (en anglais)
    - [http://sivanataraja.free.fr/api/ API et quelques symboles additionnels sur sivanataraja.free.fr]
  - liste des symboles officiels
    - [http://www.alanwood.net/unicode/phonetic_extensions.html caractères de l'API sur www.alanwood.net]
    - [http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm caractères de l'API sur www.phon.ucl.ac.uk]
- machine à écrire phonétique interactive
  - [http://www.linguiste.org/phonetics/ipa/chart/keyboard/ clavier phonétique sur www.linguiste.org]
  - [http://www.ling.su.se/fon/IPA-tecken.htm clavier phonétique sur www.ling.su.se]
- versions étendues de l’API
  - [http://venus.unive.it/canipa/ IPA, système de Luciano Canepari] (documents PDF en anglais)
- API en Unicode sur le [http://www.unicode.org site du consortium Unicode] (documents PDF en anglais) :
  - [http://www.unicode.org/charts/PDF/U0000.pdf latin de base]
  - [http://www.unicode.org/charts/PDF/U0250.pdf alphabet phonétique international]
  - [http://www.unicode.org/charts/PDF/U02B0.pdf lettres modificatives avec chasse]
  - [http://www.unicode.org/charts/PDF/U0300.pdf diacritiques]
  - [http://www.unicode.org/charts/PDF/U0370.pdf grec et copte]
  - [http://www.unicode.org/charts/PDF/UA700.pdf lettres tonales modificatives]
  - [http://www.unicode.org/charts/PDF/U0080.pdf supplément latin-1]
  - [http://www.unicode.org/charts/PDF/U0100.pdf latin étendu A]
  - [http://www.unicode.org/charts/PDF/U0180.pdf latin étendu B]
  - [http://www.unicode.org/charts/PDF/U1E00.pdf supplément latin étendu] Catégorie:Linguistique Catégorie: Méthode de transcription Catégorie:Phonétique API als:IPA ja:国際音声記号 ko:국제 음성 기호 th:สัทอักษรสากล zh-min-nan:Kok-chè Im-phiau

Alphabet latin

L'alphabet latin est l'alphabet qu'on utilise majoritairement pour écrire les langues d'Europe occidentale ainsi que dans les pays qui ont été colonisés par les Européens. C'est, en concurrence avec l'alphabet cyrillique et, dans une bien moindre part, l'alphabet grec, l'écriture occidentale par défaut et maintenant – en raison de l'importance économique et culturelle de pays l'utilisant (comme les États-Unis) une écriture internationale : on peut trouver des mots écrits en lettres latines dans les rues du Japon comme dans celles de l'Égypte. On nomme cet alphabet ainsi car c'était, à l'origine, celui des Romains et de leur langue, le latin.

Lettres

L'alphabet latin, comme la majorité de ceux issus de l'alphabet grec, est bicaméral : on utilise deux graphies pour chaque graphème (ou lettre), l'une dite minuscule, l'autre capitale. Dans la majorité des cas, chaque lettre possède les deux variantes. Il existe cependant quelques exceptions, comme la lettre ß (eszett ; utilisée en allemand et autrefois dans d'autres langues, dont le français), qui, en capitales, est remplacée par SS. L'expansion – tant géographique que temporelle – de cet alphabet en fait l'un des plus riches en variantes nationales. Ainsi :
- chaque langue donnée utilise un jeu plus ou moins complet de lettres fondamentales ;
- chacune peut en posséder des lettres modifiées qui s'y ajoutent ;
- parmi les lettres modifiées, certaines sont considées, selon les langues, comme des lettres à part entière ou comme des variantes d'une autre lettre. Par exemple, les alphabets utilisés pour le français et pour le castillan ne sont pas identiques (ainsi, la lettre ç ne s'emploie pas en castillan et le français, à l'inverse ne se sert pas de á), bien que tous deux puissent être ramenés à l'alphabet latin. En sorte, il ne serait pas faux de parler d'un alphabet français et d'un alphabet castillan. On le voit, il n'existe rien tel qu'un alphabet latin figé et constant ; il est cependant possible d'isoler les graphèmes fondamentaux utilisés dans une majorité de langues : ce sont ceux de l'alphabet des origines (voir plus bas, section « Histoire ») plus j et u ainsi que g et w, soient :

Graphèmes fondamentaux

cellpadding="8" |+ Capitales |- style="font-size:20px;" | A || B || C || D || E || F || G || H || I || J || K || L || M |- style="font-size:20px;" | N || O || P || Q || R || S || T || U || V || W || X || Y || Z |{{XIXe siècle{entête tableau simple style|text-align: center;

Lettres supplémentaires de l'alphabet latin

L'alphabet latin, utilisé depuis des siècles pour noter la majorité des langues d'Europe occidentale (puis, après les colonisations, partout dans le monde), a souvent dû être complété : sa version historique ne possède en effet pas assez de graphèmes pour noter tous les phonèmes des langues qui l'utilisent. Pour ce faire, on lui a ajouté des lettres supplémentaires, soit par simple utilisation de digrammes et de diacritiques, soit par construction de nouveaux graphèmes. Les méthodes de transcriptions et translittérations de langues qui n'utilisent pas l'alphabet latin font également beaucoup appel à des lettres supplémentaires.

Caractères ajoutés

Cette table récapitule quelques graphèmes qui ont été ou sont encore utilisés et qui ne rentrent pas dans le cadre de l'alphabet latin standard. Sont précisées les langues qui utilisent chacun d'eux ; les langues mortes étant indiquées en italique. Les caractères spécifiques à l'alphabet phonétique international ne sont pas repris ici.

Caractères modifiés

Diacritiques

Article détaillé : Diacritiques de l'alphabet latin. Une façon simple de transcrire un phonème est d'utiliser un diacritique sur une lettre proche. Si en français les lettres diacritées ne sont pas considérées comme distinctes, il en va autrement pour d'autres langues.

Ligatures

Article détaillé : Ligature (typographie).

Voir aussi

Liens internes


- Alphabet latin
- Diacritiques de l'alphabet latin
- Digramme
- Lettres supplémentaires de l'alphabet grec
- Ligature (typographie)
- Ordre alphabétique
- Variante contextuelle
-


Catégorie:Méthode de transcription

Cette liste recense, classées par mot-clef, les différentes méthodes de transcription et translittération utilisées en linguistique (surtout en phonétique et phonologie). À ajouter : transcription des langues slaves, transcription des langues indiennes, transcription de l'indo-européen, transcription des langues caucasiennes, transcription des langues amérindiennes, transcription des langues chinoises, romaja. Catégorie:LinguistiqueCatégorie:Phonétique

Catégorie:Alphabet

Article principal


- Alphabet

A créer


- alphabet nubien
- alphabet nabatéen
- alphabet sogdien catégorie:écriture

Liste der Horror-Autoren

Liste von einigen bekannten Autoren des Horror Genre:

B


- Clive Barker
- Algernon Blackwood
- Robert Bloch
- Poppy Z. Brite

C


- Ramsey Campbell
- Jonathon Carroll
- Nancy A. Collins
- Caroline B. Cooney

D


- August Derleth

F


- Sheridan le Fanu

H


- Laurell K. Hamilton
- Nathaniel Hawthorne
- James Herbert
- Brian Hodge
- William Hope Hodgson
- E.T.A. Hoffmann

J


- M.R. James

K


- Stephen King
- Dean R. Koontz

L


- H.P. Lovecraft
- Brian Lumley

M


- Arthur Machen
- Walter de la Mare
- Charles Robert Maturin
- Robert R. McCammon

N


- Jonathan Nasaw
- Kim Newman

O


- Joyce Carol Oates

P


- Edgar Allan Poe

R


- Anne Rice

S


- John Saul
- Mary Wollstonecraft Shelley
- Clark Ashton Smith
- Bram Stoker
- Peter Straub

T


- Cate Tiernan

V


- Ernst Vlcek Siehe auch:
- Liste der Listen mit Schriftstellern
- Science-Fiction-Autoren
- Fantasy-Autoren

Weblinks


- http://directory.google.com/Top/Arts/Literature/Authors/Horror/ !Liste der Horror-Autoren Horror-Autoren

Hotels Warsaw gry strategiczne cukrzyca tablice last minute egipt










































:: RELATED NEWS ::
TSV 1860 Monachium
TSV 1860 Monachium, znany także jako "Lwy" (niem. Die Löwen), jest niemieckim klubem sportowym, liczącym około 20 000 członków, założony po raz pierwszy 15 lipca 1848, póżniej jego działalność została zakazana wskutek "republikańskich poglądów", reaktywowany 17 maja 1860 jako TSV München 1860 e.V.

Hi

Kominform
Kominform - Biuro Informacyjne Partii Komunistycznych i Robotniczych utworzone 27 września 1947 r. na naradzie partii komunistycznych i robotniczych w Szklarskiej Porębie - Józef Stalin zwołał konferencję w odpowiedzi na kontrowersje wśród komunistycznych rządów europejskich, czy wziąć udział w paryskiej konferencji dotyczące
Liczba Bonda
Liczba Bonda jest to jedna z liczb podobieństwa. Używana w mechanice płynów, wyraża stosunek sił grawitacji do napięcia powierzchoniowego:
Bo = \frac
gdzie:
- \rho - gęstość
-
John Jones Ross
John Jones Ross (1831-1901) – kanadyjski lekarz i polityk, premier prowincji Quebec z ramienia Konserwatywnej Partii Quebecu. Urodzony w Quebecu 16 sierpnia
Gregorian
Gregorian - chór męski, pochodzący z Niemiec, w którego skład wchodzą mnisi. Pomysł producenta muzycznego z Hamburga – Franka Petersona był nadzwyczajny: "Chór gregoriański śpiewa modne i znane piosenki, aranżowane w chóralnym stylu wczesno-średniowiecznych mnichów". Już z pierwszymi albumami Gregorian Peterson i zespół jego producentów w latac
Sytuacja homoseksualistów we Francji i terytoriach zależnych

Prawa homoseksualistów we Francji

Francja jest pierwszym krajem na świecie który zalegalizował homoseksualizm w 1791 roku. Jednak wiek dopuszczający kontakty seksualne, został zrównany dopiero w 1982 roku. Podobnie sytuacja się ma na terytoriach zależnych - Gwadelupa, Martynika,
Palmiro Togliatti
Palmiro Togliatti (ur. 26 marca 1893, zm. 21 sierpnia 1964) – przywódca włoskich komunistów. Działalność polityczną rozpoczął przed I wojną światową, we Włoskiej Partii Socjalistycznej, po wojnie skupionej wokół turyńskiej gazety
Zejdu Badian
Zejdu Badian (także: Seydou Badian Kouyaté, ur. 1928) - malijski polityk i pisarz, tworzący w języku francuskim. Po uzyskaniu przez Mali niepodległości w 1960 r. Badian zajął się polityką, jednak po wojskowym zamachu stanu w 1968 r. na siedem lat trafił do więzienia. Potem wyemigrował do Senegalu. Badian pisał p
Seydou Badian
Zejdu Badian (także: Seydou Badian Kouyaté, ur. 1928) - malijski polityk i pisarz, tworzący w języku francuskim. Po uzyskaniu przez Mali niepodległości w 1960 r. Badian zajął się polityką, jednak po wojskowym zamachu stanu w 1968 r. na siedem lat trafił do więzienia. Potem wyemigrował do Senegalu. Badian pisał p
Operacja Czarodziejski Dywan
Operacja Czarodziejski Dywan (Operation Magic Carpet) - operacja przeprowadzona w okresie od czerwca 1949 do września 1950 r., w czasie której przewieziono samolotami 45 tys. Żydów z Jemenu do nowopowstałego państwa Izrael. 380 lotów odbyły amerykańskie i brytyjskie samoloty transportowane startujące z Adenu. Operacja b
All Rights Reserved 2005 wikimiki.org