:: wikimiki.org ::
| Alphabet Pan-nigérian |
Alphabet pan-nigérian
L'alphabet pan-nigérian est une ensemble de caractères latins comprenant des lettres diacritées et des lettres supplémentaires. Il a été conçu pour que l'on puisse, en théorie, écrire toutes les langues du Nigeria (plus de 250 selon la méthode de décompte, parmi lesquelles le yorouba, le haoussa, l'igbo, le peul, l'édo etc.) au moyen d'un même ensemble de signes. Outre les diacritiques créant de nouvelles lettres, il en existe d'autres, plus ou moins souvent utilisés, permettant de noter les tons des langues, comme l'accent aigu, l'accent grave, l'accent circonflexe, le macron, etc.
En pratique, l'alphabet pan-nigérian ne permet pas la transcription écrite de toutes les langues du Nigeria mais a pu servir de référence à la mise en place d'autres alphabets pour l'Afrique, comme l'alphabet international de Niamey.
Histoire
C'est dans les années 80 que le gouvernement du Nigeria, et plus précisément son National Language Centre, a décidé, pour uniformiser à l'écrit une situation linguistique complexe (on peut recenser plus de 250 langues dans ce pays, qui ne sont pas forcément écrites), de mettre au point un ensemble de caractères susceptibles de transcrire toutes les langues du territoire. Il fallait aussi prévoir un alphabet que l'on pût retrouver sur les machines à écrire, outil administratif important. Lors d'un colloque consacré à la question des machines à écrire tenu en 1983 à Bénin, la maquette proposée en 1981 par le professeur de linguistique Kay Williamson et retouchée par des linguistes nigérians a été officiellement considérée comme le point de départ d'une recherche formelle.
Hermann Zapf, professeur et calligraphe allemand, en a donné la version définitive.
Il n'y a, dans cet alphabet théorique (toutes les langues n'utilisent bien sûr pas toutes les lettre possibles), aucun digramme. Le modèle a été finalisé par Hermann Zapf. Le voici sans les diacritiques annexes (É é, È è et Ê ê) :
Le voici tel que présenté dans les années 80 par la firme Olivetti au National Language Centre du Nigeria pour un projet de machine à écrire :
Remarques
Le diacritique souscrit des lettres qu'on a citées là sous la forme Ẹ, Ṣ, etc., n'est normalement pas un point souscrit mais une barre verticale souscrite. On devrait donc écrire E̩, S̩, etc. Les graphies avec le point, cependant, sont de plus en plus courantes, des caractères précomposés étant prévus par Unicode, au contraire des graphies avec barre souscrite.
On remarque une influence directe de la linguistique dans la création de l'alphabet : des symboles comme ɓ, ɗ, ǝ et ƙ sont en effet directement empruntés à l'alphabet phonétique international avec la même valeur phonétique. L'absence de symboles comme ŋ, ɛ et ɔ, largement repris dans d'autres alphabets latins d'Afrique (consulter Alphabet international de Niamey), est cependant notable. C'est sans doute ces lacunes qui expliquent son faible succès.
Actuellement, le stock de caractères nécessaire pour les orthographes des langues du Nigeria est le suivant : ā a̱ ạ ḅ ɓ ḍ ɗ e̱ ẹ ɛ ə ḥ ị ɨ ƙ ṅ ṇ ŋ ñ n̄ o̱ ọ ɔ ʌ ṣ ụ ʼw ʼy ẓ ʼ
Articles connexes
- Alphabet international de Niamey ou « alphabet africain de référence » ;
- langues d'Afrique ;
- alphabet latin, diacritiques de l'alphabet latin, lettres supplémentaires de l'alphabet latin ;
- alphabet phonétique international.
Catégorie:Méthode de transcription
Catégorie:Clavier
Pan-nigerian
Alphabet latinL'alphabet latin est l'alphabet qu'on utilise majoritairement pour écrire les langues d'Europe occidentale ainsi que dans les pays qui ont été colonisés par les Européens. C'est, en concurrence avec l'alphabet cyrillique et, dans une bien moindre part, l'alphabet grec, l'écriture occidentale par défaut et maintenant – en raison de l'importance économique et culturelle de pays l'utilisant (comme les États-Unis) une écriture internationale : on peut trouver des mots écrits en lettres latines dans les rues du Japon comme dans celles de l'Égypte.
On nomme cet alphabet ainsi car c'était, à l'origine, celui des Romains et de leur langue, le latin.
Lettres
L'alphabet latin, comme la majorité de ceux issus de l'alphabet grec, est bicaméral : on utilise deux graphies pour chaque graphème (ou lettre), l'une dite minuscule, l'autre capitale. Dans la majorité des cas, chaque lettre possède les deux variantes. Il existe cependant quelques exceptions, comme la lettre ß (eszett ; utilisée en allemand et autrefois dans d'autres langues, dont le français), qui, en capitales, est remplacée par SS.
L'expansion – tant géographique que temporelle – de cet alphabet en fait l'un des plus riches en variantes nationales. Ainsi :
- chaque langue donnée utilise un jeu plus ou moins complet de lettres fondamentales ;
- chacune peut en posséder des lettres modifiées qui s'y ajoutent ;
- parmi les lettres modifiées, certaines sont considées, selon les langues, comme des lettres à part entière ou comme des variantes d'une autre lettre.
Par exemple, les alphabets utilisés pour le français et pour le castillan ne sont pas identiques (ainsi, la lettre ç ne s'emploie pas en castillan et le français, à l'inverse ne se sert pas de á), bien que tous deux puissent être ramenés à l'alphabet latin. En sorte, il ne serait pas faux de parler d'un alphabet français et d'un alphabet castillan.
On le voit, il n'existe rien tel qu'un alphabet latin figé et constant ; il est cependant possible d'isoler les graphèmes fondamentaux utilisés dans une majorité de langues : ce sont ceux de l'alphabet des origines (voir plus bas, section « Histoire ») plus j et u ainsi que g et w, soient :
Graphèmes fondamentaux
cellpadding="8"
|+ Capitales
|- style="font-size:20px;"
| A || B || C || D || E || F || G || H || I || J || K || L || M
|- style="font-size:20px;"
| N || O || P || Q || R || S || T || U || V || W || X || Y || Z
|{{XIXe siècle{entête tableau simple style|text-align: center;
Diacritiques de l'alphabet latin
L'alphabet latin a connu, d'abord dans le monde occidental puis après les différentes périodes de colonisation, partout dans le monde, une extension géographique considérable : tout au long de son histoire, il a été conservé ou emprunté par de nombreux peuples qui s'en sont servi pour noter leur langue. À l'origine destiné à la langue des Romains, qu'il ne transcrivait déjà pas très fidèlement, son nombre réduit de lettres en a montré les limites : les langues l'utilisant ont dû, pour étendre les possibilités d'une transcription plus fidèle, soit façonner de nouvelles lettres, soit créer de nouvelles unités au moyen de plusieurs signes (comme les digrammes) soit, enfin, modifier des lettres existantes au moyen de diacritiques.
Les signes obtenus peuvent être considérés comme de nouveaux graphèmes (ils sont dans ce cas inclus dans l'alphabet de la langue), ou comme des variantes du graphème fondamental qui les porte (ils ne sont alors pas répertoriés dans l'alphabet). Cette distinction est très importante pour le classement alphabétique des mots d'un dictionnaire, par exemple. Ainsi, en castillan, la lettre diacritée ñ (n tildé) est considérée comme une lettre indépendante, classée à la suite de n, tandis qu'en français aucune des variantes diacritées de e (soient é, è, ê et ë) n'est classée autrement que si elle ne portait aucun diacritique. En castillan, toujours, á, é, í, ó, et ú ne sont cependant pas considérées comme des graphèmes mais comme des variantes.
L'alphabet phonétique international fait grand usage de diacritiques ; ceux qui lui sont propres seront aussi traités dans cette série d'articles. Enfin, les diacritiques utilisés en français font l'objet d'articles supplémentaires.
Introduction
L'utilisation de diacritiques s'est avérée très féconde et le mouvement s'est accéléré au XVIIIe siècle quand il s'est agi de transmettre rigoureusement des textes ou des énoncés de langues lointaines qu'on découvrait : les transcriptions et translittérations en lettres latines, c'est-à-dire la romanisation, a nécessité l'utilisation en nombre important de diacritiques. Il ne serait en effet pas aisé de lire une transcription dans laquelle certaines lettres seraient inventées. Les divers alphabets phonétiques, issus des recherches nouvelles en phonétique et phonologie, ont eux aussi eu recours à ce procédé pour étendre leur nombre de caractères. Sachant, enfin, que de nombreuses langues ne sont pas écrites ou depuis peu, c'est maintenant presque exclusivement en alphabet latin étendu qu'elles sont notées par les linguistes, au moyen d'outils comme l'alphabet phonétique international. L'alphabet pan-nigérian est à cet égard représentatif.
Apex et i long latins
Dans les premiers temps de l'alphabet latin, il n'existait pour ainsi dire aucune ponctuation (si l'on exclut l'usage sporadique du point médian séparateur de mots), aucun diacritique. C'est cependant dès la fin du IIe siècle avant l'ère chrétienne qu'apparaît un premier diacritique, dit apex (en latin : « pointe »), qui n'est pas d'usage systématique, loin s'en faut, ni toujours utilisé à « bon » escient, si son rôle est bien d'indiquer la présence de voyelles longues. Il est assez courant sous l'Empire. L'apex, qui ressemble à un accent aigu, ne se place cependant pas sur la lettre I qui, elle, est tracée plus grande que la normale. Noter que l'apex est légèrement décalé sur la droite de la voyelle qui le porte et que li long dépasse en hauteur mais ne descend pas sous la ligne de base.
Détail d'une stèle funéraire avec deux i longs Détail d'une stèle funéraire avec un apex Détail d'une inscription latine avec apex
Dans les images ci-dessus, on lit :
- CORVINUS et SILANUS (à gauche) ;
- FÉCIT (au centre) ;
- RÓMVLVS·MÁRTIS·FILIVS·VRBEM·RÓMAM (à droite ; noter les points médians séparateurs).
Dans les ouvrages didactiques, on marque la quantité longue des voyelles latines au moyen du macron, signe inventé par les grammairiens grecs : on aurait dans ce cas Corvīnus, fēcit, Rōmulus Mārtis fīlius Urbem Rōman.
L'apex et li long apportent des informations importantes sur la phonologie latine : en effet, outre par la connaissance de la phonétique historique de cette langue, c'est très souvent par la scansion des vers latins qu'on connaît les quantités vocaliques des mots. Or, la scansion ne révèle que la quantité des syllabes : pour la métrique latine, /mar/, dans Martis, est une syllabe longue (car fermée) quelle que soit la quantité du /a/. L'apex sur la lettre A indique ici que la syllabe longue est composée d'une voyelle longue.
Signes abréviatifs et éditoriaux devenus des diacritiques
L'apex et le i long ne se sont pas suffisamment répandus pour être passés dans les usages postérieurs et se limitent au seul latin. Ce qui, en revanche, a pris une ampleur importante depuis les débuts de l'alphabet latin, ce sont les marques indicant des abréviations présentes en épigraphie puis, et surtout, dans les manuscrits.
Au départ, les signes et procédés utilisés pour signaler de telles abréviations ne sont certes pas des diacritiques au sens réel du terme mais, changeant de fonction au fil des années, il ont pu par la suite (généralement au Moyen Âge) le devenir, les scribes étant de plus en plus souvent confrontés au problème de la notation de leur langue natale par un alphabet qui s'y prête mal. En effet, la langue latine, après la chute de l'Empire romain, avait cessé d'être – pour ainsi dire – la seule qui fut écrite.
Parmi les signes abréviatifs réutilisés, on compte le titulus (« titre » ; le mot est devenu tilde), trait suscrit (devenu ensuite un trait ondulé) utilisé pour indiquer qu'une lettre, le plus souvent une nasale, a été omise pour des raisons d'économie de place (ou de matériau). Par exemple, annu(m) a pu être écrit an̅u dans les manuscrits espagnols pour devenir enfin año, « an », en castillan, puisque /nn/ latin est passé à /ɲ/ (de gnon) dans cette langue.
Des lettres suscrites ou souscrites sont aussi utilisées dans une fonction diacritique ; c'est le cas du z qui, d'abord placé après un c pour signaler qu'il devait se prononcer /ts/ (maintenant /s/) devant des voyelles comme a, o et u, a été finalement écrit au-dessous du c. Ce z souscrit, nommé zedilla en castillan, soit « petit z », est devenu notre cédille (cf. aussi Lettre diacritique). Il a cependant existé, avant la cédille, un diacritique graphiquement proche (ou proche d'un ogonek) attesté dès le VIe siècle en onciale sous le e, dit alors E caudata (« e doté d'une queue »), remplaçant parfois le digramme ae (écrit parfois æ, coutume qui s'est étendue par la suite) servant à noter le plus souvent un /ɛ/ ouvert. Il est notable que cette lettre, qu'on peut représenter ici par ę (avec un ogonek) ou ȩ (avec une cédille), ait été conservée dans la transcription des romanistes alors que c'est le digramme ae (maintenant présenté sous la forme liée æ et nommée ash) qui l'ait été dans la transcription des langues germaniques (sachant que ę était aussi utilisé dans les manuscrits en vieil anglais de l'onciale insulaire).
Enfin, des symboles éditoriaux plus généraux (servant à indiquer des erreurs du copiste, par exemple) ont aussi pu accéder au statut de diacritiques ; le cas se présente avec le punctum delens (« point effaçant »), très fréquent dans les manuscrits irlandais, qui signale que la lettre le portant est une erreur et ne doit pas se faire entendre. Par extension, il signale ensuite les lettres muettes issues d'une mutation consonantique puis toutes les mutations consonantiques ; ainsi en gaéliquemo ḟele, « mon incantation », mo ċú, « mon chien » (écrits actuellement mo fhele, mo chú). Consulter Point suscrit pour plus de détails.
Certains de ces signes ont donné des symboles typographiques, comme le croisillon (#), ancien N surmonté d'un titulus, abréviation pour numerus, « numéro ».
Liste des diacritiques
titulus
Suscrits
Les diacritiques suscrits sont placés au-dessus de la lettre qu'ils modifient:
- ó : accent aigu
- ő : double accent aigu
- ô : accent circonflexe
- ò : accent grave
- ȍ : double accent grave
- ŏ : brève
- ȏ : brève renversée
- ỏ : crochet en chef
- ƈ : crosse
- ǒ : háček ou caron
- o̩ : ligne verticale (voir également l'article sur l'apostrophe)
- ō : macron ou ligne suscrite
- ȯ : point en chef (voir aussi le point en ponctuation)
- o̊ : rond en chef, ou kroužek selon le terme tchèque
- õ : tilde
- ö : tréma ou, improprement, umlaut
- o̐ : chandrabindu : (note un type de nasalisation propre au sanskrit ; on le rencontre dans la transcription de la syllabe ॐ om̐, par exemple).
Souscrits
Les diacritiques souscrits sont placés en-dessous de la lettre qu'ils modifient:
- o̧ : cédille
- ọ : point souscrit
- ǫ : ogonek
- o̡ : crochet palatal
- o̢ : crochet rétroflexe
- ɕ : boucle souscrite
- o̰ : tilde souscrit
- o̭ : accent circonflexe souscrit
- o̱ : ligne souscrite
- o̦ : virgule souscrite
- o̮ : brève souscrite
- o̯ : brève renversée souscrite
- o̩ : ligne verticale souscrite
- o̥ : rond souscrit
Adscrits
Les diacritiques adscrits sont placés sur le côté de la lettre qu'ils modifient:
- lʼ : apostrophe (en remplacement du háček dans certains cas) ;
- ơ : corne
- o˞ : crochet rhotique
- ŀ : point médian
Inscrits
Les diacritiques inscrits sont placés à travers la lettre qu'ils modifient:
- ɵ : barre inscrite
- ø : barre oblique
- ⍉ : contre-barre oblique
- ɫ : tilde inscrit
- ɬ : sangle inscrite
Diacritiques en français
Le français utilise les diacritiques suivants (les liens renvoient vers des articles spécifiques à l'utilisation de ces diacritiques dans la langue française et non aux articles généraux) :
- l'accent aigu, sur la lettre e (é) ;
- l'accent grave, sur les lettres a (à), e (è) et u (ù). C'est à l'initiative de Corneille que cet accent a été introduit en français, afin de faire la différence entre la voyelle ouverte (è) et la voyelle fermée (é), qui étaient jusque là notées de la même manière (é ou e) ;
- l'accent circonflexe, sur les lettre a (â), e (ê), i (î), o (ô) et u (û), d'un usage relativement complexe ;
- le tréma, sur les lettres e (ë) et i (ï), o (ö) et u (ü) pour des mots empruntés à d'autres langues, pour forcer la prononciation d'une voyelle normalement muette parce qu'utilisée dans un digramme (maïs, aiguë...), ou encore sur y (ÿ) dans de très rares cas ;
- la cédille au-dessous du c (ç).
Consulter aussi Diacritiques utilisés en français.
Articles connexes
- Diacritique ;
- diacritiques utilisés en français ;
- lettres supplémentaires de l'alphabet latin ;
- alphabet latin ;
- écriture ;
- typographie.
Latin
Catégorie:Diacritique de l'alphabet latin
Lettres supplémentaires de l'alphabet latin
L'alphabet latin, utilisé depuis des siècles pour noter la majorité des langues d'Europe occidentale (puis, après les colonisations, partout dans le monde), a souvent dû être complété : sa version historique ne possède en effet pas assez de graphèmes pour noter tous les phonèmes des langues qui l'utilisent. Pour ce faire, on lui a ajouté des lettres supplémentaires, soit par simple utilisation de digrammes et de diacritiques, soit par construction de nouveaux graphèmes.
Les méthodes de transcriptions et translittérations de langues qui n'utilisent pas l'alphabet latin font également beaucoup appel à des lettres supplémentaires.
Caractères ajoutés
Cette table récapitule quelques graphèmes qui ont été ou sont encore utilisés et qui ne rentrent pas dans le cadre de l'alphabet latin standard. Sont précisées les langues qui utilisent chacun d'eux ; les langues mortes étant indiquées en italique. Les caractères spécifiques à l'alphabet phonétique international ne sont pas repris ici.
Caractères modifiés
Diacritiques
Article détaillé : Diacritiques de l'alphabet latin.
Une façon simple de transcrire un phonème est d'utiliser un diacritique sur une lettre proche. Si en français les lettres diacritées ne sont pas considérées comme distinctes, il en va autrement pour d'autres langues.
Ligatures
Article détaillé : Ligature (typographie).
Voir aussi
Liens internes
- Alphabet latin
- Diacritiques de l'alphabet latin
- Digramme
- Lettres supplémentaires de l'alphabet grec
- Ligature (typographie)
- Ordre alphabétique
- Variante contextuelle
-
Yorouba
Le yoruba (nom local : yorùbá) est une langue tonale appartenant à la famille des langues nigéro-congolaises. Il est parlé par environ vingt cinq millions de personnes, au Nigeria, où il est l'une des trois langues nationales, mais aussi dans certaines régions du Bénin et du Togo. Il se subdivise en de nombreux dialectes. Il existe néanmoins aussi une langue standard.
Selon les écoles linguistiques, elle est classée, soit dans les langues kwa, soit dans les langues bénoué-congolaises.
Écriture et orthographe
Alphabet
Le yoruba s'écrit au moyen d'un alphabet latin étendu par des diacritiques (point ou, mieux mais moins souvent disponible, barre verticale souscrits) ainsi qu'un digramme. Chacun des signes a le statut de graphème indépendant. L'alphabet yoruba est un sous-ensemble de l'alphabet pan-nigérian :
- capitales : A B D E Ẹ (E̩) F G GB H I J K L M N O Ọ (O̩) P R S Ṣ (S̩) T U W Y ;
- minuscules : a b d e ẹ (e̩) f g gb h i j k l m n o ọ (o̩) p r s ṣ (s̩) t u w y.
Les lettres se lisent quasiment comme dans l'API. Noter cependant l'utilisation de la barre souscrite (ou du point) pour les voyelles ouvertes (s'accompagnant aussi, d'après l'analyse traditionnelle, d'un mouvement de rétraction de la racine de la langue) ẹ (e̩) = [ɛ̙], ọ (o̩) = [ɔ̙] et pour le [ʃ], noté ṣ (s̩). Enfin, le digramme gb note une occlusive labio-vélaire [gb͡] (qu'on prononce d'un seul mouvement et non comme s'il s'agissait d'une séquence [g] + [b]).
Signes annexes
On emploie trois diacritiques supplémentaires pour noter les tons de la langue : l'accent aigu (registre haut), l'accent grave (registre bas) et le macron (registre moyen). Ce dernier est généralement omis (une voyelle non marquée doit donc être lue comme portant un macron). De sorte, on trouve des combinaisons comme ẹ́ et ọ̀.
Des combinaisons de registres donnant des tons modulés (consulter Langue tonale pour ces notions) pouvaient être notées par un háček pour la modulation montante (bas-haut) et un tilde pour d'autres. Dans les usages actuels, le háček est parfois remplacé par une écriture décomposée : ǒ = òó. Le tilde, quant à lui, est abandoné : õ = òó ou ōò (voire oò), selon les cas.
Enfin, les nasales pouvant être vocalisées, elles reçoivent aussi les marques tonales : ḿ et m̀, par exemple.
Caractéristiques
Outre que le yoruba est une langue tonale à registres et combinaisons mélodiques de registres, il connaît aussi un mécanisme d'harmonie vocalique. Sa morphologie est riche, faisant, par exemple, un large emploi du redoublement.
Exemples
Voir aussi
Liens internes
- linguistique
- dictionnaire des langues
- langues par famille
- langues nigéro-congolaises
- - groupe kwa
Liens externes
Catégorie:Langue isolante
Catégorie:Langue nigéro-congolaise
Igbo
L'igbo est une langue parlée au Nigeria par environ trente cinq millions d'ibo, principalement dans le sud-est du pays indépendante quelques temps sous le nom de Biafra. L'alphabet latin est utilisé pour son écriture.
Il existe de nombreux dialectes dérivés de l'igbo, pas forcément toujours mutuellement intelligibles : Idemili, Owerri, Ngwa, Umuahia, Nnewi, Onitsha, Awka, Abriba, Arochukwu, Nsukka, Mbaise, Ohafia, Wawa et Okigwe.
Catégorie:Langue nigéro-congolaise
Édo (langue)
L'édo (aussi appelé benin, bini, addo, oviedo ou ovioba) est une langue de la famille des langues nigéro-congolaises. Elle est parlée par environ un million de personnes, principalement au Nigeria (régions d'Ovia, Oredo et Orhionmwon de l'État d'Edo) et sur l'archipel de Sao Tomé-et-Principe dans le golfe de Guinée. Elle est aussi la langue historique du royaume du Benin.
L'édo est la principale forme d'un groupe de langues et dialectes, généralement désigné sous le vocable de langues "édoïdes". Les variantes de cette forme principale sont généralement suffisamment homogènes pour être mutuellement intelligibles. L'édo est surtout une langue de tradition orale, dont presque tous les locuteurs sont bilingues anglais ou pidgin; il existe cependant une littérature, ainsi que des dictionnaires et divers textes éducatifs ou historiques.
L'alphabet utilisé est un sous-ensemble de l'alphabet latin : Á B D É È F G Í H K L M N Ó Ò P R S T Ú V W Y Z.
Voir aussi
Articles connexes
- linguistique
- dictionnaire des langues
- langues par famille
- langues nigéro-congolaises
Edo
Accent aiguL'accent aigu est un diacritique de l'alphabet latin hérité de l'accent aigu grec. Il fait ses premières apparitions en français au , introduit par Geofroy Tory en 1529.
En français, l'accent aigu est placé sur la lettre e (« é ») pour distinguer le phonème au timbre fermé /e/ du phonème /ə/.
On le rencontre exceptionnellement sur e ouvert dans:
aimé-je, je protégerai
et dans certains mots comme allégement, événement(prononcés allègement, évènement).
Remarque:
l'arrêté du 28/12/1976 autorise l'accent grave au lieu de l'accent aigu dans les cas où la prononciation fait entendre un e ouvert: évènement, je protègerai.
Áá [a], Éé [e], Íí [i], Óó [o], Úú [u].
Il indique les accents toniques « irréguliers » par rapport à la structure accentuelle courante. Par exemple : explicación [eksplika'θjon] (« explication »), típico ['tipiko] (« tipique »).
Il permet en outre de distinguer des homophones, notamment les pronoms interrogatif et exclamatif (accentués) du pronom relatif (non accentué). C'est dans ce cas un vrai usage diacritique. Par exemple :
- ¿Qué dice? : « Que dit-il ? ».
- Lo que dice : « Ce qu'il dit ».
Parmi les autres cas se nombrent te (pronom réflexif « te ») et té (« thé »), se (pronom réflexif « se ») et sé (« sois » ou « je sais »), et mas (« mais ») et más (« plus »).
Pour plus de détails, consulter Accentuation de l'espagnol.
Dans l'écriture vietnamienne Quôc ngu, l'accent aigu est appelé « sắc » et indique une intonation montante.
Sur tout symbole de voyelle (ou de consonne vocalisée), il indique un tonème de registre haut.
Transcription en ASCII
L'ASCII de base (caractères 0 à 127) ne contient pas de lettre acentuée. À l'époque où c'était la seule page de code disponible, certains simulaient l'accent aigu en plaçant une apostrophe derrière la lettre : par exemple, ils écrivaient « e'te' » pour « été ». C'est d'ailleurs cette solution qui a été retenue pour le VIQR.
Articles connexes
- diacritique ;
- diacritiques de l'alphabet latin ;
- diacritiques utilisés en français ;
- alphabet latin.
Catégorie:Diacritique de l'alphabet latin
ja:アキュート・アクセント
Accent graveL'accent grave est un diacritique que l'on retrouve dans divers alphabets.
Alphabet grec
L'accent grave grec n'apparaissait, en grec ancien, que sur la dernière syllabe d'un mot, dans les cas où l'intonation de celle-ci était grave. Le terme grave dérive d'ailleurs du latin gravis (lourd), lui même traduit du grec βαρύς, qui désignait cette intonation.
Alphabet latin
Dans l'alphabet latin, l'accent grave est directement emprunté à l'alphabet grec. Moins courant que l'accent aigu, on le trouve de manière générale sur les voyelles A, E, O et U, dans les langues suivantes :
- En catalan (accent greu ou obert), il indique la position de l'accent tonique et aussi l'aperture des voyelles /e/ et /o/ (qui peuvent être ouvertes ou fermées) :
- à (català)
- è (enciclopèdia)
- ò (història)
- En écossais, il note une voyelle longue.
- En français :
- à : pour distinguer certains homonymes (la et là, ça et çà) ;
- è : pour la prononciation du /e/ ouvert ;
- ù : uniquement pour le mot où, pronom relatif) ou adverbe interrogatif, afin de le distinguer de son homonyme ou, conjonction de coordination
- En gallois, l'accent grave est utilisé pour noter une voyelle courte dans un mot qui, dans le cas contraire, serait prononcé avec une voyelle longue, comme par exemple mẁg (« tasse ») et mwg (« fumée »).
- En italien, il indique, entre autres, la place de l'accent tonique :
- à (libertà)
- è (caffè)
- ò
- ù (virtù)
- En norvégien, l'accent grave indique que la syllabe qu'il diacrite est accentuée, afin de différencier certains mots comme og (« et ») et òg (« aussi »).
- En portugais :
- à (à, àquele) : il indique la crase entre la préposition a soit avec l'article défini a, soit avec le pronom relatif aquele et ses formes fléchies.
- Dans quelques langues à tons, comme le vietnamien, l'accent grave indique un ton descendant.
Représentation informatique
Le jeu de caractères ASCII de base (caractères 0 à 127) ne contient pas de lettre accentuée. À l'époque où il s'agissait de la seule page de code disponible, il était possible d'émuler l'accent grave en plaçant une apostrophe inversée devant la lettre : par exemple, en écrivant « fi`ere » pour « fière ». En VIQR, l'apostrophe inversée était placée après, par exemple « e` » pour « è ».
La norme ISO 8859-1 inclut les caracètres à, è, ì, ò, ù et leur formes capitales respectives. Plusieurs dizaines d'autres lettres portant un accent grave sont disponible avec Unicode. Cette norme inclut également un caractère accent grave pouvant se combiner avec d'autres caractères.
Sur certains claviers, l'accent grave possède une touche réservée destinée à être combinée avec une voyelle.
Voir aussi
- Diacritique
- Diacritiques de l'alphabet grec
- Diacritiques de l'alphabet latin
- Diacritiques utilisés en français
Catégorie:Diacritique de l'alphabet latin
ja:グレイヴ・アクセント
nb:Grav aksent
Macron ja:マクロン
Catégorie:Diacritique de l'alphabet latin
Catégorie:Linguistique
Le macron est un diacritique de l'alphabet latin et de l'alphabet grec. Il prend la forme d'une barre horizontale que l'on place le plus souvent au-dessus d'une voyelle. Son principal rôle est d'indiquer que le signe qui le porte reçoit une quantité vocalique longue ; il s'oppose en cela à la brève.
Le letton, par exemple, utilise le macron au-dessus des voyelles a, e, i et u pour former ā, ē, ī et ū tandis que le lituanien ne l'utilise qu'au-dessus du u.
Le couple macron ~ brève est d'un usage très fréquent en phonologie : c'est en effet un artifice philologique très ancien puisqu'on le fait remonter à l'époque byzantine, celle pendant laquelle les diacritiques de l'alphabet grec ont été rationnalisés.
Exemple de macron : Tōkyō
Homonymie
- Macron est également le nom d'une marque d'un équipementier sportif italien : http://macron.com/m/
Articles connexes
- Diacritiques de l'alphabet latin et diacritiques de l'alphabet grec ;
- alphabet latin ;
- diacritique.
Digramme
En linguistique, un digramme est un assemblage de deux graphèmes (deux lettres dans les alphabets) représentant un phonème unique et devenant un nouveau graphème (un trigramme pour trois graphèmes, etc.). Par exemple dans le mot chou, le digramme ou correspond à une seule voyelle phonologique, /u/ et ch représente le phonème /ʃ/. On peut donc dire que ce mot contient quatre lettres et deux graphèmes. Pour qu'une suite de deux lettres soit considérée comme un digramme, il faut qu'elle soit bien attestée dans le système d'écriture, voire être productive. On peut, en français, noter n'importe quel nouveau mot utilisant le phonème /ʃ/ par ch, ce qui confirme son statut de graphème, donc de digramme.
L'utilisation de digrammes ou de trigrammes dans un alphabet indique souvent qu'il est lacunaire en tant que tel car il lui manque un caractère propre permettant de noter un des phonèmes de la langue écrite par son biais.
Note : les transcriptions sont en alphabet phonétique international.
Fausses diphtongues et anciennes diphtongues
Les digrammes peuvent être composés de voyelles ou de consonnes. Des digrammes de voyelles sont aussi appelés « fausses diphtongues » quand les deux voyelles ne notent qu'une voyelle simple. C'est le cas en français (ou = [u], ai = [ɛ], eu = [œ] ou [ø], etc.). Le grec ancien en connaît aussi : ου peut valoir [oː] et ει [eː]. De même en grec moderne pour αι = [e] ou encore ει, οι, υι = [i].
Dans les faits, il convient de distinguer les fausses diphtongues réelles des cas de monophtongaison : en grec ancien, les phonèmes /oː/ et /eː/ du dialecte ionien-attique ne pouvaient pas, en raison de l'absence de signes qui leur fussent propres après la réforme de 403 avant l'ère chrétienne, être notés autrement. Ce sont bien là des fausses diphtongues. En grec moderne et en français, les notations actuelles s'expliquent par le jeu d'une ancienne monophtongaison. Les deux processus ne sont pas identiques : c'est un moyen de pallier les lacunes d'une écriture dans le premier cas, un archaïsme dû à l'évolution secondaire de diphtongues anciennement prononcées comme tel dans le second.
Ligature et digramme
À la différence de la ligature, l'identité graphique des graphèmes fondamentaux combinés n'est pas altérée.
Le digramme dans l'ordre alphabétique
On ne confondra pas le graphème et la lettre : tout digramme est un graphème mais tout digramme n'est pas considéré comme une lettre. En effet, dans certaines langues le digramme reste considéré comme deux lettres séparées (il n'est pas comptabilisé dans l'ordre alphabétique). Au contraire, dans d'autres, les digrammes fonctionnent comme des lettres nouvelles qui ont leur propre place dans le classement alphabétique.
Par exemple, le digramme ch en français n'est pas une lettre : il n'est pas compté dans l'alphabet et le mot cheval doit être classé, dans un dictionnaire, par exemple, entre des mots en ce et en ci. En vietnamien, cependant, ch est un digramme et une lettre. Ainsi, chiếc doit être cherché à la rubrique des mots en ch, placée après tous les mots commençant par c. On peut illustrer cela par des mots à classer :
- cela, chien, cil pour le français ;
- cải, cựu, che, pour le vietnamien.
Exemples de digrammes en français
- ch – [k]/[ʃ]
- ou – [u]
- ai – [ɜ]
- eu – [œ]
Articles connexes
- Typographie, écriture ;
- lettre conjointe ;
- ligature ;
- lettres supplémentaires de l'alphabet latin, lettres supplémentaires de l'alphabet grec ;
- diacritique.
Catégorie:Linguistique
als:Digraph
ja:二重音字
Point souscrit
Catégorie:Diacritique de l'alphabet latin
Le point souscrit est un diacritique de l'alphabet latin utilisée dans différentes notations, notamment pour les transcriptions de l'arabe et des langues de l'Inde : le hindi, la devanagari, le tamoul principalement.
Transcription de l'arabe
En arabe, le point souscrit note une consonne emphatique par exemple :
- ﺪ da (non emphatique)
- ﺾ ḍad (emphatique).
On utilise donc les consonnes diacritées suivantes : Ḍḍ, Ḥḥ, Ṣṣ, Ṭṭ
Transcription des langues de l'Inde
Pour ces langues, le point souscrit note les consonnes rétroflexes. On utilise les consonnes diacritées suivantes : Ḍḍ, Ṇṇ, Ṣṣ, Ṭṭ
Dictionnaires de l'Allemand
En dictionnaires de l'Allemand, le point souscrit note les consonnes accentuées et tendues.
Unicode
- Point souscrit (̣) : U+323
Voir aussi
Articles connexes
- Point suscrit
- Diacritiques
UnicodeUnicode est un standard informatique développé par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d'écriture de langue un identifiant numérique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.
But
Unicode, dont la première publication remonte à 1991, a été développé dans le but de remplacer l'utilisation de pages de code nationales.
Ces pages de code présentaient en effet quelques problèmes. Par exemple lorsqu'était prévu un caractère « signe monétaire », le même texte autorisant aux USA une dépense en dollars pouvait une fois transmis par courrier électronique au Royaume-Uni autoriser la même dépense en livres sterling, sans que quoi que ce soit ait été modifié au texte !
Dans la pratique, tous les systèmes d'écriture ne sont pas encore présents, car un travail de recherche documentaire auprès de spécialistes peut encore s'avérer nécessaire pour des caractères rares ou des systèmes peu connus (parce que disparus, par exemple).
Cependant, tous les systèmes les plus utilisés dans le monde sont représentés, ainsi que des règles sur la sémantique des caractères, leurs compositions et la manière de combiner ces différents systèmes (par exemple, comment insérer un système d'écriture de droite à gauche dans un système d'écriture de gauche à droite ?).
Normes et versions
Le travail sur Unicode est parallèle et synchronisé avec celui sur la norme ISO/CEI 10646 dont les buts sont les mêmes. L'ISO/CEI 10646, une norme internationale publiée en français et en anglais, ne précise cependant ni les règles de composition de caractère, ni les propriétés sémantiques des caractères.
Unicode aborde cependant la problématique de la casse, du classement alphabétique, et de la combinaison d'accents et de caractères. Les caractères de la version 3.0 d'Unicode ont les mêmes identifiants que ceux de la norme ISO/CEI 10646:2000.
La version 3.2 d'Unicode classe 95 221 caractères, symboles et directives.
La version actuelle est la version 4.1 de 2005.
Des problèmes semblent cependant exister, pour le codage des caractères chinois .
La limite de l'octet
Là où l'ASCII utilisait jadis 7 bits et ISO 8859-1 8 bits (comme la plupart des pages de codes nationales), Unicode, qui rassemble les caractères de chaque page de code, avait besoin d'utiliser plus que les 8 bits d'un octet. La limite fut dans un premier temps fixée à 16 bits puis est désormais placée entre 20 et 21 bits par caractère.
UTF, Unicode Transformation Format
Dans un but de compression simple et raisonnable, Unicode accepte plusieurs formes de présentation pour représenter un caractère (au sens de symbole). Citons :
- UTF-8 ;
- UTF-16 ;
- UTF-32.
Le chiffre après UTF représente le nombre minimal de bits avec lequel un caractère est codé.
UTF-8
L'UTF-8, spécifié dans le RFC 2279, est le plus commun pour les applications Internet. Son codage de taille variable lui permet d'être en moyenne moins coûteux en occupation mémoire. Mais cela ralentit nettement les opérations où interviennent des extractions de sous-chaînes, car il faut compter les caractères depuis le début de la chaîne pour savoir où se trouve le premier caractère à extraire. L'UTF-8 assure aussi une compatibilité avec les manipulations simples de chaînes en ASCII dans les langages de programmation.
UTF-16
L'UTF-16 est un bon compromis lorsque la place mémoire n'est pas trop restreinte, car la très grande majorité des caractères Unicode assignés pour l'instant, qui sont les caractères les plus fréquemment utilisés, peut être représentée sur 16 bits.
Il a l'avantage que tous les caractères prennent, au minimum, la même place (2 octets).
C'est notamment l'encodage qu'utilise la plateforme Java en interne.
UTF-32
L'UTF-32 est utilisé lorsque la place mémoire n'est pas un problème et que l'on a besoin d'avoir accès à des caractères de manière directe et sans changement de taille (hiéroglyphes).
Les polices de caractères Unicode
Avant de parler de police Unicode, il faut bien comprendre un principe essentiel : dire qu'Unicode code des caractères revient à dire qu'il attribue un numéro à des symboles. Unicode ne code en revanche pas les descriptions des caractères, les glyphes, c'est-à-dire la représentation graphique du caractère. Il n'y a donc pas une bijection entre la représentation du caractère et son numéro comme c'est le cas dans une police ASCII ou latin-1 classique.
Ainsi, le caractère français é peut-il être décrit de deux manières : soit en utilisant directement le numéro correspondant au é, soit en faisant suivre le numéro du 'e' par celui de l'accent aigu sans chasse. Quelle que soit l'option choisie le même glyphe sera affiché. On dira du premier caractère qu'il est précomposé, du second que c'est une composition (deux caractères forment un seul glyphe composé des deux). De nombreux glyphes sont dans ce cas et peuvent être codés de ces deux manières. Le plus souvent, le glyphe précomposé est préférable (c'est le cas pour le grec polytonique, par exemple, lequel, codé en décomposition, peut ne pas être satisfaisant graphiquement : selon les polices de caractères, les différents constituants du glyphe étant parfois mal disposés et peu lisibles).
De même, certains systèmes d'écriture, comme la devânagarî ou les caractères arabes, nécessitent un traitement complexe des ligatures : les graphèmes changent en effet de forme en fonction de leur position et/ou par rapport à leurs voisines (cf. Variante contextuelle et Lettre conjointe).
On comprend donc que le terme de police Unicode doit être utilisé très prudemment. Avoir une police qui représente un certain nombre ou toutes les représentations graphiques que l'on peut obtenir avec Unicode n'est pas suffisant, il faut en plus que le système d'affichage possède les mécanismes de représentation idoines (ce que l'on nomme le moteur de rendu) capable de gérer les ligatures, variantes contextuelles et formes conjointes de certaines écritures. Au contraire, une police qui ne représente que certains caractères mais qui sait comment les afficher mérite mieux le terme de police Unicode.
Le moteur de rendu doit comporter dans certains cas des informations sur les coupures de lettres. Ainsi la lettre allemande s/z, lorsqu'elle se trouve sur une coupure, se traduit en deux s : un avant et un après la coupure.
Détails techniques
Bibliothèques logicielles
La bibliothèque multiplateforme ICU permet de manipuler des données unicodées. Un support d'Unicode spécifique à certaines plateformes (non compatible quant au code-source) est également fourni par les systèmes modernes (Java, MFC, GNU/Linux).
Partitionnement
Le partitionnement à jour peut être trouvé sur le site officiel d'Unicode. Cependant, vu le rôle important d'Unicode, (ISO 10646) on décrira ici les principaux blocs de caractères. Les noms français sont les noms officiels de l'ISO/CEI 10646, la norme internationale bilingue qui reprend les mêmes caractères qu'Unicode. Ils sont aussi officiels que les noms anglais.
# Note: La casse des noms de bloc n'est pas normative.
# « Latin de base » est donc équivalent à « LATIN DE BASE »
#
#
# Code de début ..Code de fin; nom du Bloc
0000..007F; Latin de base
0080..00FF; Supplément Latin-1
0100..017F; Latin étendu A
0180..024F; Latin étendu B
0250..02AF; Alphabet phonétique international (API)
02B0..02FF; Lettres modificatives avec chasse
0300..036F; Diacritiques
0370..03FF; Grec et copte
0400..04FF; Cyrillique
0500..052F; Supplément cyrillique
0530..058F; Arménien
0590..05FF; Hébreu
0600..06FF; Arabe
0700..074F; Syriaque
0780..07BF; Thâna
0900..097F; Dévanâgarî
0980..09FF; Bengali
0A00..0A7F; Gourmoukhî
0A80..0AFF; Goudjerate
0B00..0B7F; Oriya
0B80..0BFF; Tamoul
0C00..0C7F; Télougou
0C80..0CFF; Kannara
0D00..0D7F; Malayalam
0D80..0DFF; Singhalais
0E00..0E7F; Thaï
0E80..0EFF; Lao
0F00..0FFF; Tibétain
1000..109F; Birman
10A0..10FF; Géorgien
1100..11FF; Jamos hangûl
1200..137F; Éthiopien
13A0..13FF; Chérokî
1400..167F; Syllabaires autochtones canadiens
1680..169F; Ogam
16A0..16FF; Runes
1700..171F; Tagalog ou tagal
1720..173F; Hanounóo
1740..175F; Bouhid
1760..177F; Tagbanoua
1780..17FF; Khmer
1800..18AF; Mongol
1900..194F; Limbu
1950..197F; Taï-le
19E0..19FF; Symboles khmers
1D00..1D7F; Supplément phonétique
1E00..1EFF; Latin étendu additionnel
1F00..1FFF; Grec étendu
2000..206F; Ponctuation générale
2070..209F; Exposants et indices
20A0..20CF; Symboles monétaires
20D0..20FF; Signes combinatoires pour symboles
2100..214F; Symboles de type lettre
2150..218F; Formes numérales
2190..21FF; Flèches
2200..22FF; Opérateurs mathématiques
2300..23FF; Signes techniques divers. 2336 à 237A = symboles APL
2400..243F; Pictogrammes de commande
2440..245F; Reconnaissance optique de caractères
2460..24FF; Alphanumériques cerclés
2500..257F; Filets
2580..259F; Pavés
25A0..25FF; Formes géométriques
2600..26FF; Symboles divers
2700..27BF; Casseau
27C0..27EF; Divers symboles mathématiques - A
27F0..27FF; Supplément A de flèches
2800..28FF; Combinaisons Braille
2900..297F; Supplément B de flèches
2980..29FF; Divers symboles mathématiques-B
2A00..2AFF; Opérateurs mathématiques supplémentaires
2B00..2BFF; Divers symboles et flèches
2E80..2EFF; Formes supplémentaires des clés CJC
2F00..2FDF; Clés chinoises (K'ang-hsi ou Kangxi)
2FF0..2FFF; Description idéophonographique
3000..303F; Symboles et ponctuation CJC
3040..309F; Hiragana
30A0..30FF; Katakana
3100..312F; Bopomofo
3130..318F; Jamos de compatibilité hangûl
3190..319F; Kanboun
31A0..31BF; Bopomofo étendu
31F0..31FF; Extension phonétique katakana
3200..32FF; Lettres et mois CJC cerclés
3300..33FF; Compatibilité CJC
3400..4DB5; Supplément A aux idéophonogrammes unifiés CJC
4DC0..4DFF; Hexagrammes du Classique des mutations ou Yi-king
4E00..9FA5; Idéophonogrammes unifiés CJC
A000..A48F; Syllabaire yi des Monts frais
A490..A4CF; Clés yi
AC00..D7A3; Hangûl
D800..DB7F; Demi-zone haute
☒DB80..DBFF; Partie à usage privé de la demi-zone haute
DC00..DFFF; Demi-zone basse
☒E000..F8FF; Zone à usage privé
F900..FAFF; Idéogrammes de compatibilité CJC
FB00..FB4F; Formes de présentation alphabétiques
FB50..FDFF; Formes A de présentation arabes
FE00..FE0F; Sélecteurs de variante
FE20..FE2F; Demi-signes combinatoires
FE30..FE4F; Formes de compatibilité CJC
FE50..FE6F; Petites variantes de forme
FE70..FEFF; Formes B de présentation arabes
FF00..FFEF; Formes de demi et pleine chasse
FFF0..FFFF; Caractères spéciaux
10000..1007F; Syllabaire linéaire B ou syllabaire mycénien
10080..100FF; Idéogrammes du linéaire B
10100..1013F; Nombres égéens
10300..1032F; Alphabet italique
10330..1034F; Gotique
10380..1039F; Ougaritique
10400..1044F; Déséret
10450..1047F; Shavien
10480..104AF; Osmanya
10800..1083F; Syllabaire chypriote
1D000..1D0FF; Symboles musicaux byzantins
1D100..1D1FF; Symboles musicaux occidentaux
1D300..1D35F; Symboles du Classique du mystère suprême
1D400..1D7FF; Symboles mathématiques alphanumériques
#
20000..2A6D6; Supplément B aux idéogrammes unifiés CJC
2F800..2FA1F; Supplément aux idéogrammes de compatibilité CJC
#
E0000..E007F; Étiquettes
E0100..E01EF; Supplément de sélecteur de variante
#
☒FFF80..FFFFF; Zone supplémentaire A à usage privé
☒10FF80..10FFFF; Zone supplémentaire B à usage privé
Les zones à usage privé indiquées par le symbole ☒ ne contiennent pas les mêmes œils d'une police à l'autre et doivent donc être évités.
Voir aussi
- Caractère asiatiques
- Aide:Caractères spéciaux
- Caractères APL/APL2 en Unicode
- ASCII
- EBCDIC
- ISO/CEI 10646
- Aide:Unicode
- Wikipédia:Unicode/Test
- Table des caractères unicode (complète, très lourde : 671 Ko)
- Table des caractères unicode divisée :
- de 0 à 4095 - de 4096 à 8191 - de 8192 à 12287 - de 12288 à 16383
- de 16384 à 20479 - de 20480 à 24575 - de 24576 à 28671 - de 28672 à 32767
- de 32768 à 36863 - de 36864 à 40959 - de 40960 à 45055 - de 45056 à 49151
- de 49152 à 53247 - de 53248 à 57343 - de 57344 à 61439 - de 61440 à 65535
Liens externes
- [http://www.unicode.org Page d'accueil du consortium Unicode] (anglais);
- [http://hapax.qc.ca traduction française officielle de l'ISO/CEI 10646 et Unicode] (français);
- [http://www.decodeunicode.org/ DecodeUnicode - Unicode WIKI], chaque charactère du BMP d'Unicode avec 50.000 gifs dans trois tailles (anglais, allemand)
- Chapitres 2, 3, et 4 du livre [http://www.oreilly.fr/catalogue/284177273X.html Fontes et codages] ;
- [http://www.cs.uu.nl/~otfried/Mule/unihan.html essai] sur le problème han (en anglais) ;
- [http://www.tron.org page d'accueil de TRON] ;
- [http://www.alanwood.net/unicode/ site recensant les différents blocs d'Unicode avec pages de tests, conseils et liens vers les polices permettant d'afficher les blocs en question] ;
- [http://unicode.coeurlumiere.com/ table des caractères Unicode de 1 à 65535] ;
- [http://www.unicode.org/reports/tr10/ la question du tri] ;
- [http://hapax.qc.ca/BabelMap_fr.html graticiel BabelMap (éditeur de police Unicode UTF8, UTF16, UTF32)] ;
- [http://www.cl.cam.ac.uk/~mgk25/unicode.html UTF-8 and Unicode FAQ] de Markus Kuhn, article très complet (en anglais).
- [http://masculinehygiene.com/sburke/unicode_sliderule/ The Unicode Sliderule] : un outil web de saisie de caractères.
Autres références
- http://www.freenix.fr/unix/linux/HOWTO/Unicode-HOWTO-1.html
- http://sivanataraja.free.fr/config/test.htm : exemple d'utilisation d'Unicode.
- RFC3718, RFC3492, RFC2482, RFC2044, RFC1642, RFC1641
Catégorie:Unicode Catégorie:Norme
ja:Unicode
ko:유니코드
th:ยูนิโคด
zh-min-nan:Thong-iōng-bé
Alphabet phonétique international
L'alphabet phonétique international (API) est un alphabet utilisé pour la transcription phonétique des sons du langage parlé. Contrairement aux nombreuses autres méthodes de transcription qui se limitent à des familles de langues, l'API est prévu pour couvrir l'ensemble des langues du monde. Développé par des phonéticiens britanniques et français sous les auspices de l'Association phonétique internationale, il a été publié en 1888. Sa dernière révision date de 1993.
La transcription phonétique en API consiste à découper la parole en segments sonores supposés atomiques, et à employer un symbole unique pour chacun de ceux-ci, en évitant les combinaisons de lettres : par exemple, le son ch du français est noté [], le gli italien se transcrit [].
Le nombre de caractères principaux de l'API est de 118 ce qui permet de couvrir les sons les plus fréquents. Ces caractères sont pour la plupart des lettres grecques ou latines ou des modifications de celles-ci : , , , tirés de r ; , tirés de e. Les sons moins fréquents sont transcrits à partir des précédents en indiquant une modification du mode ou du point d'articulation par le biais d'un ou plusieurs signes diacritiques (au nombre de 76) sur le caractère principal : par exemple, le b du castillan caber (« tenir, rentrer dans ») est transcrit [] pour indiquer une spirante au lieu de la fricative bilabiale sonore [β]. Il existe également des symboles spéciaux pour noter des phénomènes suprasegmentaux, comme les tons mélodiques ou l'accent tonique : [], transcription de l'allemand dulden (« supporter, tolérer ») indique un accent tonique d'intensité sur la première syllabe (') et un n final vocalisé ( ).
On notera que l'usage linguistique est d'indiquer la transcription phonétique d'un mot entre crochets ; l'utilisation de barres obliques indique une transcription phonologique, c'est-à-dire qui oppose les traits pertinents des différents sons d'une langue donnée sans entrer dans le détail de leur prononciation.
L'utilisation de l'API est maintenant établie dans l'enseignement, l'apprentissage et l'étude des langues. Notamment, la plupart des dictionnaires bilingues utilisent cet alphabet ou une transcription phonologique qui en est inspirée. L'API est également un outil essentiel pour rendre à l'écrit les langues jusqu'à présent non écrites : de nombreuses langues d'Afrique se sont dotées d'une orthographe utilisant comme signes complémentaires des caractères de l'API ; un exemple typique est l'alphabet pan-nigérian.
Histoire
L'API a été développé au départ par des professeurs de langue britanniques et français sous la direction de Paul Passy dans le cadre de l'Association phonétique internationale, fondée à Paris en 1886 sous le nom de Dhi Fonètik Tîcerz' Asóciécon. La première version de l'API, publiée en 1888, était inspirée de l'alphabet romique d'Henry Sweet, lui-même élaboré à partir de l'alphabet phonotypique d'Isaac Pitman et Alexander John Ellis.
L'API a connu quatre révisions en 1900, 1932, 1989 et 1993.
Description de l'alphabet
Image : Fiche récapitulative de l'API. (en anglais)
Voyelles
Segments
L'API possède des caractères principaux pour les voyelles orales les plus courantes qui sont classées selon
- leur degré d'aperture : voyelles hautes (fermées), hautes inférieures, moyennes supérieures (mi-fermées), moyennes, moyennes inférieures (mi-ouvertes), basses supérieures, basses (ouvertes) ;
- leur point d'articulation : antérieur, quasi-antérieur, central, quasi-postérieur, postérieur ;
- leur caractère arrondi ou non.
Les autres sont transcrites à partir des voyelles prédéfinies par adjonction d'un ou plusieurs diacritiques modifiant l'articulation
Par exemple,
- les nasales du français standard sont (on), (hein), (un), (en) ;
- le /o/ bref du hongrois (par ex. kor, heure) est moins antérieur et légèrement plus ouvert que le /o:/ long (par ex. kór, maladie), une transcription soigneuse le donne comme [].
Quantité
La quantité des voyelles est indiquée comme suit :
Par exemple, Pose cette rose ! est souvent réalisé en français familier parisien [].
Tonèmes
La transcription des tonèmes suit le procédé ci-dessous.
- Pour certains tons dont le profil de hauteur est simple on utilise soit un diacritique soit un pictogramme représentant la hauteur du ton ou un accent (par exemple : ton de hauteur constante haut, mi-haut, médian, mi-bas, bas)
- Pour les tons dont le profil de hauteur est plus complexe seul un pictogramme représentant le profil du ton est prévu. Par exemple, il est possible de rendre le mandarin 我叫张 (« Je m'appelle Zhang ») par []1.
Notes :
# Il n'existe pas encore de standard informatique permettant d'afficher correctement les pictogrammes pour les tons de hauteur variable ainsi que certains diacritiques correspondants ; ci-dessus sont affichés à la suite les pictogrammes correspondant aux différentes hauteurs prises par le ton. Le tracé correct des diacritiques et des pictogrammes est donné sur la fiche récapitulative de l'API.
# La notation numérique des tons en exposant, par exemple 我姓张 [w214 51 tŋ5] est souvent utilisée pour pallier la piètre gestion des tons de l'API par les ordinateurs actuels. Cette notation n'est pas standard et son format dépend des familles de langues étudiées.
Consonnes
Segments
L'API classe les consonnes selon trois critères :
- le mode d'articulation ;
- le point d'articulation ;
- le caractère sourd ou voisé.
Comme pour les voyelles, des diacritiques permettent d'indiquer une modification du point ou du mode d'articulation afin transcrire des consonnes qui n'ont pas de symbole principal.
Par exemple,
- le t dental français est transcrit [] à partir de la plosive alvéolaire [t] ;
- le m dévoisé du français isthme est transcrit [] à partir de l'occlusive nasale voisée [m] ;
- la spirante bilabiale du castillan du mot caber (tenir dedans), allophone de /v/, est notée [] à partir de la fricative bilabiale [β].
Quantité
La quantité des consonnes est indiquée de la même manière que pour les voyelles. Le hongrois mit mondott? (qu'as-tu dit ?) sera transcrit [], phonologiquement /mit mondotː/.
Vocalisation
Une consonne vocalisée, c'est-à-dire servant de sommet à une syllabe, comporte un trait vertical souscrit :
- allemand reden (parler) : [] ;
- tchèque Brno (Brno) : [] ;
- anglais whistle (siffler) : [].
Syllabes
Les syllabes accentuées sont précédées d'une barre verticale :
- en exposant pour l'accent primaire : ;
- au niveau de la ligne de base pour les accents secondaires : .
Un point (.) sépare les syllabes.
Par exemple, l'allemand Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz (loi sur le transfert de responsabilité de la surveillance de l'étiquettage de la viande bovine) se transcrit : [].
Unicode
Le jeu de caractères Unicode permet d'écire l'ensemble de l'API, à l'exception des indications tonales complexes. Les symboles et diacritiques se situent dans les blocs de caractères suivants :
- U+0000 à U+007F : latin de base ;
- U+0080 à U+00FF : supplément latin-1 ;
- U+0250 à U+02AF : alphabet phonétique international ;
- U+02B0 à U+02FF : lettres modificatives avec chasse ;
- U+0300 à U+036F : diacritiques ;
- U+0370 à U+03FF : grec et copte ;
- U+A700 à U+A71F : lettres tonales modificatives.
Certains caractères précomposés (avec diacritiques) sont accessibles dans les blocs suivants :
- U+0080 à U+00FF : supplément latin-1 ;
- U+0100 à U+017F : latin étendu A ;
- U+0180 à U+024F : latin étendu B ;
- U+1E00 à U+1EFF : supplément latin étendu.
Voir aussi
Bibliographie
- API
- Handbook of the International Phonetics Association: A Guide to the Use of the International Phonetic Alphabet ISBN 0-521-63751-1
- Élements de linguistique générale, André Martinet, ISBN 2-200-26573-5
- exemples linguistiques
- allemand : Duden, die Grammatik, ISBN 3-411-04046-7
- anglais : [http://dictionary.cambridge.org/ Cambridge Dictionary of American English], ISBN 0-521-77974-X
- mandarin : [http://www.mandarintools.com/cedict.html CEDICT]
Liens internes
- linguistique
- phonologie
- phonétique
- segment
- accent tonique
- ton
- transcription
- liste des méthodes de transcription
- SAMPA, une transcription de l'API en caractères ASCII
- Kirshenbaum, une transcription de l'API en caractères ASCII
- alphabet
- caractère
- diacritique
- confusions possibles
- alphabet radio
Liens externes
- [http://www2.arts.gla.ac.uk/IPA/ipa.html Site officiel de l’Association phonétique internationale] (en anglais).
- API en HTML
- tableau officiel
- [http://www.linguiste.org/phonetics/ipa/chart/ API sur www.linguiste.org] (en anglais)
- [http://sivanataraja.free.fr/api/ API et quelques symboles additionnels sur sivanataraja.free.fr]
- liste des symboles officiels
- [http://www.alanwood.net/unicode/phonetic_extensions.html caractères de l'API sur www.alanwood.net]
- [http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm caractères de l'API sur www.phon.ucl.ac.uk]
- machine à écrire phonétique interactive
- [http://www.linguiste.org/phonetics/ipa/chart/keyboard/ clavier phonétique sur www.linguiste.org]
- [http://www.ling.su.se/fon/IPA-tecken.htm clavier phonétique sur www.ling.su.se]
- versions étendues de l’API
- [http://venus.unive.it/canipa/ IPA, système de Luciano Canepari] (documents PDF en anglais)
- API en Unicode sur le [http://www.unicode.org site du consortium Unicode] (documents PDF en anglais) :
- [http://www.unicode.org/charts/PDF/U0000.pdf latin de base]
- [http://www.unicode.org/charts/PDF/U0250.pdf alphabet phonétique international]
- [http://www.unicode.org/charts/PDF/U02B0.pdf lettres modificatives avec chasse]
- [http://www.unicode.org/charts/PDF/U0300.pdf diacritiques]
- [http://www.unicode.org/charts/PDF/U0370.pdf grec et copte]
- [http://www.unicode.org/charts/PDF/UA700.pdf lettres tonales modificatives]
- [http://www.unicode.org/charts/PDF/U0080.pdf supplément latin-1]
- [http://www.unicode.org/charts/PDF/U0100.pdf latin étendu A]
- [http://www.unicode.org/charts/PDF/U0180.pdf latin étendu B]
- [http://www.unicode.org/charts/PDF/U1E00.pdf supplément latin étendu]
Catégorie:Linguistique Catégorie: Méthode de transcription Catégorie:Phonétique API
als:IPA
ja:国際音声記号
ko:국제 음성 기호
th:สัทอักษรสากล
zh-min-nan:Kok-chè Im-phiau
Alphabet latinL'alphabet latin est l'alphabet qu'on utilise majoritairement pour écrire les langues d'Europe occidentale ainsi que dans les pays qui ont été colonisés par les Européens. C'est, en concurrence avec l'alphabet cyrillique et, dans une bien moindre part, l'alphabet grec, l'écriture occidentale par défaut et maintenant – en raison de l'importance économique et culturelle de pays l'utilisant (comme les États-Unis) une écriture internationale : on peut trouver des mots écrits en lettres latines dans les rues du Japon comme dans celles de l'Égypte.
On nomme cet alphabet ainsi car c'était, à l'origine, celui des Romains et de leur langue, le latin.
Lettres
L'alphabet latin, comme la majorité de ceux issus de l'alphabet grec, est bicaméral : on utilise deux graphies pour chaque graphème (ou lettre), l'une dite minuscule, l'autre capitale. Dans la majorité des cas, chaque lettre possède les deux variantes. Il existe cependant quelques exceptions, comme la lettre ß (eszett ; utilisée en allemand et autrefois dans d'autres langues, dont le français), qui, en capitales, est remplacée par SS.
L'expansion – tant géographique que temporelle – de cet alphabet en fait l'un des plus riches en variantes nationales. Ainsi :
- chaque langue donnée utilise un jeu plus ou moins complet de lettres fondamentales ;
- chacune peut en posséder des lettres modifiées qui s'y ajoutent ;
- parmi les lettres modifiées, certaines sont considées, selon les langues, comme des lettres à part entière ou comme des variantes d'une autre lettre.
Par exemple, les alphabets utilisés pour le français et pour le castillan ne sont pas identiques (ainsi, la lettre ç ne s'emploie pas en castillan et le français, à l'inverse ne se sert pas de á), bien que tous deux puissent être ramenés à l'alphabet latin. En sorte, il ne serait pas faux de parler d'un alphabet français et d'un alphabet castillan.
On le voit, il n'existe rien tel qu'un alphabet latin figé et constant ; il est cependant possible d'isoler les graphèmes fondamentaux utilisés dans une majorité de langues : ce sont ceux de l'alphabet des origines (voir plus bas, section « Histoire ») plus j et u ainsi que g et w, soient :
Graphèmes fondamentaux
cellpadding="8"
|+ Capitales
|- style="font-size:20px;"
| A || B || C || D || E || F || G || H || I || J || K || L || M
|- style="font-size:20px;"
| N || O || P || Q || R || S || T || U || V || W || X || Y || Z
|{{XIXe siècle{entête tableau simple style|text-align: center;
Lettres supplémentaires de l'alphabet latin
L'alphabet latin, utilisé depuis des siècles pour noter la majorité des langues d'Europe occidentale (puis, après les colonisations, partout dans le monde), a souvent dû être complété : sa version historique ne possède en effet pas assez de graphèmes pour noter tous les phonèmes des langues qui l'utilisent. Pour ce faire, on lui a ajouté des lettres supplémentaires, soit par simple utilisation de digrammes et de diacritiques, soit par construction de nouveaux graphèmes.
Les méthodes de transcriptions et translittérations de langues qui n'utilisent pas l'alphabet latin font également beaucoup appel à des lettres supplémentaires.
Caractères ajoutés
Cette table récapitule quelques graphèmes qui ont été ou sont encore utilisés et qui ne rentrent pas dans le cadre de l'alphabet latin standard. Sont précisées les langues qui utilisent chacun d'eux ; les langues mortes étant indiquées en italique. Les caractères spécifiques à l'alphabet phonétique international ne sont pas repris ici.
Caractères modifiés
Diacritiques
Article détaillé : Diacritiques de l'alphabet latin.
Une façon simple de transcrire un phonème est d'utiliser un diacritique sur une lettre proche. Si en français les lettres diacritées ne sont pas considérées comme distinctes, il en va autrement pour d'autres langues.
Ligatures
Article détaillé : Ligature (typographie).
Voir aussi
Liens internes
- Alphabet latin
- Diacritiques de l'alphabet latin
- Digramme
- Lettres supplémentaires de l'alphabet grec
- Ligature (typographie)
- Ordre alphabétique
- Variante contextuelle
-
Catégorie:Méthode de transcriptionCette liste recense, classées par mot-clef, les différentes méthodes de transcription et translittération utilisées en linguistique (surtout en phonétique et phonologie).
À ajouter : transcription des langues slaves, transcription des langues indiennes, transcription de l'indo-européen, transcription des langues caucasiennes, transcription des langues amérindiennes, transcription des langues chinoises, romaja.
Catégorie:LinguistiqueCatégorie:Phonétique
Catégorie:Alphabet Article principal
- Alphabet
A créer
- alphabet nubien
- alphabet nabatéen
- alphabet sogdien
catégorie:écriture
Liste der Horror-AutorenListe von einigen bekannten Autoren des Horror Genre:
B
- Clive Barker
- Algernon Blackwood
- Robert Bloch
- Poppy Z. Brite
C
- Ramsey Campbell
- Jonathon Carroll
- Nancy A. Collins
- Caroline B. Cooney
D
- August Derleth
F
- Sheridan le Fanu
H
- Laurell K. Hamilton
- Nathaniel Hawthorne
- James Herbert
- Brian Hodge
- William Hope Hodgson
- E.T.A. Hoffmann
J
- M.R. James
K
- Stephen King
- Dean R. Koontz
L
- H.P. Lovecraft
- Brian Lumley
M
- Arthur Machen
- Walter de la Mare
- Charles Robert Maturin
- Robert R. McCammon
N
- Jonathan Nasaw
- Kim Newman
O
- Joyce Carol Oates
P
- Edgar Allan Poe
R
- Anne Rice
S
- John Saul
- Mary Wollstonecraft Shelley
- Clark Ashton Smith
- Bram Stoker
- Peter Straub
T
- Cate Tiernan
V
- Ernst Vlcek
Siehe auch:
- Liste der Listen mit Schriftstellern
- Science-Fiction-Autoren
- Fantasy-Autoren
Weblinks
- http://directory.google.com/Top/Arts/Literature/Authors/Horror/
!Liste der Horror-Autoren
Horror-Autoren
Hotels Warsaw gry strategiczne cukrzyca tablice last minute egipt
|
|
|
| :: RELATED NEWS :: |
TSV 1860 Monachium
TSV 1860 Monachium, znany także jako "Lwy" (niem. Die Löwen), jest niemieckim klubem sportowym, liczącym około 20 000 członków, założony po raz pierwszy 15 lipca 1848, póżniej jego działalność została zakazana wskutek "republikańskich poglądów", reaktywowany 17 maja 1860 jako TSV München 1860 e.V.
|
Kominform
Kominform - Biuro Informacyjne Partii Komunistycznych i Robotniczych utworzone 27 września 1947 r. na naradzie partii komunistycznych i robotniczych w Szklarskiej Porębie - Józef Stalin zwołał konferencję w odpowiedzi na kontrowersje wśród komunistycznych rządów europejskich, czy wziąć udział w paryskiej konferencji dotyczące
|
Liczba Bonda
Liczba Bonda jest to jedna z liczb podobieństwa. Używana w mechanice płynów, wyraża stosunek sił grawitacji do napięcia powierzchoniowego:
gdzie:
- - gęstość
- |
John Jones Ross
John Jones Ross (1831-1901) – kanadyjski lekarz i polityk, premier prowincji Quebec z ramienia Konserwatywnej Partii Quebecu.
Urodzony w Quebecu 16 sierpnia
|
Gregorian
Gregorian - chór męski, pochodzący z Niemiec, w którego skład wchodzą mnisi.
Pomysł producenta muzycznego z Hamburga – Franka Petersona był nadzwyczajny: "Chór gregoriański śpiewa modne i znane piosenki, aranżowane w chóralnym stylu wczesno-średniowiecznych mnichów".
Już z pierwszymi albumami Gregorian Peterson i zespół jego producentów w latac
|
Sytuacja homoseksualistów we Francji i terytoriach zależnych
Prawa homoseksualistów we Francji
Francja jest pierwszym krajem na świecie który zalegalizował homoseksualizm w 1791 roku.
Jednak wiek dopuszczający kontakty seksualne, został zrównany dopiero w 1982 roku. Podobnie sytuacja się ma na terytoriach zależnych - Gwadelupa, Martynika,
|
Palmiro Togliatti
Palmiro Togliatti (ur. 26 marca 1893, zm. 21 sierpnia 1964) – przywódca włoskich komunistów.
Działalność polityczną rozpoczął przed I wojną światową, we Włoskiej Partii Socjalistycznej, po wojnie skupionej wokół turyńskiej gazety
|
Zejdu Badian
Zejdu Badian (także: Seydou Badian Kouyaté, ur. 1928) - malijski polityk i pisarz, tworzący w języku francuskim.
Po uzyskaniu przez Mali niepodległości w 1960 r. Badian zajął się polityką, jednak po wojskowym zamachu stanu w 1968 r. na siedem lat trafił do więzienia. Potem wyemigrował do Senegalu.
Badian pisał p
|
Seydou Badian
Zejdu Badian (także: Seydou Badian Kouyaté, ur. 1928) - malijski polityk i pisarz, tworzący w języku francuskim.
Po uzyskaniu przez Mali niepodległości w 1960 r. Badian zajął się polityką, jednak po wojskowym zamachu stanu w 1968 r. na siedem lat trafił do więzienia. Potem wyemigrował do Senegalu.
Badian pisał p
|
Operacja Czarodziejski Dywan
Operacja Czarodziejski Dywan (Operation Magic Carpet) - operacja przeprowadzona w okresie od czerwca 1949 do września 1950 r., w czasie której przewieziono samolotami 45 tys. Żydów z Jemenu do nowopowstałego państwa Izrael. 380 lotów odbyły amerykańskie i brytyjskie samoloty transportowane startujące z Adenu. Operacja b
|
|