Classement alphabétique

Un article de Freepedia.

(Redirigé depuis Ordre alphabétique)

Cette page est à recycler. Sa qualité peut être largement améliorée en l'organisant et en la clarifiant. Vous êtes encouragés à la restructurer et à la refondre afin de lui donner une allure et un style plus sérieux.


Si certains caractères de cet article s’affichent mal (carrés vides, points d'interrogation…), consultez la page Unicode.</div>


Le classement alphabétique (ou ordre alphabétique) est une façon d'ordonner des lettres ou des mots selon l'organisation d'un alphabet donné.

D'une manière plus formelle, ce terme désigne deux notions distinctes d'ancienneté différente :

  • la première est le classement des caractères d'un système d'écriture dans un ordre défini pour une langue donnée. Elle était déjà connue dans l'Antiquité ;
  • la seconde consiste à généraliser ce classement à des mots de plusieurs lettres. Cette découverte-là ne s'est faite qu'à Venise au début de la Renaissance. Son auteur l'expose dans la préface d'un dictionnaire qui a été le premier présenté de cette façon. Il est significatif de constater que le dictionnaire lui-même comprend plusieurs erreurs de placements de mots, mais moins à la fin qu'au début, ce qui suggère que l'auteur a lui-même mis un certain temps à maîtriser son propre système (source : Donald Knuth, The Art of Computer Programming, tome III : « Sorting and searching »).

Sommaire

Principes

Le principe fondamental consiste à comparer deux mots, caractère par caractère.

Si les n premiers caractères sont identiques, on prend le suivant. Si le n-ième caractère diffère, l'ordre est établi. Si le mot est fini, le mot est considéré comme venant en premier.

Il convient donc pour classer correctement de connaître :

  • l'ordre dans lequel sont classées les lettres d'un alphabet donné, ordre qui dépend de règles historiques différant d'une langue à l'autre même si elles utilisent un alphabet très proche ;
  • l'existence de graphèmes complexes (ligatures, digrammes) à prendre en compte (dans une langue, tel digramme comptera pour une lettre et aura son rang, dans telle autre, non).


Origines et histoire

Les documents archéologiques semblent indiquer que les lettres des différents alphabets ont toujours été enseignées dans un même ordre - propre à chaque alphabet -, peut-être pour des raisons mnémotechniques. L'ordre des lettres établi par l'alphabet linéaire et l'alphabet phénicien, par exemple, a été plus ou moins conservé par les alphabets qui en sont dérivés.

L'ordre alphabétique appliqué au classement des mots est un tout autre concept et son utilisation n'est pas évidente, même lorsque le classement des lettres d'un alphabet fait l'objet d'un consensus.

Les écritures alphabétiques, syllabiques ou alphasyllabiques du monde dotées d'une histoire ancienne ont toutes établi un classement de leurs graphèmes, tâche facilitée par le nombre réduit de signes. Les écritures logographiques, quant à elles, devant le nombre important de caractères, n'ont pu suivre de règles simples. On trouve ainsi de nombreuses manières de classer les sinogrammes (cf. Dictionnaires de sinogrammes).

Ordre levantin

Le premier ordre alphabétique est né avec le premier alphabet sémitique, celui d'Ougarit, un abjad cunéiforme. L'ordre est attesté sur plusieurs tablettes. Il s'est poursuivi dans un autre abjad sans lien pour la forme mais lié linguistiquement, celui du phénicien, d'où sont issus les principaux alphabets actuels : alphabet grec et ses avatars (alphabet gotique, cyrillique, latin en passant par l'étrusque), mais aussi alphabet araméen, syriaque, hébreu, arabe, etc.

C'est celui qui, maintenant l'un des plus célèbres, est désigné par le terme d'« ordre levantin », dans lequel on retrouve, souvent dissimulé par les évolutions propres à l'histoire de chaque alphabet et aux modifications qu'on a dû leur apporter pour les rendre aptes à noter la langue voulue (modifications « aggravées » par le fait que les alphabets ont pu se transmettre via des langues très éloignées phonétiquement), le classement traditionnel (notation API) /ʔ/ (coup de glotte, remplacé par /a/ à partir du grec), /b/, /g/ (devenu /k/ noté par c dès le latin), /d/, /h/ (devenu /e/ à partir du grec), /w/ (devenu /f/ à partir du latin, issu du digamma grec), /z/ (remplacé par /g/ puis rejeté en fin d'alphabet à partir du latin), etc.

Certains alphabets ont même été entièrement réordonnés pour des raison graphiques afin d'en faciliter l'apprentissage, comme l'alphabet arabe (cf. aussi Histoire de l'alphabet arabe et Numération arabe, l'ordre originel réapparaissant dans la numération). Pour ces écritures, cependant, le choix d'un ordre alphabétique cohérent est toujours resté une priorité. Ainsi, l'insertion de la nouvelle lettre G /g/ latine ─ issue d'un C /k/ modifié (lettre provenant elle-même du Γ /g/ gamma grec prononcé /k/ par les Étrusques) ─ s'est faite sans altérer l'ordre alphabétique : la nouvelle lettre a en effet remplacé un Z inutile en latin, lequel, cependant, a été réintroduit plus tard à la fin de l'alphabet quand il s'est avéré nécessaire de noter des mots grecs, à la suite du Y, autre lettre reprise aux Grecs.

Ordre sudarabique

Outre l'ordre levantin, il en existe un autre, pour les écritures dérivées de l'alphabet linéaire, dit ordre sudarabique, lui aussi ancien mais plus limité dans ses représentations. Attesté en sudarabique (et dans quelques tablettes en ougaritique trouvées hors d'Ougarit, comme celle de Beth Šemeš), il s'est transmis au syllabaire éthiopien, qui en découle.

Ses premiers rangs sont les suivants (en transcription des langues sémitiques) : h, l, , m, q, w, š, r, etc.

Ordre indien

En Inde, et à la suite dans tous les alphasyllabaires dérivés de la brāhmī (devanāgarī, et autres écritures de l'Inde, alphabet tibétain, thaï, etc.) ou qui en sont inspirés (comme, plus lointainement et après de nombreuses réfections, les kanas japonais), le classement est entièrement revu : il se fait de manière rationnelle, les graphèmes étant classés en rangées selon leur point d'articulation, d'abord les occlusives notant des phonèmes prononcés au fond de la gorge en premier puis en remontant petit à petit vers les articulations labiales puis, enfin, en dernier rang des les sonantes, les sifflantes et les dernières fricatives. Dans chaque rangée, on trouve d'abord la consonne sourde puis la sourde aspirée, la sonore, la sonore aspirée puis la nasale. Les voyelles sont classées à part, souvent en tête de liste. Il est évident que, de la même manière que pour l'ordre levantin, de nombreuses réorganisations ont pris place, selon les langues.

Voici par exemple les premiers rangs consonantiques de la devanāgarī (en transcription des langues indiennes) : k, kh, g, gh, , c, ch, j, jh, ñ, , ṭh, , ḍh, , etc.

Alphabet grec et latin

Il est possible que la nécessité d'un ordre alphabétique n'apparaisse que lorsque l'on a quelque chose à ordonner. Il semblerait, par exemple, que l'ordre alphabétique ait commencé à être employé pour les alphabets latin et grec par les savants d'Alexandrie [1]. Par exemple, le « Recueil des mots qui se trouvent dans Hippocrate », attribué à Érotianus, utilise l'ordre alphabétique mais pas cependant de manière rigoureuse.

De fait, les dictionnaires et les lexiques ont vraisemblablement été les premiers ouvrages en alphabet latin à utiliser l'ordre alphabétique. Donald Knuth [2] mentionne un dictionnaire ancien, indiquant que l'ouvrage contient beaucoup d'erreurs de classement des mots à son début et bien moins à la fin, ce qui suggère que l'auteur a lui-même du se familiariser lentement avec son propre système.

Concernant l'Europe, l'ordre qui a semble-t-il prévalu jusqu'au milieu du Moyen Âge était le classement thématique, probablement pour des raisons religieuses (la Bible utilise un tel système). L'usage de l'ordre alphabétique, progressif, est peut-être lié à une modification de la façon de concevoir et d'organiser le monde à cette époque [3]. L'invention de l'imprimerie donnera finalement un coup d'accélérateur à un tel usage.

Ordre alphabétique dans différentes langues

Parmi les langues utilisant l'alphabet latin, l'ordre alphabétique peut différer :

  • En français et en anglais, les lettres présentant des diacritiques sont traitées comme celles qui n'en ont pas. En français, si deux mots ne diffèrent que d'un accent, le mot accentué est traditionnellement classé après.
  • En allemand, les umlaut (« Ä », « Ö », « Ü ») sont généralement traitées comme les lettres sans umlaut, mais il arrive pour les listes de noms qu'on les considère comme les combinaisons « Ae », « Oe » et « Ue ». « ß » est généralement ordonné comme « Ss ».
  • En suédois, « w » est perçu comme une variante de « V » et pas comme une lettre distincte. L'alphabet suédois utilise de plus trois voyelles considérées comme distinctes et placées à la fin : « Å », « Ä » et « Ö ». Les même conventions sont utilisées en finlandais.
  • En danois et en norvégien, l'alphabet se termine par « Æ », « Ø » et « Å ». Cette dernière lettre est parfois assimilée à « Aa ».
  • Le féringien possède plusieurs lettres supplémentaires : « Á », « Ð », « Í », « Ó », « Ú », « Ý », « Æ » et « Ø ». Les consonnes « C », « Q », « W », « X » et « Z » ne sont pas employées. Par conséquence, l'ordre alphabétique féringien diffère légèrement de l'ordre traditionnel de l'alphabet latin : A Á B D Ð E F G H I Í J K L M N O Ó P R S T U Ú V Y Ý Æ Ø.
  • En espagnol, l'ordre préconisé par l'Académie royale espagnole jusqu'en 1997 considérait « CH » et « LL » comme des lettres distinctes, placées respectivement après « C » et « L ». Depuis 1997, l'Académie a adopté l'usage conventionnel de les placer après « CG » et « LK ». En revanche, « Ñ » est toujours classé après « N ».
  • Le gallois possède des règles plus complexes : les combinaisons « CH », « DD », « FF », « NG », « LL », « PH » et « TH » sont parfois considérées comme des lettres uniques, ordonnées après le premier graphème de la combinaison, à l'exception de « NG », classé après « G ». Cependant, ces combinaisons ne sont pas toujours considérées comme des lettres uniques : par exemple, le gallois classe ainsi les mots suivants : LAWR, LWCUS, LLONG, LLOM, LLONGYFARCH. Le dernier de ces mots, qui juxtapose « LLON » et « GYFARCH », n'utilise pas la lettre « NG ».
  • En néerlandais, la combinaison « IJ » était précédemment soit considérée comme « Y », soit classée après celle-ci, mais est à l'heure actuelle le plus souvent classées entre « II » et « IK », sauf pour les noms propres.
  • En islandais, « Ð » suit « D » et « Þ » est ajoutée à la fin de l'alphabet.
  • En polonais, « Ą » suit « A », « Ć » suit « C », « Ę » suit « E », « Ł » suit « L », « Ń » suit « N », « Ó » suit « O », « Ś » suit « S », « Ź » et « Ż » suivent « Z ».
  • En tchèque et slovaque, les voyelles accentuées (« Á », « É », « Í », « Ó », « Ô », « Ú », « Ů » et « Ý ») ainsi que certaines consonnes présentant un háček (« Ď », « Ň » et « Ť ») sont considérées comme leur homographe non accentuée; si deux mots diffèrent d'un accent sur une voyelle, la mot accentué est placé après. « Č », « Ř », « Š » et « Ž » sont considérées comme des lettres distinctes et placées après leur homographe sans háček. De plus, « CH » est considérée comme une lettre à part entière, située entre « H » et « I ». En slovaque, « DZ » et « DŽ » sont placées entre « Ď » et « E ».
  • En esperanto, les lettres accentuées (« Ĉ », « Ĝ », « Ĥ », « Ĵ », « Ŝ » et « Ŭ ») sont des lettres distinctes, placées après les versions non accentuées.
  • En roumain, les lettres accentuées (« Ă », « Â », « Î », « Ş » et « Ţ ») sont des lettres distinctes, placées après les versions non accentuées.
  • En tatar, « ä » est considéré comme « a », « ö » comme « o », « ü » comme « u », « í » comme « i » et « ı » comme « e ». « Ş » est associée à « SH », « Ç » à « CH », « Ñ » à « NG » et « Ğ » à « GH ».
  • En croate, serbe et d'autres langues slaves du sud, « Č » et « Ć » suivent « C », « DŽ » et « Đ » suivent « D », « NJ » suit « N », « Š » suit « S » et « Ž » clot l'alphabet.
  • En filipino, « NG » et « Ñ » sont des lettres distinctes.

Exemples en français

  • ami, balance, butin, calin

La ligature œ (ou e dans l'o) est à considérer en français comme un o suivi d'un e (deux caractères) pour le classement alphabétique, alors que oe et œ ont deux rôles entièrement distincts en français :

  • moelle, mœurs
  • coefficient, cœur, coexistence

En première analyse les caractères accentués, de même que les majuscules, ont le même rang alphabétique que le caractère fondamental :

  • Marx, marxisme
  • règlement, réglementaire
  • rebelle, rébellion

Si plusieurs mots ont le même rang alphabétique, on tâche de les distinguer entre eux grâce aux majuscules et aux accents (pour le e, on a l'ordre e, é, è, ê) :

  • calvados, Calvados
  • légitime, légitimé
  • cher, cher

Ce double classement (sans puis avec les accents) donne au final  :

  • légitime, légitimé, légitimes, légitimés

À noter que la comparaison des caractères accentués se fait alors à l'envers en commençant par la dernière lettre :

  • élève, élevé

Source : Gouvernement du Québec

Classement alphabétique en castillan (ou espagnol)

Le cas du classement alphabétique dans cette langue, modifié en 1994, fait l'objet d'un article séparé.

Avantages et inconvénients

Avantages

Ceci permet de trouver facilement un mot dans une liste à toute personne sachant lire la langue dans laquelle elle effectue sa recherche.

Défaut du classement alphabétique, ou le désordre alphabétique

Le principal reproche fait au classement alphabétique, est que, sous une apparence de classement rigoureux et pensé, il mélange ce qu'il range. Car en fait, suivant l'ordre alphabétique (les documentalistes disent le désordre alphabétique) des notions ou des éléments n'ayant aucun point commun se retrouvent voisins, et au contraire, les articles concernant un même sujet se retrouvent éparpillés. Par exemple, en ouvrant au hasard un dictionnaire, on trouve ronin, ronron et Ronsard. Il eût mieux valu, par proximité de sens, placer le premier avec samouraï ou au moins Japon, le second à proximité de chat et le dernier avec poésie ou bien la Pléiade. C'est ainsi que le classement de nombreuses encyclopédies se fait d'abord par thème, puis le classement de ces thèmes est fait par ordre alphabétique (qui est donc secondaire).

Programmation

Les programmeurs d'application devront donc faire attention aux spécificités locales. Cf. Classement alphabétique informatisé.

Ordre ASCII

Notons que Wikipédia considère l'ordre ASCII comme un ordre alphabétique. Cf. cette page sur Meta.

Wikipédia sur ce point est touché par le bug 164. Pour les développeurs, on pourrait ajouter le commentaire suivant.

It looks like mySQL 4.1 support nationals collate of utf-8
http://dev.mysql.com/doc/mysql/en/Charset.html
http://bugzilla.wikipedia.org/show_bug.cgi?id=164

Classement alphabétique d'ensemble de mots

Une fois le classement alphabétique de mots défini, vient le classement alphabétique d'ensemble de mots : tous les mots n'ont pas la même importance. Par exemple, pour classer des personnes (carnet d'adresses, bibliographie, discographie, etc.), il est plus intéressant de classer 1° par nom puis 2° par prénom. Pour les personnes, le plus important c'est le nom : cela permet grouper celles et ceux qui ont peut-être un lien de parenté. Ce classement se révèle donc bien plus complexe, car il faut détermniner le nom, le prénom, etc. quelle que soit la langue.

Présentation du classement

La présentation de ce type de classement est délicate : comment indiquer au lecteur la logique du classement ? Il est préférable que le premier mot soit celui utilisé pour le classement.

Quelques exemples, une possibilité (utilisation de la virgule) :

  • Bach, Jean-Sébastien
  • Björk
  • Davis, Miles
  • Hancock, Herbie
  • Hooker, John Lee
  • Piaf, Edith
  • Skatalites, The

Une autre possibilité (utilisation des parenthèses) :

  • Bach (Jean-Sébastien)
  • Björk
  • Davis (Miles)
  • Hancock (Herbie)
  • Hooker (John Lee)
  • Piaf (Edith)
  • Skatalites (The)

Le plus délicat, c'est quand on ne connaît pas la langue : ses articles, ses prénoms, etc.

Méthode de classement de l'ensemble

On utilise nom et prénom dans beaucoup de langues, pour désigner une personne. Et en général, le nom est plus important que le prénom. Il faudra alors bien identifier le prénom et le nom (voir les différentes listes spécialisées), car il arrive parfois qu'un nom soit aussi un prénom… La présentation francophone veut que le prénom soit cité avant le nom, ce qui donne déjà un repère. Par exemple Pierre Henry, pourra être présenté comme Henry (Pierre) ou Henry, Pierre

L'article aussi n'a pas beaucoup d'importance pour le classement.

En français, les articles définis le, la, l', les… ne seront pas utilisés pour le classement.

En anglais, l'article the, a, an… ne sera pas utilisé pour le classement.

Exception :
  • en musique : The The

La gestion des chiffres (comme les signes de ponctuation) est délicate, il y a deux possibilités :

  • soit ils sont placés avant (ou après) les lettres de l'alphabet ;
  • soit ils sont écrits en toutes lettres.

Le cas des chiffres en lettres peut poser problème : le lecteur est amené à considérer la langue. Et pour les traductions qui ont gardé leur titre original, quelle langue utiliser ?

Exemple :

  • 2001 : l'odyssée de l'espace / Deux mille un : l'odyssée de l'espace
  • 2046 (réalisé par Wong Kar-Wai) / Deux mille quarante six ou Two thousand forty six ?
  • !!! / Chickchickchick ?

Parfois, le passage introductif n'est pas utilisé pour le classement, quand le nom / le titre est trop long.

Exemple :

  • …And You Will Know Us By The Trail Of Dead / Trail Of Dead (…And You Will Know Us By The)

Voir aussi

Articles connexes

Bibliographie

[1] Jonathon Green, Chasing the Sun: Dictionary-Makers and the Dictionaries They Made, Henry Holt & Co (1996) - ISBN 0712662162 [2] Donald Ervin Knuth, The Art of Computer Programming, Volume 3: Sorting and Searching, Addison-Wesley Professional; (1998) - ISBN 0201896850 [3] Michel Foucault, L'Ordre des choses



Views
Outils personels
Boîte à outils
Autres langues
Autres Liens