Caractères spéciaux : Différence entre versions

De WikiGenWeb
Aller à : navigation, rechercher
(Autres Ressources)
m (wikification)
Ligne 1 : Ligne 1 :
 
Quelque soit votre choix, soyez constant dans la notation
 
Quelque soit votre choix, soyez constant dans la notation
Pour suivre la norme orthographique utilisez la ligature oe minuscule (œ)   et majuscule (Œ) en utilisant un codage propriétaire (Windows) comme   le fait l'INSEE.   Inconvénient : risque d'illisibilité du caractère en cas   d'échanges avec certains environnements non-Windows  
+
Pour suivre la norme orthographique utilisez la ligature oe minuscule (œ) et majuscule (Œ) en utilisant un codage propriétaire (Windows) comme le fait l'INSEE. Inconvénient : risque d'illisibilité du caractère en cas d'échanges avec certains environnements non-Windows  
;'''Autre option :''': remplacez la ligature par «oe». Assure une communication   minimum du mot   Inconvénient : vous perdez une variété (richesse ?) orthographique   et si vous souhaitez restaurer la ligature oe ce sera à faire à   la main au cas par cas.
+
;'''Autre option :''': remplacez la ligature par «oe». Assure une communication minimum du mot Inconvénient : vous perdez une variété (richesse ?) orthographique et si vous souhaitez restaurer la ligature oe ce sera à faire à la main au cas par cas.
 
   
 
   
 
+
Le « Dénombrement de la population », publié par l'INSEE, est la source qui fixe la graphie officielle des noms des communes en France. C'est dans le « Code officiel géographique 2003 ». La liste des communes donnée par le fichier de l'INSEE donne deux écritures.
 
 
Le « Dénombrement de la population », publié par   l'INSEE, est la source qui fixe la graphie officielle des noms des communes   en France. C'est dans le « Code officiel géographique 2003 ».   La liste des communes donnée par le fichier de l'INSEE donne deux écritures.
 
 
   
 
   
 
+
*1. Nom en clair (majuscules) (NCC) - Libellé en lettres majuscules Dans ce cas le nom de la commune est entièrement en majuscule sans AUCUNE accentuation.
 
+
*2. Nom en clair (typographie riche) (NCCENR) - « Libellé en typographie riche, majuscules, minuscules, accentuation. ». En ce cas majuscule et minuscule sont accentués.
*1. Nom en clair (majuscules) (NCC) - Libellé en lettres majuscules   Dans ce cas le nom de la commune est entièrement en majuscule sans AUCUNE   accentuation.
 
*2. Nom en clair (typographie riche) (NCCENR) - « Libellé en typographie   riche, majuscules, minuscules, accentuation. ».   En ce cas majuscule et minuscule sont accentués.
 
 
   
 
   
 
+
*La « ligature oe minuscule » est utilisé dans 225 communes sur un total de 36 678.  
 
+
*La « ligature OE majuscule » est utilisée dans 4 communes (code Insee): Œuilly (02565), Œuilly (51410) et Œting (57521) et Œuf-en-Ternois (62633)  
*La « ligature oe minuscule » est utilisé dans 225 communes   sur un total de 36 678.  
+
*Le Y majuscule avec tréma n'apparait pas car aucune commune ne commence par ce caractère.  
*La « ligature OE majuscule » est utilisée dans 4 communes   (code Insee): Œuilly (02565), Œuilly (51410) et Œting (57521)   et Œuf-en-Ternois (62633)  
+
*[Le y tréma (ÿ) minuscule apparaît dans trois communes : Moÿ-de-l'Aisne (02532), Faÿ-lès-Nemours (77178), L'Haÿ-les-Roses (94038)]
*Le Y majuscule avec tréma n'apparait pas car aucune commune ne commence   par ce caractère.  
 
*[Le y tréma (ÿ) minuscule apparaît dans trois communes : Moÿ-de-l'Aisne   (02532), Faÿ-lès-Nemours (77178), L'Haÿ-les-Roses (94038)]
 
 
   
 
   
  
  
La préconisation serait donc d'écrire le nom des communes avec   cette ligature oe. C'est l'écriture officielle et normalisée .   MAIS le problème commence avec l'échange des données et   tout particulièrement pour transmettre le nom d'une commune contenant   le caractère «ligature oe minuscule ». En effet ce caractère   est inexistant dans plusieurs normes utilisés par les logiciels.
+
La préconisation serait donc d'écrire le nom des communes avec cette ligature oe. C'est l'écriture officielle et normalisée . MAIS le problème commence avec l'échange des données et tout particulièrement pour transmettre le nom d'une commune contenant le caractère «ligature oe minuscule ». En effet ce caractère est inexistant dans plusieurs normes utilisés par les logiciels.
 
   
 
   
 
+
;'''ISO-8859-1 aussi nommée ISO-Latin-1''': Pour simplifier cette norme internationale est fiable et utilisée par la quasi-totalité des systèmes. Mais elle ne contient justement pas le caractère « ligature oe minuscule » (idem pour l'équivalent majuscule). Elle est utilisée sur Usenet et aussi pour la réaliser et visualiser un site Internet (pour simplifier, un internaute devra posséder sur son ordinateur la police de caractère appropriée pour visualiser correctement ce caractère). Risque : vous saisissez la commune de Vendouvres (code Insee 36232) avec la ligature. Au moment d'une transmission (via usenet ou sur un site ou même sur l'ordinateur d'un correspondant) vous n'avez plus que - par exemple - «Vend ?uvres».
 
 
;'''ISO-8859-1 aussi nommée ISO-Latin-1''':   Pour simplifier cette norme internationale est fiable et utilisée par   la quasi-totalité des systèmes. Mais elle ne contient justement   pas le caractère « ligature oe minuscule » (idem pour l'équivalent   majuscule).   Elle est utilisée sur Usenet et aussi pour la réaliser et visualiser   un site Internet (pour simplifier, un internaute devra posséder sur son   ordinateur la police de caractère appropriée pour visualiser correctement   ce caractère).   Risque : vous saisissez la commune de Vendouvres (code Insee 36232) avec la   ligature.   Au moment d'une transmission (via usenet ou sur un site ou même sur l'ordinateur   d'un correspondant) vous n'avez plus que - par exemple - «Vend ?uvres».
 
 
   
 
   
 
+
;'''ISO-8859-15 aussi nommée ISO-Latin-9''': Définit quelques nouveaux caractères dont la « ligature oe minuscule » (idem pour l'équivalent majuscule). Mais elle est peu répandue (dans les logiciels et ordinateurs). Ce qui fera que le caractère « ligature oe minuscule » risque de ne pas être correctement visualisé ailleurs.
 
 
;'''ISO-8859-15 aussi nommée ISO-Latin-9''':   Définit quelques nouveaux caractères dont la « ligature   oe minuscule » (idem pour l'équivalent majuscule).   Mais elle est peu répandue (dans les logiciels et ordinateurs). Ce qui   fera que le caractère « ligature oe minuscule » risque de   ne pas être correctement visualisé ailleurs.
 
 
   
 
   
 
+
;'''US-ASCII''': Tout le monde le comprend mais cette norme ne compte aucun caractère accentué et donc pas les ligatures.
 
 
;'''US-ASCII''':   Tout le monde le comprend mais cette norme ne compte aucun caractère   accentué et donc pas les ligatures.
 
 
   
 
   
 
+
;'''ISO 10646 aussi nommé Unicode''': ( en savoir plus sur Unicode) Serait LA norme qui contient tous les caractères utilisé sur la planète. Acceptée explicitement en gedcom si les systèmes peuvent l'utiliser (contrairement aux jeux non-ANSEL). A noter que l'Ansel contient les ligatures o majuscule et minuscule. Est le standard officiel d'XML.  
 
 
;'''ISO 10646 aussi nommé Unicode''':   (   en savoir plus sur Unicode)   Serait LA norme qui contient tous les caractères utilisé sur la   planète.   Acceptée explicitement en gedcom si les systèmes peuvent l'utiliser   (contrairement aux jeux non-ANSEL). A noter que l'Ansel contient les ligatures   o majuscule et minuscule. Est le standard officiel d'XML.  
 
 
   
 
   
 
+
;'''ANSI 1252 extension de la norme ISO/CEI 8859-1''': Jeu de caractères disponible dans l'environnement WINDOWS. Permet la saisie des ligatures oe. A la réception, la ligature o e peut ne pas être restituée normalement dans les environnements non-WINDOWS. Elle ne contient pas le y tréma en majuscule.
 
 
;'''ANSI 1252 extension de la norme ISO/CEI 8859-1''':   Jeu de caractères disponible dans l'environnement WINDOWS. Permet la   saisie des ligatures oe. A la réception, la ligature o e peut ne pas   être restituée normalement dans les environnements non-WINDOWS.   Elle ne contient pas le y tréma en majuscule.
 
 
   
 
   
;'''ISO-8859''':   Cette norme spécifie au moins 9 jeux de caractères pour diverses   langues. ISO-8859-1 est pour les langues ouest-européennes suivantes:   allemand, anglais, danois, espagnol, feringien, finnois, français, islandais,   irlandais, italien, néerlandais, norvégien, portuguais et suédois,   ISO-8859-4 scandinavie et ISO-8859-6 arabe etc.
+
;'''ISO-8859''': Cette norme spécifie au moins 9 jeux de caractères pour diverses langues. ISO-8859-1 est pour les langues ouest-européennes suivantes: allemand, anglais, danois, espagnol, feringien, finnois, français, islandais, irlandais, italien, néerlandais, norvégien, portuguais et suédois, ISO-8859-4 scandinavie et ISO-8859-6 arabe etc.
 
   
 
   
 
+
;'''A savoir :''': l'utilisation ou non de la ligature a une incidence phonétique au même titre que les accents. Liste des mots utilisant la ligatures « oe » en francais : boeuf, coeur, choeur, foetus, manoeuvre, moeurs, noeud, oecumenisme, oedeme, oedipien, oeil, oenologie, oesophage, oeuf, oeuvre, soeur, voeu, stoechiometrie, des noms propres et les derives de coelome et ceux de oeil.
 
 
;'''A savoir :''': l'utilisation ou non de la ligature a une incidence phonétique   au même titre que les accents. Liste des mots utilisant la ligatures «   oe » en francais : boeuf, coeur, choeur, foetus, manoeuvre, moeurs, noeud,   oecumenisme, oedeme, oedipien, oeil, oenologie, oesophage, oeuf, oeuvre, soeur,   voeu, stoechiometrie, des noms propres et les derives de coelome et ceux de   oeil.
 
 
   
 
   
 
+
Nom / valeur Unicode / représentation / code ASCII / Saisie / codage Microsoft (non normé)  
 
 
Nom / valeur Unicode / représentation / code ASCII / Saisie / codage   Microsoft (non normé)  
 
 
*Ligature oe minuscule / U+0153 / œ / /250 / Alt+0156 / 9C  
 
*Ligature oe minuscule / U+0153 / œ / /250 / Alt+0156 / 9C  
 
*Ligature OE majuscule / U+0152 / Œ / 234 / Alt+0140 /  
 
*Ligature OE majuscule / U+0152 / Œ / 234 / Alt+0140 /  
*y minuscule avec tréma / ????? / ÿ / ??? / ???? / 0152 / Œ   / 234 / Alt+0140 / FF
+
*y minuscule avec tréma / ????? / ÿ / ??? / ???? / 0152 / Œ / 234 / Alt+0140 / FF
 
   
 
   
 
=Autres Ressources=  
 
=Autres Ressources=  
Ligne 61 : Ligne 41 :
 
*http://www.faqs.org/faqs/fr/accents/  
 
*http://www.faqs.org/faqs/fr/accents/  
 
*http://www.uzine.net/article1785.html#nb5  
 
*http://www.uzine.net/article1785.html#nb5  
*http://openweb.eu.org/articles/caracteres_illegaux/   Projet   de norme ISO 14651
+
*http://openweb.eu.org/articles/caracteres_illegaux/ Projet de norme ISO 14651
  
Code utilisé par l'INSEE pour son fichier des noms des communes :     pas le Latin-1 puisqu'il y a des ligatures oe. Les ligatures oe et OE sont     codés 214 et 234 (en octal) qui tombent dans les caractères     de "contrôle" de ISO-8859 et qu'utilisent les codages "propriétaires"     (comme les code-pages d'IBM, Microsoft, Apple, etc.).     Si c'était le Latin-9 ces codes auraient pour valeur 274 et 275. Il     ne s'agit pas non plus d'Unicode (ni codé en n'utilisant que les premiers     8 bits, ni en UTF-8).  
+
Code utilisé par l'INSEE pour son fichier des noms des communes : pas le Latin-1 puisqu'il y a des ligatures oe. Les ligatures oe et OE sont codés 214 et 234 (en octal) qui tombent dans les caractères de "contrôle" de ISO-8859 et qu'utilisent les codages "propriétaires" (comme les code-pages d'IBM, Microsoft, Apple, etc.). Si c'était le Latin-9 ces codes auraient pour valeur 274 et 275. Il ne s'agit pas non plus d'Unicode (ni codé en n'utilisant que les premiers 8 bits, ni en UTF-8).  
Donc, cette liste a été codée dans un pseudo Latin-1     sans doute le codage de Windows.  
+
Donc, cette liste a été codée dans un pseudo Latin-1 sans doute le codage de Windows.  
 
   
 
   
 
+
Les lettres considérées comme françaises sont très rarement explicitées et d'ailleurs, toute langue évoluant, il est difficile de dire ce qu'est une lettre française... L'imprimerie nationale (lexique des règles, page 102) donne : a...z àâèéêëîïôùüçæ oe auxquelles il faudrait donc ajouter ÿ
 
 
Les lettres considérées comme françaises sont très   rarement explicitées et d'ailleurs, toute langue évoluant, il   est difficile de dire ce qu'est une lettre française... L'imprimerie   nationale (lexique des règles, page 102) donne : a...z àâèéêëîïôùüçæ   oe auxquelles il faudrait donc ajouter ÿ
 
 
   
 
   
 
{{Palette StandardGenWeb}}[[Catégorie:StandardGenWeb]]
 
{{Palette StandardGenWeb}}[[Catégorie:StandardGenWeb]]

Version du 20 avril 2011 à 11:31

Quelque soit votre choix, soyez constant dans la notation Pour suivre la norme orthographique utilisez la ligature oe minuscule (œ) et majuscule (Œ) en utilisant un codage propriétaire (Windows) comme le fait l'INSEE. Inconvénient : risque d'illisibilité du caractère en cas d'échanges avec certains environnements non-Windows

Autre option :
remplacez la ligature par «oe». Assure une communication minimum du mot Inconvénient : vous perdez une variété (richesse ?) orthographique et si vous souhaitez restaurer la ligature oe ce sera à faire à la main au cas par cas.

Le « Dénombrement de la population », publié par l'INSEE, est la source qui fixe la graphie officielle des noms des communes en France. C'est dans le « Code officiel géographique 2003 ». La liste des communes donnée par le fichier de l'INSEE donne deux écritures.

  • 1. Nom en clair (majuscules) (NCC) - Libellé en lettres majuscules Dans ce cas le nom de la commune est entièrement en majuscule sans AUCUNE accentuation.
  • 2. Nom en clair (typographie riche) (NCCENR) - « Libellé en typographie riche, majuscules, minuscules, accentuation. ». En ce cas majuscule et minuscule sont accentués.
  • La « ligature oe minuscule » est utilisé dans 225 communes sur un total de 36 678.
  • La « ligature OE majuscule » est utilisée dans 4 communes (code Insee): Œuilly (02565), Œuilly (51410) et Œting (57521) et Œuf-en-Ternois (62633)
  • Le Y majuscule avec tréma n'apparait pas car aucune commune ne commence par ce caractère.
  • [Le y tréma (ÿ) minuscule apparaît dans trois communes : Moÿ-de-l'Aisne (02532), Faÿ-lès-Nemours (77178), L'Haÿ-les-Roses (94038)]


La préconisation serait donc d'écrire le nom des communes avec cette ligature oe. C'est l'écriture officielle et normalisée . MAIS le problème commence avec l'échange des données et tout particulièrement pour transmettre le nom d'une commune contenant le caractère «ligature oe minuscule ». En effet ce caractère est inexistant dans plusieurs normes utilisés par les logiciels.

ISO-8859-1 aussi nommée ISO-Latin-1
Pour simplifier cette norme internationale est fiable et utilisée par la quasi-totalité des systèmes. Mais elle ne contient justement pas le caractère « ligature oe minuscule » (idem pour l'équivalent majuscule). Elle est utilisée sur Usenet et aussi pour la réaliser et visualiser un site Internet (pour simplifier, un internaute devra posséder sur son ordinateur la police de caractère appropriée pour visualiser correctement ce caractère). Risque : vous saisissez la commune de Vendouvres (code Insee 36232) avec la ligature. Au moment d'une transmission (via usenet ou sur un site ou même sur l'ordinateur d'un correspondant) vous n'avez plus que - par exemple - «Vend ?uvres».
ISO-8859-15 aussi nommée ISO-Latin-9
Définit quelques nouveaux caractères dont la « ligature oe minuscule » (idem pour l'équivalent majuscule). Mais elle est peu répandue (dans les logiciels et ordinateurs). Ce qui fera que le caractère « ligature oe minuscule » risque de ne pas être correctement visualisé ailleurs.
US-ASCII
Tout le monde le comprend mais cette norme ne compte aucun caractère accentué et donc pas les ligatures.
ISO 10646 aussi nommé Unicode
( en savoir plus sur Unicode) Serait LA norme qui contient tous les caractères utilisé sur la planète. Acceptée explicitement en gedcom si les systèmes peuvent l'utiliser (contrairement aux jeux non-ANSEL). A noter que l'Ansel contient les ligatures o majuscule et minuscule. Est le standard officiel d'XML.
ANSI 1252 extension de la norme ISO/CEI 8859-1
Jeu de caractères disponible dans l'environnement WINDOWS. Permet la saisie des ligatures oe. A la réception, la ligature o e peut ne pas être restituée normalement dans les environnements non-WINDOWS. Elle ne contient pas le y tréma en majuscule.
ISO-8859
Cette norme spécifie au moins 9 jeux de caractères pour diverses langues. ISO-8859-1 est pour les langues ouest-européennes suivantes: allemand, anglais, danois, espagnol, feringien, finnois, français, islandais, irlandais, italien, néerlandais, norvégien, portuguais et suédois, ISO-8859-4 scandinavie et ISO-8859-6 arabe etc.
A savoir :
l'utilisation ou non de la ligature a une incidence phonétique au même titre que les accents. Liste des mots utilisant la ligatures « oe » en francais : boeuf, coeur, choeur, foetus, manoeuvre, moeurs, noeud, oecumenisme, oedeme, oedipien, oeil, oenologie, oesophage, oeuf, oeuvre, soeur, voeu, stoechiometrie, des noms propres et les derives de coelome et ceux de oeil.

Nom / valeur Unicode / représentation / code ASCII / Saisie / codage Microsoft (non normé)

  • Ligature oe minuscule / U+0153 / œ / /250 / Alt+0156 / 9C
  • Ligature OE majuscule / U+0152 / Œ / 234 / Alt+0140 /
  • y minuscule avec tréma / ????? / ÿ / ??? / ???? / 0152 / Œ / 234 / Alt+0140 / FF

Autres Ressources

Pour mieux comprendre le codage

  • http://www.olf.gouv.qc.ca/ressources/ti/evaluations/courriers/dossier.html
  • http://www.faqs.org/faqs/fr/accents/
  • http://www.uzine.net/article1785.html#nb5
  • http://openweb.eu.org/articles/caracteres_illegaux/ Projet de norme ISO 14651

Code utilisé par l'INSEE pour son fichier des noms des communes : pas le Latin-1 puisqu'il y a des ligatures oe. Les ligatures oe et OE sont codés 214 et 234 (en octal) qui tombent dans les caractères de "contrôle" de ISO-8859 et qu'utilisent les codages "propriétaires" (comme les code-pages d'IBM, Microsoft, Apple, etc.). Si c'était le Latin-9 ces codes auraient pour valeur 274 et 275. Il ne s'agit pas non plus d'Unicode (ni codé en n'utilisant que les premiers 8 bits, ni en UTF-8). Donc, cette liste a été codée dans un pseudo Latin-1 sans doute le codage de Windows.

Les lettres considérées comme françaises sont très rarement explicitées et d'ailleurs, toute langue évoluant, il est difficile de dire ce qu'est une lettre française... L'imprimerie nationale (lexique des règles, page 102) donne : a...z àâèéêëîïôùüçæ oe auxquelles il faudrait donc ajouter ÿ