Aller au contenu Aller au menu principal Aller au menu secondaire Aller au pied de page

Peut-on mettre des emojis dans un nom de domaine ?

Accueil > Observatoire & ressources > Papiers d’experts > Peut-on mettre des emojis dans un nom de domaine ?
Le 16/07/2024

Les émojis, ces pictogrammes utilisés dans les communications électroniques, sont aussi parfois visibles dans des noms de domaine. Je vais vous expliquer dans cet article quelles sont les règles d’utilisation et d’usage de ces caractères dans les noms de domaine.

Des emojis sous tous les suffixes ?

Si vous cherchez un peu, vous trouverez des noms de domaine comportant des emojis (comme i❤.ws ou 🦣🦕.bortzmeyer.fr) donc oui, il est possible de trouver des noms de domaine comportant ces caractères. Mais si vous cherchez à en enregistrer dans .fr ou .com, vous essuierez un refus. Donc, non.

.fr Ce domaine contient des caractères non autorisés..com Ce domaine contient des caractères non autorisés.
Figure 1: Le bureau d’enregistrement refuse mon domaine avec une mangue et un avocat.

La réponse va en fait être compliquée car il va falloir à la fois se plonger dans la norme technique, et regarder les règles d’enregistrement, donc la politique des registres.

La norme technique des caractères autorisés dans les noms de domaine

La norme technique pour les caractères autorisés dans un nom de domaine est le RFC 5892. Elle est complexe à lire car vous n’y trouverez pas la liste des caractères autorisés mais un algorithme pour générer cette liste à partir de la norme Unicode. Unicode est une norme qui spécifie un jeu de caractères, donc une liste de caractères1 comme le A, le z, le Ɣ ou le ர. Chaque caractère a un identificateur numérique, le point de code, en général écrit en hexadécimal.  A est U+0061, z U+007A, Ɣ vaut U+0194 et ர est U+0BB0. Unicode inclut aussi les fameux emojis comme ⛽ (U+26FD) ou 🚆(U+1F686). Pour explorer le jeu de caractères Unicode, je vous recommande l’excellent site Web Uniview.

Unicode n’est pas uniquement une liste de caractères. Les caractères sont classés en catégories, et ont un certain nombre de propriétés. Ainsi A et Ɣsont dans la catégorie Lu (Lettres Majuscules), z dans Ll (Lettres Minuscules) et ர Lo (Autres Lettres). Par contre, ⛽ et 🚆ont la catégorie So (Autres Symboles, notez qu’il n’y a pas de catégorie nommée « emoji »).

L’algorithme du RFC 5892 est complexe et je ne vais pas le détailler ici. Le point important est qu’il inclut plusieurs catégories de lettres et de chiffres2 mais pas les symboles. Le résultat de cet algorithme est stocké à l’IANA sous forme d’une liste de caractères ou d’intervalles de caractères. S’ils sont marqués PVALID, ils peuvent être utilisés pour un nom de domaine. Autrement, ils ne le peuvent pas3.Ainsi,🚆se trouve dans l’intervalle 1F300-1F6D5 (de 🌀 à 🛕) qui est marqué DISALLOWED.

En résumé, la norme technique est claire : pas d’emojis dans les noms de domaine.

Malgré cela, on trouve des emojis dans certains noms de domaine, pour des raisons qui sont expliquées plus loin. Mais rien ne garantit qu’ils fonctionneront avec tous les logiciels et systèmes informatiques que vous utilisez. Déjà, des noms de domaine parfaitement légaux sont parfois refusés pour des raisons arbitraires et non fondées (problème dit de l’« acceptation universelle ») alors on ne peut pas s’attendre à un bon fonctionnement pour ces noms illégaux.

Des règles d’enregistrement des emojis différentes en fonction du registre

La technique n’est pas tout, il faut aussi tenir compte des règles d’enregistrement des registres. Ainsi, celles du .fr donnent une liste limitative des caractères autorisés4, qui n’inclut pas les emojis (logique, vu la norme technique) ni non plus des caractères non utilisés en français (caractères chinois, par exemple).

Pour les TLD5 soumis aux règles ICANN6, celles-ci imposent le respect des normes techniques7 et donc, là encore, les emojis ne seront pas acceptés. Notez que parfois, des noms avec emojis ont été enregistrés avant que la situation technique et politique soit stabilisée, et restent donc actifs, comme ☻.com.

En revanche, les TLD qui ne sont pas sous contrat avec l’ICANN peuvent faire ce qu’ils veulent et c’est ainsi qu’il existe deux ou trois TLD qui acceptent les emojis, et même mettent en avant cette possibilité qui, quoique invalide techniquement, peut présenter un intérêt marketing.

Par contre, même dans les TLD qui n’acceptent pas ces caractères au niveau où se font les enregistrements, vu le caractère arborescent du DNS8, les titulaires de noms peuvent mettre des noms avec emojis comme sous-domaines de leur domaine, et c’est ainsi que, par exemple, 🦣🦕.bortzmeyer.fr fonctionne. Bien que techniquement incorrect, il peut être accepté dans certaines circonstances et avec certains logiciels.

Les caractères composés dans les noms de domaine ou IDN

Les noms de domaine « internationaux » ou « internationalisés » sont des noms de domaine comportant d’autres caractères que les caractères ASCII9 (par exemple : caractères arabes, chinois, composés).

Contrairement à ce qu’on lit encore trop souvent, il est parfaitement possible d’avoir des caractères composés, comme é, ÿ ou ç, dans un nom de domaine. Vous verrez les caractères composés être parfois appelés « caractères diacritiques » ou bien « caractères Unicode ».

Ces noms de domaine ont été normalisés par l’IETF dans le RFC 3490 (depuis remplacé par le RFC 5890).

Les emojis ne font pas l’unanimité

Les emojis ne font pas l’unanimité : certains doutent de leur utilité (ce sont des dessins, pas des caractères), de leur stabilité (soumis à la mode, ils risquent d’être enregistrés dans Unicode, puis oubliés) et critiquent leur coût puisque leur nombre potentiel, quasi-infini, pourrait remplir toutes les cases de la norme Unicode. Actuellement, ce problème est évité par un processus de sélection qui semble assez subjectif (pourquoi la mangue a-t-elle un emoji et pas la papaye ?)

De toute façon, ne serait-ce que parce que la norme technique ne prévoit pas ce cas, l’utilisation des emojis dans les noms de domaine est clairement déconseillée : les chances qu’ils fonctionnent partout sont limitées.


1 – Vu la complexité des écritures humaines, qu’Unicode normalise mais sans chercher à les changer et à les simplifier, la réalité est plus complexe, notamment parce que le terme de « caractère » peut avoir plusieurs sens. Lisez la norme Unicode pour en savoir plus.

2 – L’algorithme complet figure dans la section 2 du RFC mais sa sous-section 2.1 vous donne l’essentiel, la liste des catégories principales.

3 – La règle exacte est un peu plus complexe, lisez le RFC.

4 – C’est l’occasion de rappeler que, oui, on peut parfaitement avoir des caractères composés dans un nom de domaine.

5 – Top-Level Domain, domaine de premier niveau comme .bzh ou .com.

6 – Internet Corporation for Assigned Names and Numbers, régulateur de certains TLD.

7 – Vous pouvez trouver des informations plus détaillées (en anglais) dans cet article du registre de .com, même s’il ne cite pas explicitement les emojis.

8 – Domain Name System

9 – American Standard Code for Information Interchange, une ancienne norme de jeu de caractères, qui ne convenait qu’à l’anglais (et au néerlandais).