How do you convert text to binary?

Each text character has a numeric code in ASCII or Unicode. Convert that number to base-2. For example, the letter A is ASCII 65, which in binary is 01000001. A text-to-binary converter automates this for any input.

What is the binary code for the letter A?

Uppercase A in ASCII is 01000001 (decimal 65). Lowercase a is 01100001 (decimal 97). The difference is exactly one bit — the 6th bit from the right.

Why do computers use binary instead of decimal?

Computer hardware is built from transistors that have two states: on and off. Binary (base-2) maps perfectly to these two states. Designing reliable circuits with just two voltage levels is much simpler and more energy-efficient than using ten levels for decimal.

How many bits are in a byte?

A byte contains 8 bits and can represent 256 different values (2 to the power of 8). One byte is enough to store a single ASCII character. The term byte was coined by Werner Buchholz at IBM in 1956.

What is the difference between binary and hexadecimal?

Both are number systems. Binary is base-2 (digits 0-1), while hexadecimal is base-16 (digits 0-9 and A-F). Hex is a compact way to write binary — each hex digit represents exactly 4 binary digits. For example, binary 11111111 = hex FF = decimal 255.

Code Binaire : Comment les Ordinateurs Stockent et Traduisent le Texte

31 mars 2026 · 12 min de lecture

Table des Matières

Qu'est-ce que le Code Binaire ?
Comment le Texte Devient Binaire
La Norme ASCII
Au-delà d'ASCII : Unicode
UTF-8, UTF-16 et UTF-32 Expliqués
Exemples de Traduction Binaire
Applications Pratiques
Travailler avec le Binaire en Programmation
Problèmes d'Encodage Courants
Points Clés à Retenir
Questions Fréquemment Posées
Articles Connexes

Chaque morceau de texte que vous lisez sur un écran — cette phrase incluse — est stocké dans votre ordinateur sous forme de code binaire : des séquences de 1 et de 0. Comprendre comment fonctionne la traduction binaire révèle le mécanisme fondamental derrière toute communication numérique, des messages texte aux pages web en passant par les fichiers sur votre disque dur.

Que vous soyez un développeur déboguant des problèmes d'encodage de caractères, un étudiant apprenant les fondamentaux de l'informatique, ou simplement curieux de savoir comment fonctionne la technologie, ce guide vous accompagnera dans le parcours complet des frappes au clavier au binaire et retour.

Qu'est-ce que le Code Binaire ?

Le binaire est un système de numération en base 2 qui utilise seulement deux chiffres : 0 et 1. Alors que les humains comptent naturellement en base 10 (décimal) en utilisant les chiffres 0-9, les ordinateurs fonctionnent en binaire car leurs composants fondamentaux — les transistors — ont deux états : allumé (1) et éteint (0).

Chaque donnée dans un ordinateur, qu'il s'agisse de texte, d'images, de musique ou de vidéo, est finalement représentée sous forme de motifs de ces deux chiffres. Cela peut sembler limitant, mais la simplicité du binaire est précisément ce qui le rend si puissant et fiable pour les circuits électroniques.

Comprendre les Bits et les Octets

Un seul chiffre binaire est appelé un bit. Huit bits regroupés forment un octet, qui peut représenter 256 valeurs différentes (2⁸ = 256). C'est suffisant pour encoder toutes les lettres, chiffres et symboles utilisés dans le texte anglais, c'est pourquoi l'octet est devenu l'unité standard de stockage numérique.

Voici comment fonctionnent les valeurs de position binaire, en lisant de droite à gauche :

Position	7	6	5	4	3	2	1	0
Valeur de Position	128	64	32	16	8	4	2	1
Exemple : 01000001	0	1	0	0	0	0	0	1
Calcul	0	64	0	0	0	0	0	1

Dans cet exemple, 01000001 équivaut à 64 + 1 = 65 en décimal, ce qui représente la lettre « A » en encodage ASCII.

Conseil : Vous pouvez utiliser notre Traducteur Binaire pour convertir instantanément du texte en binaire et inversement, facilitant l'expérimentation pratique de ces concepts.

Comment le Texte Devient Binaire

Lorsque vous tapez une lettre sur votre clavier, votre ordinateur ne stocke pas la forme de cette lettre. Au lieu de cela, il stocke un nombre qui représente la lettre, selon une norme d'encodage convenue. La plus fondamentale de ces normes est ASCII (American Standard Code for Information Interchange).

Voici ce qui se passe étape par étape lorsque vous tapez la lettre « A » :

Signal du clavier : Votre clavier envoie un signal à l'ordinateur identifiant quelle touche a été pressée
Recherche de caractère : Le système d'exploitation recherche l'encodage du caractère : « A » = 65 en ASCII
Conversion binaire : Le nombre 65 est converti en binaire : 01000001
Stockage ou transmission : Ces huit bits sont stockés en mémoire ou transmis sur un réseau
Affichage : Lors de l'affichage, le processus s'inverse : binaire → nombre → forme de caractère rendue à l'écran

Ce processus entier se produit en microsecondes, complètement invisible pour l'utilisateur. La norme d'encodage agit comme un dictionnaire universel sur lequel tous les ordinateurs s'accordent, garantissant que lorsque vous tapez « Bonjour » sur un ordinateur, il s'affiche comme « Bonjour » sur un autre.

Pourquoi les Normes d'Encodage Sont Importantes

Sans encodage standardisé, la communication numérique serait impossible. Imaginez si chaque fabricant d'ordinateurs utilisait son propre système pour représenter les lettres — un fichier créé sur un ordinateur serait du charabia sur un autre.

Les normes d'encodage résolvent ce problème en créant des accords universels sur quels nombres représentent quels caractères. C'est pourquoi vous pouvez envoyer un e-mail d'un Mac à un PC Windows, ou consulter un site web créé au Japon sur un ordinateur au Brésil.

La Norme ASCII

ASCII (American Standard Code for Information Interchange) a été développé dans les années 1960 et est devenu la base de l'encodage de texte dans les ordinateurs. Il utilise 7 bits pour représenter 128 caractères différents, incluant :

Lettres majuscules (A-Z) : codes 65-90
Lettres minuscules (a-z) : codes 97-122
Chiffres (0-9) : codes 48-57
Ponctuation et symboles : codes divers
Caractères de contrôle : codes 0-31 (comme nouvelle ligne, tabulation, retour arrière)

Voici un échantillon de caractères ASCII courants :

Caractère	Décimal	Binaire	Hexadécimal
Espace	32	00100000	20
0	48	00110000	30
A	65	01000001	41
a	97	01100001	61
!	33	00100001	21
?	63	00111111	3F

Les Limitations d'ASCII

Bien qu'ASCII ait été révolutionnaire pour son époque, il présente des limitations importantes. Avec seulement 128 caractères, ASCII ne peut représenter que les lettres anglaises et les symboles de base. Il ne peut pas gérer :

Les caractères accentués (é, ñ, ü)
Les alphabets non latins (grec, cyrillique, arabe)
Les systèmes d'écriture asiatiques (chinois, japonais, coréen)
Les emoji et symboles modernes

L'ASCII étendu (utilisant 8 bits pour 256 caractères) a ajouté quelques caractères accentués, mais différentes régions utilisaient différentes extensions, créant des problèmes de compatibilité. C'est là qu'intervient Unicode.

Astuce rapide : Si vous travaillez avec des systèmes hérités ou du texte anglais simple, ASCII est toujours parfaitement adéquat et utilise moins d'espace de stockage qu'Unicode. Utilisez notre Convertisseur ASCII pour travailler directement avec les valeurs ASCII.

Au-delà d'ASCII : Unicode

Unicode a été créé dans les années 1990 pour résoudre les limitations d'ASCII en fournissant un nombre unique (appelé « point de code ») pour chaque caractère de chaque système d'écriture utilisé sur Terre. En 2026, Unicode comprend plus de 149 000 caractères couvrant 159 écritures modernes et historiques.

Unicode attribue à chaque caractère un point de code écrit comme U+ suivi de chiffres hexadécimaux. Par exemple :

U+0041 = A (lettre majuscule latine A)
U+03B1 = α (lettre grecque minuscule alpha)
U+4E2D = 中 (caractère chinois pour « milieu »)
U+1F600 = 😀 (emoji visage souriant)

Unicode vs UTF : Comprendre la Différence

C'est là que beaucoup de gens sont confus : Unicode n'est pas un encodage. Unicode est un jeu de caractères — une liste qui attribue des nombres aux caractères. Les encodages UTF (Unicode Transformation Format) sont les méthodes pour représenter ces nombres sous forme de données binaires.

Pensez-y de cette façon : Unicode est comme un annuaire téléphonique qui attribue un numéro unique à chaque personne. Les encodages UTF sont les différentes façons dont vous pourriez écrire ces numéros de téléphone (avec ou sans indicatifs de pays, avec ou sans tirets, etc.).

UTF-8, UTF-16 et UTF-32 Expliqués

Il existe trois principaux encodages UTF, chacun avec des compromis différents :

UTF-8 : La Norme Web

UTF-8 est un encodage à longueur variable qui utilise de 1 à 4 octets par caractère. Il est rétrocompatible avec ASCII — les 128 premiers caractères utilisent exactement la même représentation binaire qu'ASCII.

Avantages :

Efficace pour le texte anglais (1 octet par caractère)
Rétrocompatible avec ASCII
Pas de problèmes d'ordre des octets
Dominant sur le web (plus de 98 % des sites web)

Inconvénients :

Moins efficace pour les langues asiatiques (3-4 octets par caractère)
La longueur variable rend l'indexation plus complexe

UTF-16 : Le Défaut Windows

UTF-16 utilise 2 ou 4 octets par caractère. La plupart des caractères courants tiennent dans 2 octets, mais les caractères rares et les emoji nécessitent 4 octets (en utilisant des « paires de substitution »).

Avantages :

Efficace pour la plupart des langues (2 octets par caractère)
Utilisé en interne par Windows, Java et JavaScript

Inconvénients :

Pas rétrocompatible avec ASCII
Problèmes d'ordre des octets (big-endian vs little-endian)
Toujours à longueur variable pour les caractères rares

UTF-32 : Longueur Fixe

UTF-32 utilise exactement 4 octets pour chaque caractère, ce qui en fait le seul encodage Unicode à longueur fixe.

Avantages :

Indexation simple (le caractère N est à la position d'octet N×4)
Pas de logique de décodage complexe

Inconvénients :

Gaspille de l'espace (4 octets même pour les caractères ASCII simples)
Rarement utilisé en pratique

Conseil : Lors de la création d'applications web, utilisez toujours UTF-8. C'est la norme internet, prise en charge partout et efficace pour la plupart des contenus. Spécifiez-le dans votre HTML avec <meta charset="UTF-8"> et dans les en-têtes HTTP avec Content-Type: text/html; charset=UTF-8.

Exemples de Traduction Binaire

Parcourons quelques exemples concrets de la façon dont le texte devient binaire et inversement.

Exemple 1 : Mot ASCII Simple

Le mot « Hi » en ASCII :

H = 72 décimal = 01001000 binaire
i = 105 décimal = 01101001 binaire

Binaire complet : 01001000 01101001

Lorsqu'ils sont stockés dans un fichier ou transmis sur un réseau, ces 16 bits (2 octets) représentent le mot « Hi ».

Exemple 2 : Casse Mixte avec Ponctuation

La phrase « Hello! » se décompose comme suit :

Caractère	Décimal	Binaire
H	72	01001000
e	101	01100101
l	108	01101100
l	108	01101100
o	111	01101111
!	33	00100001

Total : 48 bits (6 octets) de données.

Exemple 3 : Emoji Unicode

L'emoji 😀 (visage souriant) est U+1F600 en Unicode. En UTF-8, il est encodé sur 4 octets :

11110000 10011111 10011000 10000000

Cela démontre pourquoi UTF-8 est à longueur variable — un simple « A » prend 1 octet, mais un emoji prend 4 octets.

Convertir le Binaire en Texte

Pour convertir le binaire en texte, vous inversez le processus :

Regroupez les chiffres binaires en octets (8 bits chacun)
Convertissez chaque octet en sa valeur décimale
Recherchez le caractère pour cette valeur dans votre table d'encodage
Combinez les caractères pour former du texte

Par exemple, si vous recevez : 01001000 01100101 01111001

01001000 = 72 = H
01100101 = 101 = e
01111001 = 121 = y

Résultat : « Hey »

Applications Pratiques

Comprendre l'encodage de texte binaire n'est pas seulement académique — cela a des applications concrètes dans de nombreux domaines.

Développement Web

Les développeurs web rencontrent régulièrement des problèmes d'encodage. Les scénarios courants incluent :

Soumissions de formulaires : S'assurer que les entrées utilisateur sont correctement encodées lors de l'envoi aux serveurs
Stockage en base de données : Choisir le bon jeu de caractères pour les colonnes de base de données
Réponses API : Définir les en-têtes Content-Type corrects avec les informations de charset
Encodage d'URL : Convertir les caractères spéciaux au format encodé en pourcentage

Notre outil Encodeur d'URL aide à gérer automatiquement l'encodage d'URL, convertissant les caractères spéciaux en leurs équivalents encodés en pourcentage.

Analyse et Traitement de Données

Les data scientists et analystes doivent comprendre l'encodage lors de :

La lecture de fichiers CSV provenant de différentes sources
L'extraction de contenu web avec des caractères internationaux
Le traitement de fichiers journaux de divers systèmes
Le nettoyage de données textuelles pour les modèles d'apprentissage automatique

Cybersécurité

Les professionnels de la sécurité utilisent la connaissance de l'encodage binaire pour :

Analyser les logiciels malveillants : Comprendre comment le code malveillant se cache dans les données binaires
Forensique : Examiner les en-têtes de fichiers et les métadonnées
Chiffrement : Travailler avec des données encodées et chiffrées
Stéganographie : Détecter les messages cachés dans les fichiers binaires

Conception de Format de Fichier

Lors de la conception de formats de fichiers personnalisés, vous devez décider :

Quel encodage utiliser pour les champs de texte
Comment marquer l'encodage