How do you convert text to binary?

Each text character has a numeric code in ASCII or Unicode. Convert that number to base-2. For example, the letter A is ASCII 65, which in binary is 01000001. A text-to-binary converter automates this for any input.

What is the binary code for the letter A?

Uppercase A in ASCII is 01000001 (decimal 65). Lowercase a is 01100001 (decimal 97). The difference is exactly one bit — the 6th bit from the right.

Why do computers use binary instead of decimal?

Computer hardware is built from transistors that have two states: on and off. Binary (base-2) maps perfectly to these two states. Designing reliable circuits with just two voltage levels is much simpler and more energy-efficient than using ten levels for decimal.

How many bits are in a byte?

A byte contains 8 bits and can represent 256 different values (2 to the power of 8). One byte is enough to store a single ASCII character. The term byte was coined by Werner Buchholz at IBM in 1956.

What is the difference between binary and hexadecimal?

Both are number systems. Binary is base-2 (digits 0-1), while hexadecimal is base-16 (digits 0-9 and A-F). Hex is a compact way to write binary — each hex digit represents exactly 4 binary digits. For example, binary 11111111 = hex FF = decimal 255.

Código Binário: Como os Computadores Armazenam e Traduzem Texto

31 de março de 2026 · 12 min de leitura

Índice

O Que É Código Binário?
Como o Texto Se Torna Binário
O Padrão ASCII
Além do ASCII: Unicode
UTF-8, UTF-16 e UTF-32 Explicados
Exemplos de Tradução Binária
Aplicações Práticas
Trabalhando com Binário na Programação
Problemas Comuns de Codificação
Principais Conclusões
Perguntas Frequentes
Artigos Relacionados

Cada pedaço de texto que você lê em uma tela — incluindo esta frase — é armazenado dentro do seu computador como código binário: sequências de 1s e 0s. Entender como a tradução binária funciona revela o mecanismo fundamental por trás de toda comunicação digital, desde mensagens de texto até páginas web e arquivos no seu disco rígido.

Seja você um desenvolvedor depurando problemas de codificação de caracteres, um estudante aprendendo fundamentos de ciência da computação, ou simplesmente curioso sobre como a tecnologia funciona, este guia irá guiá-lo através da jornada completa desde as teclas digitadas até o binário e de volta.

O Que É Código Binário?

Binário é um sistema numérico de base 2 que usa apenas dois dígitos: 0 e 1. Enquanto os humanos naturalmente contam em base 10 (decimal) usando dígitos de 0 a 9, os computadores operam em binário porque seus blocos de construção fundamentais — transistores — têm dois estados: ligado (1) e desligado (0).

Cada pedaço de dados em um computador, seja texto, imagens, música ou vídeo, é finalmente representado como padrões desses dois dígitos. Isso pode parecer limitante, mas a simplicidade do binário é precisamente o que o torna tão poderoso e confiável para circuitos eletrônicos.

Entendendo Bits e Bytes

Um único dígito binário é chamado de bit. Oito bits agrupados formam um byte, que pode representar 256 valores diferentes (2⁸ = 256). Isso é suficiente para codificar todas as letras, números e símbolos usados em texto em inglês, razão pela qual o byte se tornou a unidade padrão de armazenamento digital.

Veja como os valores de posição binária funcionam, lendo da direita para a esquerda:

Posição	7	6	5	4	3	2	1	0
Valor de Posição	128	64	32	16	8	4	2	1
Exemplo: 01000001	0	1	0	0	0	0	0	1
Cálculo	0	64	0	0	0	0	0	1

Neste exemplo, 01000001 é igual a 64 + 1 = 65 em decimal, que representa a letra "A" na codificação ASCII.

Dica profissional: Você pode usar nosso Tradutor Binário para converter instantaneamente texto em binário e vice-versa, facilitando a experimentação com esses conceitos na prática.

Como o Texto Se Torna Binário

Quando você digita uma letra no seu teclado, seu computador não armazena a forma dessa letra. Em vez disso, ele armazena um número que representa a letra, de acordo com um padrão de codificação acordado. O mais fundamental deles é o ASCII (American Standard Code for Information Interchange).

Veja o que acontece passo a passo quando você digita a letra "A":

Sinal do teclado: Seu teclado envia um sinal ao computador identificando qual tecla foi pressionada
Busca de caractere: O sistema operacional busca a codificação do caractere: "A" = 65 em ASCII
Conversão binária: O número 65 é convertido para binário: 01000001
Armazenamento ou transmissão: Esses oito bits são armazenados na memória ou transmitidos por uma rede
Exibição: Quando exibido, o processo se inverte: binário → número → forma do caractere renderizada na tela

Todo esse processo acontece em microssegundos, completamente invisível para o usuário. O padrão de codificação atua como um dicionário universal com o qual todos os computadores concordam, garantindo que quando você digita "Hello" em um computador, ele seja exibido como "Hello" em outro.

Por Que os Padrões de Codificação Importam

Sem codificação padronizada, a comunicação digital seria impossível. Imagine se cada fabricante de computadores usasse seu próprio sistema para representar letras — um arquivo criado em um computador seria incompreensível em outro.

Os padrões de codificação resolvem esse problema criando acordos universais sobre quais números representam quais caracteres. É por isso que você pode enviar um e-mail de um Mac para um PC Windows, ou visualizar um site criado no Japão em um computador no Brasil.

O Padrão ASCII

ASCII (American Standard Code for Information Interchange) foi desenvolvido na década de 1960 e se tornou a base para codificação de texto em computadores. Ele usa 7 bits para representar 128 caracteres diferentes, incluindo:

Letras maiúsculas (A-Z): códigos 65-90
Letras minúsculas (a-z): códigos 97-122
Dígitos (0-9): códigos 48-57
Pontuação e símbolos: vários códigos
Caracteres de controle: códigos 0-31 (como nova linha, tabulação, backspace)

Aqui está uma amostra de caracteres ASCII comuns:

Caractere	Decimal	Binário	Hexadecimal
Espaço	32	00100000	20
0	48	00110000	30
A	65	01000001	41
a	97	01100001	61
!	33	00100001	21
?	63	00111111	3F

Limitações do ASCII

Embora o ASCII tenha sido revolucionário para sua época, ele tem limitações significativas. Com apenas 128 caracteres, o ASCII só pode representar letras em inglês e símbolos básicos. Ele não pode lidar com:

Caracteres acentuados (é, ñ, ü)
Alfabetos não latinos (grego, cirílico, árabe)
Sistemas de escrita asiáticos (chinês, japonês, coreano)
Emoji e símbolos modernos

ASCII estendido (usando 8 bits para 256 caracteres) adicionou alguns caracteres acentuados, mas diferentes regiões usavam diferentes extensões, criando problemas de compatibilidade. É aqui que o Unicode entra.

Dica rápida: Se você está trabalhando com sistemas legados ou texto simples em inglês, o ASCII ainda é perfeitamente adequado e usa menos espaço de armazenamento que o Unicode. Use nosso Conversor ASCII para trabalhar diretamente com valores ASCII.

Além do ASCII: Unicode

O Unicode foi criado na década de 1990 para resolver as limitações do ASCII, fornecendo um número único (chamado de "ponto de código") para cada caractere em cada sistema de escrita usado na Terra. A partir de 2026, o Unicode inclui mais de 149.000 caracteres cobrindo 159 scripts modernos e históricos.

O Unicode atribui a cada caractere um ponto de código escrito como U+ seguido de dígitos hexadecimais. Por exemplo:

U+0041 = A (letra maiúscula latina A)
U+03B1 = α (letra minúscula grega alfa)
U+4E2D = 中 (caractere chinês para "meio")
U+1F600 = 😀 (emoji de rosto sorridente)

Unicode vs. UTF: Entendendo a Diferença

É aqui que muitas pessoas ficam confusas: Unicode não é uma codificação. Unicode é um conjunto de caracteres — uma lista que atribui números a caracteres. As codificações UTF (Unicode Transformation Format) são os métodos para representar esses números como dados binários.

Pense assim: Unicode é como uma lista telefônica que atribui um número único a cada pessoa. As codificações UTF são as diferentes maneiras pelas quais você pode anotar esses números de telefone (com ou sem códigos de país, com ou sem traços, etc.).

UTF-8, UTF-16 e UTF-32 Explicados

Existem três codificações UTF principais, cada uma com diferentes compensações:

UTF-8: O Padrão da Web

UTF-8 é uma codificação de comprimento variável que usa de 1 a 4 bytes por caractere. É retrocompatível com ASCII — os primeiros 128 caracteres usam exatamente a mesma representação binária que o ASCII.

Vantagens:

Eficiente para texto em inglês (1 byte por caractere)
Retrocompatível com ASCII
Sem problemas de ordem de bytes
Dominante na web (mais de 98% dos sites)

Desvantagens:

Menos eficiente para idiomas asiáticos (3-4 bytes por caractere)
Comprimento variável torna a indexação mais complexa

UTF-16: O Padrão do Windows

UTF-16 usa 2 ou 4 bytes por caractere. A maioria dos caracteres comuns cabe em 2 bytes, mas caracteres raros e emoji requerem 4 bytes (usando "pares substitutos").

Vantagens:

Eficiente para a maioria dos idiomas (2 bytes por caractere)
Usado internamente pelo Windows, Java e JavaScript

Desvantagens:

Não é retrocompatível com ASCII
Problemas de ordem de bytes (big-endian vs. little-endian)
Ainda de comprimento variável para caracteres raros

UTF-32: Comprimento Fixo

UTF-32 usa exatamente 4 bytes para cada caractere, tornando-o a única codificação Unicode de comprimento fixo.

Vantagens:

Indexação simples (caractere N está na posição de byte N×4)
Sem lógica de decodificação complexa

Desvantagens:

Desperdiça espaço (4 bytes mesmo para caracteres ASCII simples)
Raramente usado na prática

Dica profissional: Ao construir aplicações web, sempre use UTF-8. É o padrão da internet, suportado em todos os lugares e eficiente para a maioria do conteúdo. Especifique-o no seu HTML com <meta charset="UTF-8"> e nos cabeçalhos HTTP com Content-Type: text/html; charset=UTF-8.

Exemplos de Tradução Binária

Vamos percorrer alguns exemplos concretos de como o texto se torna binário e vice-versa.

Exemplo 1: Palavra ASCII Simples

A palavra "Hi" em ASCII:

H = 72 decimal = 01001000 binário
i = 105 decimal = 01101001 binário

Binário completo: 01001000 01101001

Quando armazenados em um arquivo ou transmitidos por uma rede, esses 16 bits (2 bytes) representam a palavra "Hi".

Exemplo 2: Maiúsculas e Minúsculas com Pontuação

A frase "Hello!" se decompõe como:

Caractere	Decimal	Binário
H	72	01001000
e	101	01100101
l	108	01101100
l	108	01101100
o	111	01101111
!	33	00100001

Total: 48 bits (6 bytes) de dados.

Exemplo 3: Emoji Unicode

O emoji 😀 (rosto sorridente) é U+1F600 em Unicode. Em UTF-8, é codificado como 4 bytes:

11110000 10011111 10011000 10000000

Isso demonstra por que o UTF-8 é de comprimento variável — um simples "A" leva 1 byte, mas um emoji leva 4 bytes.

Convertendo Binário em Texto

Para converter binário de volta em texto, você inverte o processo:

Agrupe os dígitos binários em bytes (8 bits cada)
Converta cada byte para seu valor decimal
Procure o caractere para esse valor na sua tabela de codificação
Combine os caracteres para formar texto

Por exemplo, se você receber: 01001000 01100101 01111001

01001000 = 72 = H
01100101 = 101 = e
01111001 = 121 = y

Resultado: "Hey"

Aplicações Práticas

Entender a codificação de texto binário não é apenas acadêmico — tem aplicações do mundo real em muitos campos.

Desenvolvimento Web

Desenvolvedores web encontram problemas de codificação regularmente. Cenários comuns incluem:

Envios de formulários: Garantir que a entrada do usuário seja codificada adequadamente quando enviada aos servidores
Armazenamento em banco de dados: Escolher o conjunto de caracteres correto para colunas de banco de dados
Respostas de API: Definir cabeçalhos Content-Type corretos com informações de charset
Codificação de URL: Converter caracteres especiais para formato codificado em porcentagem

Nossa ferramenta Codificador de URL ajuda a lidar com codificação de URL automaticamente, convertendo caracteres especiais para seus equivalentes codificados em porcentagem.

Análise e Processamento de Dados

Cientistas de dados e analistas precisam entender codificação ao:

Ler arquivos CSV de diferentes fontes
Extrair conteúdo web com caracteres internacionais
Processar arquivos de log de vários sistemas
Limpar dados de texto para modelos de aprendizado de máquina

Cibersegurança

Profissionais de segurança usam conhecimento de codificação binária para:

Analisar malware: Entender como código malicioso se esconde em dados binários
Forense: Examinar cabeçalhos de arquivo e metadados
Criptografia: Trabalhar com dados codificados e criptografados
Esteganografia: Detectar mensagens ocultas em arquivos binários

Design de Formato de Arquivo

Ao projetar formatos de arquivo personalizados, você precisa decidir:

Qual codificação usar para campos de texto
Como marcar a codificação