How do you convert text to binary?

Each text character has a numeric code in ASCII or Unicode. Convert that number to base-2. For example, the letter A is ASCII 65, which in binary is 01000001. A text-to-binary converter automates this for any input.

What is the binary code for the letter A?

Uppercase A in ASCII is 01000001 (decimal 65). Lowercase a is 01100001 (decimal 97). The difference is exactly one bit — the 6th bit from the right.

Why do computers use binary instead of decimal?

Computer hardware is built from transistors that have two states: on and off. Binary (base-2) maps perfectly to these two states. Designing reliable circuits with just two voltage levels is much simpler and more energy-efficient than using ten levels for decimal.

How many bits are in a byte?

A byte contains 8 bits and can represent 256 different values (2 to the power of 8). One byte is enough to store a single ASCII character. The term byte was coined by Werner Buchholz at IBM in 1956.

What is the difference between binary and hexadecimal?

Both are number systems. Binary is base-2 (digits 0-1), while hexadecimal is base-16 (digits 0-9 and A-F). Hex is a compact way to write binary — each hex digit represents exactly 4 binary digits. For example, binary 11111111 = hex FF = decimal 255.

バイナリコード:コンピュータがテキストを保存・変換する仕組み

2026年3月31日 · 12分で読めます

バイナリコードとは?
テキストがバイナリになる仕組み
ASCII規格
ASCIIを超えて:Unicode
UTF-8、UTF-16、UTF-32の解説
バイナリ変換の例
実用的な応用
プログラミングでバイナリを扱う
よくあるエンコーディングの問題
重要なポイント
よくある質問
関連記事

画面上で読むすべてのテキスト — この文章も含めて — は、コンピュータ内部ではバイナリコード、つまり1と0の並びとして保存されています。バイナリ変換の仕組みを理解することで、テキストメッセージからウェブページ、ハードドライブ上のファイルまで、すべてのデジタル通信の基本的なメカニズムが明らかになります。

文字エンコーディングの問題をデバッグしている開発者、コンピュータサイエンスの基礎を学んでいる学生、あるいは単にテクノロジーの仕組みに興味がある方でも、このガイドはキーストロークからバイナリへ、そして再びテキストへと戻る完全な道のりをご案内します。

バイナリコードとは?

バイナリは、0と1の2つの数字のみを使用する2進数システムです。人間は0から9の数字を使って10進数(基数10)で自然に数えますが、コンピュータはバイナリで動作します。なぜなら、その基本的な構成要素であるトランジスタには、オン(1)とオフ(0)の2つの状態しかないからです。

コンピュータ内のすべてのデータは、テキスト、画像、音楽、動画を問わず、最終的にはこれら2つの数字のパターンとして表現されます。これは制限的に思えるかもしれませんが、バイナリのシンプルさこそが、電子回路にとって非常に強力で信頼性の高いものにしているのです。

ビットとバイトの理解

1つのバイナリ数字はビットと呼ばれます。8ビットをまとめたものがバイトで、256種類の異なる値を表現できます(2⁸ = 256)。これは英語のテキストで使用されるすべての文字、数字、記号をエンコードするのに十分であり、バイトがデジタルストレージの標準単位となった理由です。

バイナリの位の値は、右から左に読むと次のようになります:

位置	7	6	5	4	3	2	1	0
位の値	128	64	32	16	8	4	2	1
例: 01000001	0	1	0	0	0	0	0	1
計算	0	64	0	0	0	0	0	1

この例では、01000001は64 + 1 = 65(10進数)に等しく、ASCIIエンコーディングで文字「A」を表します。

プロのヒント: 当社のバイナリ変換ツールを使用すると、テキストをバイナリに、またその逆に即座に変換でき、これらの概念を実際に試すことが簡単になります。

テキストがバイナリになる仕組み

キーボードで文字を入力すると、コンピュータはその文字の形を保存するのではありません。代わりに、合意されたエンコーディング規格に従って、その文字を表す数字を保存します。その中で最も基本的なものがASCII(American Standard Code for Information Interchange)です。

文字「A」を入力したときに起こることを段階的に説明します:

キーボード信号: キーボードがどのキーが押されたかを識別する信号をコンピュータに送信
文字の検索: オペレーティングシステムが文字エンコーディングを検索:「A」= ASCIIで65
バイナリ変換: 数字65がバイナリに変換:01000001
保存または送信: これらの8ビットがメモリに保存されるか、ネットワーク経由で送信される
表示: 表示される際、プロセスが逆転:バイナリ → 数字 → 画面に描画される文字の形

このプロセス全体がマイクロ秒単位で行われ、ユーザーには完全に見えません。エンコーディング規格は、すべてのコンピュータが合意する普遍的な辞書として機能し、あるコンピュータで「Hello」と入力すると、別のコンピュータでも「Hello」と表示されることを保証します。

エンコーディング規格が重要な理由

標準化されたエンコーディングがなければ、デジタル通信は不可能でしょう。すべてのコンピュータメーカーが文字を表現するために独自のシステムを使用していたら、あるコンピュータで作成されたファイルは別のコンピュータでは意味不明になってしまいます。

エンコーディング規格は、どの数字がどの文字を表すかについての普遍的な合意を作成することで、この問題を解決します。これが、MacからWindows PCにメールを送信したり、日本で作成されたウェブサイトをブラジルのコンピュータで表示したりできる理由です。

ASCII規格

ASCII(American Standard Code for Information Interchange)は1960年代に開発され、コンピュータにおけるテキストエンコーディングの基礎となりました。7ビットを使用して128種類の異なる文字を表現します:

大文字(A-Z):コード65-90
小文字(a-z):コード97-122
数字(0-9):コード48-57
句読点と記号:さまざまなコード
制御文字:コード0-31(改行、タブ、バックスペースなど)

一般的なASCII文字のサンプルは次のとおりです:

文字	10進数	バイナリ	16進数
スペース	32	00100000	20
0	48	00110000	30
A	65	01000001	41
a	97	01100001	61
!	33	00100001	21
?	63	00111111	3F

ASCIIの限界

ASCIIは当時としては革命的でしたが、大きな制限があります。わずか128文字しかないため、ASCIIは英語の文字と基本的な記号しか表現できません。以下のものは扱えません:

アクセント付き文字(é、ñ、ü)
非ラテン文字(ギリシャ文字、キリル文字、アラビア文字)
アジアの文字体系(中国語、日本語、韓国語)
絵文字と現代的な記号

拡張ASCII(256文字のために8ビットを使用)はいくつかのアクセント付き文字を追加しましたが、地域によって異なる拡張が使用され、互換性の問題が生じました。ここでUnicodeの出番です。

クイックヒント: レガシーシステムやシンプルな英語テキストを扱う場合、ASCIIは依然として完全に適切で、Unicodeよりも少ないストレージスペースを使用します。当社のASCII変換ツールを使用して、ASCII値を直接操作できます。

ASCIIを超えて:Unicode

Unicodeは1990年代に、地球上で使用されるすべての文字体系のすべての文字に一意の番号(「コードポイント」と呼ばれる)を提供することで、ASCIIの限界を解決するために作成されました。2026年現在、Unicodeには159の現代および歴史的な文字体系をカバーする149,000以上の文字が含まれています。

Unicodeは各文字にU+に続く16進数で書かれたコードポイントを割り当てます。例えば:

U+0041 = A(ラテン大文字A)
U+03B1 = α(ギリシャ小文字アルファ)
U+4E2D = 中(「中」を意味する漢字)
U+1F600 = 😀(笑顔の絵文字)

UnicodeとUTF:違いの理解

ここで多くの人が混乱します:Unicodeはエンコーディングではありません。Unicodeは文字セット、つまり文字に番号を割り当てるリストです。UTF(Unicode Transformation Format)エンコーディングは、それらの番号をバイナリデータとして表現する方法です。

こう考えてください:Unicodeは、すべての人に一意の番号を割り当てる電話帳のようなものです。UTFエンコーディングは、それらの電話番号を書き留めるさまざまな方法(国コードの有無、ダッシュの有無など)です。

UTF-8、UTF-16、UTF-32の解説

主なUTFエンコーディングには3つあり、それぞれ異なるトレードオフがあります:

UTF-8:ウェブ標準

UTF-8は、文字ごとに1〜4バイトを使用する可変長エンコーディングです。ASCIIと後方互換性があり、最初の128文字はASCIIとまったく同じバイナリ表現を使用します。

利点:

英語テキストに効率的(文字あたり1バイト)
ASCIIと後方互換性がある
バイトオーダーの問題がない
ウェブで支配的(ウェブサイトの98%以上)

欠点:

アジア言語には効率が悪い(文字あたり3〜4バイト)
可変長のためインデックス作成が複雑

UTF-16:Windowsのデフォルト

UTF-16は文字ごとに2または4バイトを使用します。最も一般的な文字は2バイトに収まりますが、まれな文字と絵文字は4バイト(「サロゲートペア」を使用)が必要です。

利点:

ほとんどの言語に効率的(文字あたり2バイト)
Windows、Java、JavaScriptで内部的に使用される

欠点:

ASCIIと後方互換性がない
バイトオーダーの問題(ビッグエンディアン対リトルエンディアン)
まれな文字では依然として可変長

UTF-32:固定長

UTF-32はすべての文字に正確に4バイトを使用し、唯一の固定長Unicodeエンコーディングです。

利点:

シンプルなインデックス作成(文字Nはバイト位置N×4にある)
複雑なデコードロジックが不要

欠点:

スペースの無駄(シンプルなASCII文字でも4バイト)
実際にはほとんど使用されない

プロのヒント: ウェブアプリケーションを構築する際は、常にUTF-8を使用してください。これはインターネット標準で、どこでもサポートされており、ほとんどのコンテンツに効率的です。HTMLで<meta charset="UTF-8">、HTTPヘッダーでContent-Type: text/html; charset=UTF-8を指定してください。

バイナリ変換の例

テキストがバイナリになり、再びテキストに戻る具体的な例をいくつか見てみましょう。

例1:シンプルなASCII単語

ASCIIでの単語「Hi」:

H = 10進数72 = バイナリ01001000
i = 10進数105 = バイナリ01101001

完全なバイナリ: 01001000 01101001

ファイルに保存されたり、ネットワーク経由で送信されたりする際、これらの16ビット(2バイト)が単語「Hi」を表します。

例2:大文字小文字混在と句読点

フレーズ「Hello!」は次のように分解されます:

文字	10進数	バイナリ
H	72	01001000
e	101	01100101
l	108	01101100
l	108	01101100
o	111	01101111
!	33	00100001

合計:48ビット(6バイト)のデータ。

例3:Unicode絵文字

絵文字😀(笑顔)はUnicodeでU+1F600です。UTF-8では、4バイトとしてエンコードされます:

11110000 10011111 10011000 10000000

これは、UTF-8が可変長である理由を示しています — シンプルな「A」は1バイトですが、絵文字は4バイトかかります。

バイナリをテキストに変換

バイナリをテキストに戻すには、プロセスを逆にします:

バイナリ数字をバイト(各8ビット)にグループ化
各バイトを10進数値に変換
エンコーディングテーブルでその値の文字を検索
文字を組み合わせてテキストを形成

例えば、01001000 01100101 01111001を受信した場合:

01001000 = 72 = H
01100101 = 101 = e
01111001 = 121 = y

結果: "Hey"

実用的な応用

バイナリテキストエンコーディングの理解は単なる学問的なものではなく、多くの分野で実際の応用があります。

ウェブ開発

ウェブ開発者はエンコーディングの問題に定期的に遭遇します。一般的なシナリオには以下が含まれます:

フォーム送信: サーバーに送信される際にユーザー入力が適切にエンコードされることを保証
データベースストレージ: データベースカラムに適切な文字セットを選択
APIレスポンス: 文字セット情報を含む正しいContent-Typeヘッダーの設定
URLエンコーディング: 特殊文字をパーセントエンコード形式に変換

当社のURLエンコーダーツールは、URLエンコーディングを自動的に処理し、特殊文字をパーセントエンコードされた同等物に変換します。

データ分析と処理

データサイエンティストとアナリストは、以下の場合にエンコーディングを理解する必要があります:

さまざまなソースからのCSVファイルの読み取り
国際文字を含むウェブコンテンツのスクレイピング
さまざまなシステムからのログファイルの処理
機械学習モデル用のテキストデータのクリーニング

サイバーセキュリティ

セキュリティ専門家は、以下のためにバイナリエンコーディングの知識を使用します:

マルウェアの分析: 悪意のあるコードがバイナリデータにどのように隠れているかを理解
フォレンジック: ファイルヘッダーとメタデータの調査
暗号化: エンコードおよび暗号化されたデータの操作
ステガノグラフィー: バイナリファイル内の隠されたメッセージの検出

ファイル形式の設計

カスタムファイル形式を設計する際、以下を決定する必要があります:

テキストフィールドに使用するエンコーディング
エンコーディングをマークする方法