用語集
メール・MBOX 用語集
メールアーカイブ、フォーマット、プロトコル、メッセージの構造に関する重要な用語を平易な言葉で解説します。各用語には専用ページがあります。
ファイル形式
複数のメールメッセージを連結して保存するプレーンテキストのファイル形式で、各メッセージは「From 」セパレーター行で始まります。Google Takeout が Gmail アーカイブをエクスポートする際に生成する形式です。
ヘッダー、本文、添付ファイルを含む MIME 形式の単一メッセージファイルです。EML ファイルは多くのメールクライアントで広くサポートされており、個別メッセージのアーカイブや共有に便利です。
Microsoft Outlook の独自バイナリ形式で、ヘッダー、本文、添付ファイルを Compound Document Structure に保存します。EML とは異なり、MSG はプレーンテキストの標準規格ではありません。
Personal Storage Table — フォルダー、メッセージ、連絡先、カレンダーアイテムを含むメールボックス全体を格納する Microsoft Outlook のコンテナファイルです。Exchange または Microsoft 365 とのオフライン同期に使用する場合は OST とも呼ばれます。
MBOX のようにすべてのメッセージを単一ファイルに連結するのではなく、各メールメッセージをディレクトリ階層内の個別ファイルとして保存するメールボックス形式です。
プロトコルとサービス
Internet Message Access Protocol — メッセージをダウンロードして削除することなく複数のデバイス間で同期を保ちながら、サーバーに保存されたメールにアクセスするための標準プロトコルです。
Post Office Protocol 3 — サーバーからローカルデバイスにメッセージをダウンロードし、通常その後サーバーから削除する古いメール取得プロトコルです。
Simple Mail Transfer Protocol — メールサーバー間でメールメッセージを送信・中継するための標準プロトコルです。送信メールのみに使用され、メールの読み取りには IMAP または POP3 が必要です。
Gmail を含む個人データをエクスポートするための Google の公式サービスです。メールについては、すべてのメッセージと Gmail ラベルを含む一つ以上の MBOX ファイルを生成します。
各メッセージに一つ以上のラベルを割り当てる Gmail のタグ付けシステムで、従来のメールクライアントのフォルダーと同様の役割を果たします。単一のメッセージに複数のラベルを同時に付けることができます。
メッセージ構造
メールメッセージの冒頭にある構造化されたメタデータブロックで、From、To、Subject、Date などのフィールドと、メッセージの作成、ルーティング、エンコード方法を説明する多数の技術的フィールドを含みます。
Multipurpose Internet Mail Extensions — メールの ASCII テキスト構造の中で、非 ASCII テキスト、HTML 本文、添付ファイル、その他のバイナリコンテンツをエンコードする方法を定義する標準規格です。
プレーンテキスト、HTML、添付ファイルなど複数のコンテンツパートを単一メッセージ内で組み合わせる MIME メッセージ構造で、各パートはユニークなバウンダリ文字列で区切られます。
Message-ID ヘッダーで指定された各メールメッセージに割り当てられたグローバルに一意な識別子です。メッセージの追跡、会話スレッドの構築、複数の MBOX ファイルをマージする際の重複検出に使用されます。
メールクライアントとアーカイブツールが関連するメッセージを会話スレッドにグループ化できるよう、返信を応答先のメッセージにリンクするメールヘッダー(In-Reply-To および References)です。
SMTP サーバーがメールメッセージをルーティングするために使用する配信メタデータ—具体的にはエンベロープ送信者(MAIL FROM)とエンベロープ受信者(RCPT TO)—で、表示上の From および To ヘッダーとは異なる場合があります。
PDF、画像、スプレッドシートなど、メールメッセージに MIME パートとしてエンコードされ、メッセージ本文とは別に、受信者が保存または開くことを目的としてファイルを埋め込んだものです。
独立したダウンロード可能なファイルとして添付するのではなく、Content-ID(cid:)参照を使用して HTML メール本文に直接埋め込まれた画像です。画像データは同じメッセージ内の MIME パートとして保存されます。
エンコーディングと文字セット
テキストパートのバイトを読める文字にマッピングする方法を指定する文字エンコーディングです。一般的な文字セットには UTF-8、ISO-8859-1、Shift_JIS などがあり、不一致は文字化けと呼ばれる乱れたテキストを引き起こします。
64個の印刷可能な ASCII 文字のみを使用して任意のバイナリデータを表現するバイナリからテキストへのエンコーディング方式で、添付ファイルやバイナリコンテンツを安全に送信するためにメールで広く使用されています。
主に ASCII 文字で構成されるテキストに対する MIME 転送エンコーディングで、非 ASCII バイトを =XX の16進数シーケンスとしてエスケープします。生のメッセージソース内でテキストの大部分を人間が読める状態に保ちます。
Subject や From などのメールヘッダーフィールドに非 ASCII 文字を使用できるようにする RFC 2047(「Encoded-Word」)で定義されたエンコーディング方式で、=?charset?encoding?text?= トークンとしてエンコードします。
概念と機能
In-Reply-To および References ヘッダーリンクをたどって関連するメールメッセージを会話にグループ化するプロセスで、最大4レベルのネストをサポートする JWZ アルゴリズムを一般的に使用します。
複数の MBOX ファイルをマージする際の冗長性を回避するために、通常 Message-ID 値を比較することでアーカイブから重複したメールメッセージを検出・削除するプロセスです。
ファイル全体を一度にメモリに読み込むのではなく、小さなチャンクに分けてインクリメンタルにファイルを読み取る解析技術で、数十〜数百ギガバイトの非常に大きな MBOX ファイルを低メモリ使用量で開き、インデックス化することを可能にします。
Mbox Viewer が最初の解析後に MBOX アーカイブと並んで書き込むコンパクトなインデックスファイルで、ファイル全体を再スキャンすることなくほぼ瞬時の再起動を可能にするメッセージのバイトオフセットとメタデータを保存します。
本文が HTML と CSS でフォーマットされたメールメッセージで、リッチなタイポグラフィ、レイアウト、色、画像を可能にします。現代のメールのほとんどは HTML ですが、プライバシーとセキュリティの考慮が慎重なレンダリングを必要とします。
Apple Silicon(ARM64)と Intel(x86_64)の両アーキテクチャ向けにネイティブコンパイルされたコードを含む macOS アプリケーションバンドルで、エミュレーションなしにいずれのプロセッサ上でもネイティブに動作します。
App Sandbox は macOS のセキュリティ機能で、アプリケーションのシステムリソース、ファイル、ネットワーク接続へのアクセスを制限し、アプリまたはその依存関係に脆弱性がある場合の潜在的な影響を限定します。