용어집
이메일 및 MBOX 용어집
이메일 아카이브, 형식, 프로토콜 및 메시지 구조에 관한 핵심 용어 — 각 항목마다 별도 페이지에서 쉬운 언어로 설명합니다.
파일 형식
여러 이메일 메시지를 하나의 파일에 순서대로 저장하는 일반 텍스트 형식으로, 각 메시지는 "From " 구분 줄로 시작합니다. Gmail 아카이브를 내보낼 때 Google Takeout이 생성하는 형식입니다.
헤더, 본문, 첨부 파일을 포함하는 MIME 형식의 단일 메시지 파일입니다. EML 파일은 다양한 이메일 클라이언트에서 널리 지원되며, 개별 메시지를 보관하거나 공유하는 데 유용합니다.
헤더, 본문, 첨부 파일을 복합 문서 구조로 저장하는 단일 이메일 메시지용 Microsoft Outlook 전용 바이너리 형식입니다. EML과 달리 MSG는 일반 텍스트 표준이 아닙니다.
Personal Storage Table — 폴더, 메시지, 연락처, 캘린더 항목을 포함하는 전체 메일함의 Microsoft Outlook 컨테이너 파일입니다. Exchange 또는 Microsoft 365와 오프라인 동기화에 사용될 때는 OST라고도 합니다.
모든 메시지를 MBOX처럼 단일 파일에 연결하는 대신, 각 이메일 메시지를 디렉토리 계층 구조 내의 별도 파일로 저장하는 메일함 형식입니다.
프로토콜 및 서비스
Internet Message Access Protocol — 서버에 저장된 이메일에 접근하는 표준 프로토콜로, 메시지를 다운로드하거나 삭제하지 않고 여러 기기에서 동기화된 상태를 유지합니다.
Post Office Protocol 3 — 서버에서 로컬 기기로 메시지를 다운로드하는 오래된 이메일 수신 프로토콜로, 일반적으로 이후 서버에서 메시지를 삭제합니다.
Simple Mail Transfer Protocol — 메일 서버 간에 이메일 메시지를 전송하고 중계하는 데 사용되는 표준 프로토콜입니다. 발신 메일 전용으로 사용되며, 이메일 읽기는 IMAP 또는 POP3가 필요합니다.
Gmail을 포함한 개인 데이터를 내보내는 Google의 공식 서비스입니다. 이메일의 경우 모든 메시지와 Gmail 레이블이 포함된 하나 이상의 MBOX 파일을 생성합니다.
각 메시지에 하나 이상의 레이블을 할당하는 Gmail의 태깅 시스템으로, 기존 이메일 클라이언트에서 폴더가 담당하는 역할을 합니다. 단일 메시지가 여러 레이블을 동시에 가질 수 있습니다.
메시지 구조
이메일 메시지 시작 부분의 구조화된 메타데이터 블록으로, From, To, Subject, Date 필드와 메시지가 어떻게 작성되고 라우팅되며 인코딩되었는지를 설명하는 수많은 기술적 필드를 포함합니다.
Multipurpose Internet Mail Extensions — 이메일의 일반 텍스트 구조 내에서 비 ASCII 텍스트, HTML 본문, 첨부 파일 및 기타 바이너리 콘텐츠를 인코딩하는 방법을 정의하는 표준입니다.
일반 텍스트, HTML, 첨부 파일 등 여러 콘텐츠 파트를 고유한 경계 문자열로 구분하여 단일 메시지에 결합하는 MIME 메시지 구조입니다.
Message-ID 헤더에 지정된 각 이메일 메시지에 할당된 전 세계적으로 고유한 식별자입니다. 메시지 추적, 대화 스레드 구성, 아카이브 병합 시 중복 감지에 사용됩니다.
답장이 응답하는 메시지와 연결하는 이메일 헤더(In-Reply-To 및 References)로, 메일 클라이언트와 아카이브 도구가 관련 메시지를 대화 스레드로 그룹화할 수 있게 합니다.
SMTP 서버가 이메일 메시지를 라우팅하는 데 사용하는 전달 메타데이터로, 구체적으로는 봉투 발신자(MAIL FROM)와 봉투 수신자(RCPT TO)를 말하며, 이는 표시되는 From 및 To 헤더와 다를 수 있습니다.
메시지 본문과 별도로 MIME 파트로 인코딩되어 이메일 메시지에 내장된 PDF, 이미지, 스프레드시트 등의 파일로, 수신자가 저장하거나 열도록 설계되었습니다.
별도의 다운로드 가능한 파일로 첨부되지 않고 Content-ID(cid:) 참조를 사용하여 HTML 이메일 본문에 직접 내장된 이미지입니다. 이미지 데이터는 동일한 메시지 내의 MIME 파트로 저장됩니다.
인코딩 및 문자 집합
텍스트 파트의 바이트가 읽기 가능한 문자로 매핑되는 방식을 지정하는 문자 인코딩입니다. 일반적인 문자셋에는 UTF-8, ISO-8859-1, Shift_JIS가 있으며, 불일치는 모지바케라고 알려진 깨진 텍스트를 유발합니다.
64개의 인쇄 가능한 ASCII 문자만을 사용하여 임의의 바이너리 데이터를 표현하는 이진-텍스트 인코딩 체계로, 이메일에서 첨부 파일과 바이너리 콘텐츠를 안전하게 전송하는 데 널리 사용됩니다.
주로 ASCII 문자로 구성된 텍스트를 나타내는 MIME 전송 인코딩으로, 비 ASCII 바이트를 =XX 16진수 시퀀스로 이스케이프합니다. 원시 메시지 소스에서 대부분의 텍스트를 사람이 읽을 수 있는 상태로 유지합니다.
이메일 헤더 필드에서 비 ASCII 문자를 허용하기 위해 RFC 2047("Encoded-Word")에 정의된 인코딩 체계로, =?charset?encoding?text?= 토큰으로 인코딩합니다.
개념 및 기능
In-Reply-To 및 References 헤더 링크를 따라 관련 이메일 메시지를 대화로 그룹화하는 프로세스로, 일반적으로 최대 4단계 중첩을 지원하는 JWZ 알고리즘을 사용합니다.
여러 MBOX 파일을 병합할 때 중복성을 피하기 위해 일반적으로 Message-ID 값을 비교하여 아카이브에서 중복 이메일 메시지를 감지하고 제거하는 프로세스입니다.
파일 전체를 한 번에 메모리에 로드하는 대신 작은 청크로 점진적으로 읽는 파싱 기법으로, 도구가 수십 또는 수백 기가바이트의 매우 큰 MBOX 파일을 낮은 메모리 사용량으로 열고 인덱싱할 수 있게 합니다.
Mbox Viewer가 첫 번째 파싱 후 MBOX 아카이브 옆에 쓰는 압축 인덱스 파일로, 전체 파일을 다시 스캔하지 않고 거의 즉각적인 재열기를 가능하게 하는 메시지 바이트 오프셋과 메타데이터를 저장합니다.
HTML과 CSS로 형식화된 본문을 가진 이메일 메시지로, 풍부한 타이포그래피, 레이아웃, 색상 및 이미지를 허용합니다. 대부분의 현대 이메일은 HTML이지만 개인 정보 보호와 보안 고려 사항으로 인해 신중한 렌더링이 필요합니다.
Apple Silicon(ARM64)과 Intel(x86_64) 아키텍처 모두를 위한 기본 컴파일 코드를 포함하는 macOS 애플리케이션 번들로, 에뮬레이션 없이 어느 프로세서에서도 기본적으로 실행됩니다.
App Sandbox는 애플리케이션의 시스템 리소스, 파일 및 네트워크 연결 접근을 제한하는 macOS 보안 기능으로, 앱 또는 그 의존성에 취약점이 있을 때 잠재적 영향을 제한합니다.