Skip to main content

Uso del formato mbox para almacenar correo en su disco duro

Descargar mis correos GMAIL a MBOX y como gestionarlos (Junio 2026)

Descargar mis correos GMAIL a MBOX y como gestionarlos (Junio 2026)
Anonim

El formato más común para el almacenamiento de mensajes de correo es el formato mbox. MBOX significa MailBOX. Un mbox es un archivo único que contiene cero o más mensajes de correo.

El formato mbox

Si usamos el formato mbox para almacenar correos electrónicos, los colocamos todos en un archivo. Esto crea un archivo de texto más o menos largo (el correo electrónico de Internet siempre existe solo como texto ASCII de 7 bits, todo lo demás (adjuntos, por ejemplo, está codificado) que contiene un mensaje de correo electrónico tras otro. ¿Cómo sabemos dónde termina uno y comienza otro?

Afortunadamente, cada correo electrónico tiene al menos una línea de origen desde el principio. Cada mensaje comienza con "De" (De seguido de un carácter de espacio en blanco, también llamado línea "From_"). Si esta secuencia ("De") al principio de una línea está precedida por una línea vacía o está en la parte superior del archivo, hemos encontrado el principio de un mensaje.

Entonces, lo que buscamos cuando analizamos un archivo mbox es, esencialmente, una línea vacía seguida de "De".

Como expresión regular, podemos escribir esto como " n nFrom. * N". Sólo el primer mensaje es diferente. Comienza simplemente con "Desde" al principio de una línea ("^ Desde. * N").

"De" en el Cuerpo

¿Qué sucede si la secuencia anterior aparece exactamente en el cuerpo de un mensaje de correo electrónico? ¿Qué pasa si lo siguiente es parte de un correo electrónico?

  • … te mando el informe más reciente.
  • A partir de este informe, no es necesario …

Aquí, tenemos una línea vacía seguida de "Desde" al principio de la línea. Si esto aparece en un archivo mbox, tenemos inequívocamente el comienzo de un nuevo mensaje. Al menos, eso es lo que piensa el analizador y por qué tanto el cliente de correo electrónico como nosotros estaríamos bastante confundidos por un mensaje de correo electrónico que no contiene remitente ni destinatario, pero comienza con "De este informe".

Para evitar estas condiciones desastrosas, debemos asegurarnos de que "De" nunca aparezca al principio de una línea después de una línea vacía en el cuerpo de un correo electrónico.

Cada vez que agregamos un nuevo mensaje a un archivo mbox, buscamos dichas secuencias en el cuerpo y simplemente reemplazamos "De" con "> De". Esto hace que las interpretaciones erróneas sean imposibles. El ejemplo anterior ahora tiene este aspecto y ya no se activa el analizador:

  • … te mando el informe más reciente.
  • > A partir de este informe, no es necesario …

Esta es la razón por la que a veces puede encontrar "> De" en un correo electrónico donde se esperaría un simple "De".