Muchos de los correos electrónicos publicados por el Departamento de Justicia sobre la investigación de Jeffrey Epstein son lleno de símbolos distorsionados como:

El texto codificado es tan omnipresente que ha generado teorías de conspiración que podrían ser algún tipo de código. Pero por muy creíble que sea que una camarilla de traficantes sexuales de élite se comunicara en un lenguaje secreto, la realidad es probablemente más aburrida: los símbolos probablemente sean artefactos de la forma en que el Departamento de Justicia convirtió los correos electrónicos en archivos PDF.

“Los glifos y símbolos son probablemente algún artefacto de un proceso de conversión deficiente”, dijo Chris Prom, profesor y archivero de la Universidad de Illinois Urbana-Champaign. Específicamente, los símbolos parecen trozos de Extensiones de correo de Internet multifuncionaleso MIME, un estándar de 30 años para codificar correos electrónicos. El protocolo subyacente del correo electrónico transmite mensajes como secuencias cortas de caracteres ASCII simples, por lo que cuando la gente comenzó a escribir mensajes más largos y a tratar de incluir formato y símbolos, se desarrolló MIME como una forma de codificarlos en ASCII.

Con MIME, el “=” se utiliza para indicar que una cadena de texto debe dividirse para su transmisión y volver a unirse (un “salto de línea suave”) o, cuando va seguido de otros dos caracteres, que debe convertirse en una etiqueta específica no ASCII. Si quisiera escribir “=” en un correo electrónico, por ejemplo, se codificaría como “=3D”. Durante el uso normal, el cliente de correo electrónico del destinatario decodifica estos símbolos antes de mostrar el mensaje formateado.

Cualquiera que sea el software que utilizó el Departamento de Justicia para extraer los correos electrónicos y convertirlos a PDF parece haber distorsionado parte de la decodificación, dijo Peter Wyatt, director de tecnología de la PDF Association, quien examinó un lote de archivos. Documentos de Epstein.

“Salió en las noticias y había muchos archivos PDF”, dijo. La asociación realizó análisis similares del informe Mueller y los documentos de Manafort. “En términos generales, nos interesa todo lo relacionado con PDF. Eso es lo que hacemos y lo que hacemos”.

La claridad del texto y las URL llevaron a Wyatt a creer que estos documentos se extrajeron digitalmente y luego se convirtieron a PDF, en lugar de imprimirlos y escanearlos físicamente como el El informe Mueller fue. “Así que las cosas han mejorado desde entonces”, dijo Wyatt.

Específicamente, el Departamento de Justicia probablemente extrajo los datos del correo electrónico, los convirtió a PDF y luego los editó. Para eliminar los metadatos del documento e incrustar las redacciones para que no se pudieran eliminar las barras negras, convirtieron los documentos a archivos de imagen como JPEG antes de convertirlos. volver en PDF. El software utilizado inicialmente para extraer y convertir los datos también capturó partes del formato MIME subyacente en lugar de decodificarlo adecuadamente. O más simplemente: correos electrónicos, a veces parcialmente decodificados, convertidos a PDF, convertidos a JPEG, convertidos a PDF.

Esto al menos explica la profusión de “=”. Pero no explica completamente por qué el “=” a veces reemplaza letras, como la “J” en “Jeffrey”. Nadie con quien hablé pudo responder definitivamente a esta pregunta, aparte de decir que el correo electrónico es difícil y convertirlo a PDF es más difícil, y que el Departamento de Justicia estaba convirtiendo muchos documentos rápidamente. (Las redacciones también fueron notablemente inconsistentes entre los archivos).

Prom pensó que podría ser un problema de conversión del juego de caracteres, que veía a menudo cuando la herramienta de archivo que estaba probando no podía encontrar el juego de caracteres o la fuente específicos que estaba usando el servidor de correo electrónico.

Craig Ball, un examinador forense que enseña en la Facultad de Derecho de la Universidad de Texas en Austin, señaló que diferentes clientes de correo electrónico implementan estándares de maneras ligeramente diferentes, lo que aumenta la dificultad de la conversión. “Mi conjetura es que se trata de una incompatibilidad entre las páginas de códigos utilizadas por el cliente de correo electrónico que envía (posiblemente un BlackBerry) y la aplicación utilizada para imprimir los mensajes PDF”, escribió Ball. “La presencia de firmas de BlackBerry y iPhone en estos correos electrónicos sugiere que los mensajes pasaron por múltiples sistemas con diferentes prácticas de codificación, lo que agrava los problemas de decodificación durante la generación del PDF”.

“Estás viendo cientos de métodos diferentes para convertir estos archivos de cientos de personas diferentes usando cualquier software disponible, algunos de los cuales pueden haber sido buenos, otros pueden no haberlo sido”, dijo Prom.

“El estándar PDF es bastante complejo”, escribió Prom. “Y enviar PDF por correo electrónico es particularmente complicado”.

Seguir temas y autores de esta historia para ver más como esta en su feed de inicio personalizado y recibir actualizaciones por correo electrónico.


Fuente