lunes, 24 de septiembre de 2007

Un PDF de la FIA deja ver datos sensibles del caso Ferrari vs. McLaren

Suponiendo que no es necesario explicar el caso de espionaje, Ferrari vs. McLaren, resulta que la FIA publicó en su web las transcripciones de las reuniones sobre este caso.

Antes de su publicación, el borrador del documento fue revisado por Ferrari y McLaren para que indicaran el contenido confidencial que los protagonistas revelaron en sus declaraciones, como por ejemplo datos sensibles o relativos a su tecnología, cuyo conocimiento precisamente ha desatado la investigación y posterior sanción.

Una vez que el documento fue revisado y convenientemente censurado, la FIA lo publicó en su servidor web en formato PDF. La visualización del documento muestra algunas porciones del texto ocultas por un rectángulo negro superpuesto. Si bien, el texto original continúa ahí debajo, a golpe de mouse.

Basta con seleccionar el texto en el PDF (incluyendo las zonas ocultas), copiar, pegar en el bloc de notas o cualquier otro sitio, y el texto censurado de las declaraciones de Pedro de la Rosa y compañía quedan al descubierto.

Como era de esperar, nada más conocerse el error de bulto, la FIA ha cambiado el PDF de su web con una nueva versión. Si bien ya es demasiado tarde, la versión original ya circula por Internet.

Si sos aficionado a la Formula 1 y querés conocer los detalles, como por ejemplo lo que gana un ingeniero de Ferrari, la información que manejaban Alonso y Pedro, o simplemente querés probar como revelar información "oculta" en un PDF, podés hacerlo descargando el documento original.

Técnicamente no deja de ser una anécdota que ocurre a diario, un error de bulto de quién generó el documento por desconocer las funciones básicas de protección del formato PDF. Sin embargo llama la atención que ocurra en un caso de tanta repercusión mediática y donde precisamente el organismo que comete el error ha impuesto una sanción de millones de euros por tráfico y conocimiento de este tipo de datos.

Si se hubieran aplicado algunas medidas de seguridad (por ejemplo, es posible impedir acciones como copiar y pegar en PDF), no sería posible acceder al texto oculto. Por ello es importante que a la hora de generar archivos públicos se elimine explícitamente la información sensible teniendo en cuenta las características del formato, lo que puede requerir eliminar datos ocultos (metadatos en Word, thumbnails que las cámaras de fotos digitales incluyen en los archivos de fotografías, etc).

Recordemos, los documentos incluyen información que no está visible a simple vista cuyos datos pueden llegar a ser sensibles (información borrada, autor y revisores del documento, número de licencia del programa, datos del ordenador donde fue generado, metadatos adicionales, etc). Si no se tiene un control sobre el formato, se tienen dudas sobre lo que puede llegar a contener, o dificultad para realizar la limpieza de metadatos ocultos, otra opción es optar por publicar en formatos más transparentes y/o básicos.

Me imagino la secuencia:
Bernie a su secretario: Redacta el documento y subilo a la página.
Secretario->Subsecretario->Asesor->Ayudante->Becario

Y el becario, que acaba de terminar quinto de violín, pues....
Vergonzoso.
Basta con utlizar la herramienta de retoque de objetos de Acrobat Professional, seleccionar el rectangulo negro que corresponda, presionar la tecla Suprimir y Voila! ya tenemos el documento original completo.
Lo siento por las horas que utilizó el becario para poner los malditos rectangulos negros.
Si usas Firefox con el complemento "PDF Download" y lo abrís como HTML, los cuadros negros aparecen en el margen derecho sin tapar nada del texto.
Con el Ghostscript y Gsview (http://pages.cs.wisc.edu/~ghost/) se puede pasar a texto cualquier pdf o imprimir ficheros con protección. Y encima es gratuito.

No hay comentarios.: