miércoles, 23 de mayo de 2007

Conservación de documentos electrónicos

Aunque no es muy conocido existe un formato PDF orientado al archivo de documentos a largo plazo. Es el PDF/A basado en el formato PDF 1.4 (implementado en Acrobat 5) y es un estandar ISO (19005).
Este formato está diseñado específicamente para la conservación a largo plazo de documentos y es ideal para guardar documentación electrónica, un modo de conseguir la administración sin papeles que nunca acaba de llegar. Es preferible a la conservación de documentos en formatos gráficos como el TIFF ya que permite realizar búsquedas en textos, permite introducir metadatos y además ocupa menos espacio.
Por todos es conocida la portabilidad de los documentos PDF que pueden visualizarse prácticamente en cualquier sistema o dispositivo para mostrar información. Utilizar PDF "a secas" significa no dar claramente una especificación, ya que Adobe ha publicado (y sigue haciéndolo) varias versiones de su formato al que sucesivamente va añadiendo más características y mejoras. Por eso se hizo necesaria la definición de un formato para tener una definición estándar y estable en el tiempo. Parece ser que es un formato sin restricciones de uso, no hay patentes conocidas, lo que no quiere decir que no las haya realmente como ya ha ocurrido en otros casos donde solo cuando un producto se ha hecho un estándar de facto y es utilizado de forma generalizada es cuando ha salido alguno diciendo "yo tengo la patente" (por ejemplo con los formatos GIF o MP3).
Otra alternativa sería usar OpenDocument, que es también un estándar y también tiene las características de búsqueda de textos, metadatos, etc. Además ya existe software libre que soporta este tipo de formato (desconozco que exista a dia de hoy software libre para soportar PDF/A (sí lo hay para PDF 1.4 pero no es exactamente el mismo formato)). Si alguien conoce un estudio serio al respecto que lo comente. Por cierto que a mí, personalmente, me inspira más confianza el OpenDocument.

2 comentarios:

Jofegaber dijo...

Muchas gracias por el articulo.

Sabes como funciona el proceso?, es decir, que debo de hacer para convertir un documento escrito a mano en pdf?... Usar un programa OCR?

RioPando dijo...

Hola jofegaber.

Si lo que quieres es digitalizar documentos escritos a mano, lo suyo es escanearlos y pasarlos a PDF. Eso sí quedarán como imágenes porque a día de hoy reconocer caracteres escritos a mano se escapa de los OCR que yo conozco.