Pasar de pdf a odt
Diciembre 11, 2007 at 1:03 am | In General | 11 CommentsTags: convertir, linux, odt, pdf, Ubuntu y software para GNU, xpdf
Hoy estuve tratando de convertir un documento en formato .pdf a .odt y me encontré con algunas cosas interesantes.
Básicamente encontré dos formas de hacerlo, pero ninguna logró un resultado 100% eficiente.
La primer, y mejor alternativa según mi parecer, es instalar el programa “xpdf”
Este, en realidad es una suite de herramientas para archivos PDF. Que comprende: Un visualizador de documentos (pdf obviamente), junto con una serie de programas en línea de comandos, por ejemplo: pasar de pdf a txt con pdftotext, extraer las imagenes con pdfimages, o pasar pdf a documentos PostScript con pdftops.
Yes esta parte la que nos interesa en este caso. Para pasar de pdf a txt, es tan sencillo como abrir un terminal en la carpeta del pdf y escribir
$ pdftotext archivo.pdf
Esto nos generará un archivo del mismo nombre que el pdf pero en formato txt. Si queremos obtener un .odt en forma directa:
$ pdftotext archivo.pdf archivo.odt
Eso es todo, pero hay algunos inconvenientes: El archivo no debe de ser demasiado complejo en su formato de texto, de lo contrario el archivo convertido será un caos, o directamente nos dará error y no podrá realizarse la conversión. Obviamente sólo convertirá el texto, si hay imágenes deberán ser extraídas con pdfimages.
La otra solución que encontré es instalar “Kword” que es el editor de textos de Koffice, el cual trae la opción de importar archivos pdf y guardarlos en odt. La ventaja de este método es que importa texto e imágenes juntos, aunque para texto sólo xpdf me dió mejores resultados.
Está en ustedes probar cual es mas de su agrado, yo personalmente escojo xpdf, ya que es una herramienta muy útil orientada sólo a archivos pdf. En cambio Kword es un editor de textos (que ya tengo y me gusta el que tengo: Open office writer).
Ha, me olvidaba, para instalar xpdf y kword:
$ sudo aptitude install xpdf
$ sudo aptitude install kword
Respectivamente.
Espero les sirva.
11 comentarios »
Canal RSS de los comentarios de la entrada. URI para TrackBack.
Deja un comentario
Blog de WordPress.com. | Theme: Pool by Borja Fernandez.
Entries and comments feeds.

Anda de lujo, mucho mejor que cualquier programa simil de Windows.
grax por el dato. Saludos.
Comment por Danieru — Marzo 19, 2008 #
De nada!! gracias por comentar en mi blog!!
Comment por guisheca — Marzo 19, 2008 #
Como dijo Danieru, de lujo.
Yo utilizaba el xpdf (con soporte para gallego) y la herramienta de selección de texto, pero con tu ayuda de la linea de comandos el trabajo es mucho más sencillo, y da muy buneos resultados, aunque siempre hay que reeditar el texto para introducir saltos de linea.
Es una pena que no lo incluyan en el menú. Siempre hay que andar buscando por la red para sacarle partido a programas.
Muchas gracias.
Comment por Ton — Mayo 28, 2008 #
gracias por la informacion estubo bakanisima
estoy probando gracias
Comment por jose baeza — Septiembre 4, 2008 #
buenisimo muy util
GRACIAS
Comment por julio — Marzo 1, 2009 #
De nada julio, me alegro que te haya servido.
Comment por guisheca — Marzo 1, 2009 #
Muchas gracias. No está mal pero personalmente los mejores resultados los conseguido con el conversor de la página:
http://www.zamzar.com/
Pruébalo a ver que te parece…..
Comment por José Luis — Junio 16, 2009 #
me sale esto
gonzalo@ubuntu:~$ pdftotext archivo.pdf
Error: Couldn’t open file ‘archivo.pdf’
gonzalo@ubuntu:~$
gonzalo@ubuntu:~$
Comment por gonza — Septiembre 20, 2009 #
Jose Luis. Muchas gracias por la página de zamzar. me parece genial y lo hace en dos segundos.
gracias de nuevo
enrique
Comment por enry — Septiembre 29, 2009 #
Pueden probar PDFEDIT en modo grágico funciona bien.
O desde el terminal es PDFTK mucho mejor.
Pdftk es una herramienta GPL utilizable desde la línea de comandos que nos va a permitir realizar tareas típicas con documentos PDF:
Mezclar documentos PDF
Trocear un PDF en múltiples páginas
Descodificar PDFs (con el password, claro)
Codificar PDFs
Cumplimentar formularios PDF con datos FDF y o formularios simples.
Añadir una marca de agua
Obtener metadatos, bookmarks y etiquetas de página de un PDF
Actualizar los metadatos de un PDF
Adjuntar ficheros a páginas PDF o al documento PDF
Desempaquetar ajuntos PDF
Reparar PDF dañados (Siempre que sea posible, claro!)
Comment por Anónimo — Octubre 26, 2009 #
Uso Debian y funcionó perfecto.
Gracias.
Solo una nota curiosa: Las páginas web que hacen las cosas “gratis” pero que en alguna esquina tienen un Login o Register SIEMPRE tienen limitaciones que aparecen cuando menos necesitas que aparezcan.
Aprender a usar ambos métodos es importante… por si a caso.
Abrazo fraternal todos.
Comment por Tenna — Noviembre 15, 2009 #