Pasar de pdf a odt

Hoy estuve tratando de convertir un documento en formato .pdf a .odt y me encontré con algunas cosas interesantes.

Básicamente encontré dos formas de hacerlo, pero ninguna logró un resultado 100% eficiente.

La primer, y mejor alternativa según mi parecer, es instalar el programa “xpdf”

Este, en realidad es una suite de herramientas para archivos PDF. Que comprende: Un visualizador de documentos (pdf obviamente), junto con una serie de programas en línea de comandos, por ejemplo: pasar de pdf a txt con pdftotext, extraer las imagenes con pdfimages, o pasar pdf a documentos PostScript con pdftops.

Yes esta parte la que nos interesa en este caso. Para pasar de pdf a txt, es tan sencillo como abrir un terminal en la carpeta del pdf y escribir

$ pdftotext archivo.pdf

Esto nos generará un archivo del mismo nombre que el pdf pero en formato txt. Si queremos obtener un .odt en forma directa:

$ pdftotext archivo.pdf archivo.odt

Eso es todo, pero hay algunos inconvenientes: El archivo no debe de ser demasiado complejo en su formato de texto, de lo contrario el archivo convertido será un caos, o directamente nos dará error y no podrá realizarse la conversión. Obviamente sólo convertirá el texto, si hay imágenes deberán ser extraídas con pdfimages.

La otra solución que encontré es instalar “Kword” que es el editor de textos de Koffice, el cual trae la opción de importar archivos pdf y guardarlos en odt. La ventaja de este método es que importa texto e imágenes juntos, aunque para texto sólo xpdf me dió mejores resultados.

Está en ustedes probar cual es mas de su agrado, yo personalmente escojo xpdf, ya que es una herramienta muy útil orientada sólo a archivos pdf. En cambio Kword es un editor de textos (que ya tengo y me gusta el que tengo: Open office writer).

Ha, me olvidaba, para instalar xpdf y kword:

$ sudo aptitude install xpdf

$ sudo aptitude install kword

Respectivamente.

Espero les sirva.

Esta entrada fue publicada en General y etiquetada , , , , , . Guarda el enlace permanente.

25 respuestas a Pasar de pdf a odt

  1. Danieru dijo:

    Anda de lujo, mucho mejor que cualquier programa simil de Windows.

    grax por el dato. Saludos.

  2. guisheca dijo:

    De nada!! gracias por comentar en mi blog!!

  3. Ton dijo:

    Como dijo Danieru, de lujo.
    Yo utilizaba el xpdf (con soporte para gallego) y la herramienta de selección de texto, pero con tu ayuda de la linea de comandos el trabajo es mucho más sencillo, y da muy buneos resultados, aunque siempre hay que reeditar el texto para introducir saltos de linea.
    Es una pena que no lo incluyan en el menú. Siempre hay que andar buscando por la red para sacarle partido a programas.
    Muchas gracias.

  4. jose baeza dijo:

    gracias por la informacion estubo bakanisima
    estoy probando gracias

  5. julio dijo:

    buenisimo muy util

    GRACIAS

  6. guisheca dijo:

    De nada julio, me alegro que te haya servido.

  7. José Luis dijo:

    Muchas gracias. No está mal pero personalmente los mejores resultados los conseguido con el conversor de la página:

    http://www.zamzar.com/

    Pruébalo a ver que te parece…..

  8. gonza dijo:

    me sale esto
    gonzalo@ubuntu:~$ pdftotext archivo.pdf
    Error: Couldn’t open file ‘archivo.pdf’
    gonzalo@ubuntu:~$
    gonzalo@ubuntu:~$

  9. enry dijo:

    Jose Luis. Muchas gracias por la página de zamzar. me parece genial y lo hace en dos segundos.
    gracias de nuevo
    enrique

  10. Anónimo dijo:

    Pueden probar PDFEDIT en modo grágico funciona bien.

    O desde el terminal es PDFTK mucho mejor.

    Pdftk es una herramienta GPL utilizable desde la línea de comandos que nos va a permitir realizar tareas típicas con documentos PDF:

    Mezclar documentos PDF
    Trocear un PDF en múltiples páginas
    Descodificar PDFs (con el password, claro)
    Codificar PDFs
    Cumplimentar formularios PDF con datos FDF y o formularios simples.
    Añadir una marca de agua
    Obtener metadatos, bookmarks y etiquetas de página de un PDF
    Actualizar los metadatos de un PDF
    Adjuntar ficheros a páginas PDF o al documento PDF
    Desempaquetar ajuntos PDF
    Reparar PDF dañados (Siempre que sea posible, claro!)

  11. Tenna dijo:

    Uso Debian y funcionó perfecto.
    Gracias.
    Solo una nota curiosa: Las páginas web que hacen las cosas “gratis” pero que en alguna esquina tienen un Login o Register SIEMPRE tienen limitaciones que aparecen cuando menos necesitas que aparezcan.
    Aprender a usar ambos métodos es importante… por si a caso.
    Abrazo fraternal todos.

  12. chusini dijo:

    Muchas gracias por la info, va muy bien

  13. syreniad dijo:

    hola, instalé el kword pero no me funciona, será porque mi escritorio es gnome?

    saludos!

  14. guisheca dijo:

    @syreniad: No creo que no te funcione porque uses gnome, debe haber otro motivo.

  15. sSebastian dijo:

    @syreniad

    cual es el problema?, yo acabo de instalar kword para hacer esto, pero no me muestra los archivos .pdf como archivos “soportados”, al final instalé

    pdfedit

    y exporté a texto el pdf, lo hizo de forma perfecta

  16. sSebastian dijo:

    una actualización, aunque pueda ser obvio

    hice el traspaso: pdf -> pdfedit -> txt

    luego, copy/paste a un .odt

    el único “problema” es que muchos de los espacios aparecían en gris, e hice lo siguiente:

    1.- copiar el espacio “gris”
    2.- ctrl+b (menú buscar y reemplazar)
    3.- pegar el espacio “gris” en el “buscar”
    4.- en “reemplazar por” solo escribir un espacio
    5.- reemplazar todo

    y listo

    exito

  17. Miguel dijo:

    Si lo que nos interesa es simplemente editar el archivo PDF, GIMP puede importar archivos PDF y así poder añadir el texto que nos plazca.

  18. Wilson Gómez dijo:

    Baje la version 9 de adobe reader desde el centro de software de ubuntu, y con el solo es cuestión de abrir el PDF, seleccionar, copiar y pegar, o en su caso, guardar como texto y luego se lo puede abrir con algún editor de textos o simplemente desde writer.
    Saludos

  19. pablo dijo:

    gracias! me sirvio mucho. Saludos!

  20. Cristina dijo:

    Después de leer en este Blog y en otras páginas las respuestas acerca de cómo pasar de formato PDF a ODT, todavía no he logrado convertir mi archivo. Ruego que si alguien es tan amable de contactar conmigo y explicarme de nuevo y de forma más pausada y concreta cómo puedo hacerlo, se lo agradecería infinitamente, ya que después de hacer algunas cosas que explican aquí, no lo he logrado y necesito hacerlo urgentemente. En especial se lo pido a la persona que escribe este blog, pero acepto ayuda de cualquiera. Muchisimas gracias.

    Mi correo es: creslo_1993@hotmail.com

  21. antonio72es dijo:

    Hola, he intentado hacerlo en mi ubuntu 11.10, así como en la distro 8.04 y siempre me sale
    error: couldn,t open file “p.pdf”: No such file or directory.

    P. El archivo pdf que quiero convertir

    como veis, soy novato.También llevo toda la tarde y es que quiero aprender.

    Gracias.

    Correo: antoniojosevillalba82@hotmail.com

  22. jasnazaycata dijo:

    maestro

  23. Cesar dijo:

    el kword no soporta la extension .pdf alguien conoce algun otra solucon?

  24. julian dijo:

    Buen post, la información me fue de mucha ayuda. gracias por el dato.

  25. EXCELENTE INFORMACION !!! justo lo que buscaba ,, de echo acabo de publicar en mi blog un articulo sobre COMO ABRIR Y EDITAR ARCHIVOS PDF SIN INSTALAR NINGUN PROGRAMA !!!
    les invito a echar un vistazo !!!
    Gracias.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s