Pasar de pdf a odt

Diciembre 11, 2007 at 1:03 am | In General | 11 Comments
Tags: , , , , ,

Hoy estuve tratando de convertir un documento en formato .pdf a .odt y me encontré con algunas cosas interesantes.

Básicamente encontré dos formas de hacerlo, pero ninguna logró un resultado 100% eficiente.

La primer, y mejor alternativa según mi parecer, es instalar el programa “xpdf”

Este, en realidad es una suite de herramientas para archivos PDF. Que comprende: Un visualizador de documentos (pdf obviamente), junto con una serie de programas en línea de comandos, por ejemplo: pasar de pdf a txt con pdftotext, extraer las imagenes con pdfimages, o pasar pdf a documentos PostScript con pdftops.

Yes esta parte la que nos interesa en este caso. Para pasar de pdf a txt, es tan sencillo como abrir un terminal en la carpeta del pdf y escribir

$ pdftotext archivo.pdf

Esto nos generará un archivo del mismo nombre que el pdf pero en formato txt. Si queremos obtener un .odt en forma directa:

$ pdftotext archivo.pdf archivo.odt

Eso es todo, pero hay algunos inconvenientes: El archivo no debe de ser demasiado complejo en su formato de texto, de lo contrario el archivo convertido será un caos, o directamente nos dará error y no podrá realizarse la conversión. Obviamente sólo convertirá el texto, si hay imágenes deberán ser extraídas con pdfimages.

La otra solución que encontré es instalar “Kword” que es el editor de textos de Koffice, el cual trae la opción de importar archivos pdf y guardarlos en odt. La ventaja de este método es que importa texto e imágenes juntos, aunque para texto sólo xpdf me dió mejores resultados.

Está en ustedes probar cual es mas de su agrado, yo personalmente escojo xpdf, ya que es una herramienta muy útil orientada sólo a archivos pdf. En cambio Kword es un editor de textos (que ya tengo y me gusta el que tengo: Open office writer).

Ha, me olvidaba, para instalar xpdf y kword:

$ sudo aptitude install xpdf

$ sudo aptitude install kword

Respectivamente.

Espero les sirva.

11 comentarios »

Canal RSS de los comentarios de la entrada. URI para TrackBack.

  1. Anda de lujo, mucho mejor que cualquier programa simil de Windows.

    grax por el dato. Saludos.

  2. De nada!! gracias por comentar en mi blog!!

  3. Como dijo Danieru, de lujo.
    Yo utilizaba el xpdf (con soporte para gallego) y la herramienta de selección de texto, pero con tu ayuda de la linea de comandos el trabajo es mucho más sencillo, y da muy buneos resultados, aunque siempre hay que reeditar el texto para introducir saltos de linea.
    Es una pena que no lo incluyan en el menú. Siempre hay que andar buscando por la red para sacarle partido a programas.
    Muchas gracias.

  4. gracias por la informacion estubo bakanisima
    estoy probando gracias

  5. buenisimo muy util

    GRACIAS

  6. De nada julio, me alegro que te haya servido.

  7. Muchas gracias. No está mal pero personalmente los mejores resultados los conseguido con el conversor de la página:

    http://www.zamzar.com/

    Pruébalo a ver que te parece…..

  8. me sale esto
    gonzalo@ubuntu:~$ pdftotext archivo.pdf
    Error: Couldn’t open file ‘archivo.pdf’
    gonzalo@ubuntu:~$
    gonzalo@ubuntu:~$

  9. Jose Luis. Muchas gracias por la página de zamzar. me parece genial y lo hace en dos segundos.
    gracias de nuevo
    enrique

  10. Pueden probar PDFEDIT en modo grágico funciona bien.

    O desde el terminal es PDFTK mucho mejor.

    Pdftk es una herramienta GPL utilizable desde la línea de comandos que nos va a permitir realizar tareas típicas con documentos PDF:

    Mezclar documentos PDF
    Trocear un PDF en múltiples páginas
    Descodificar PDFs (con el password, claro)
    Codificar PDFs
    Cumplimentar formularios PDF con datos FDF y o formularios simples.
    Añadir una marca de agua
    Obtener metadatos, bookmarks y etiquetas de página de un PDF
    Actualizar los metadatos de un PDF
    Adjuntar ficheros a páginas PDF o al documento PDF
    Desempaquetar ajuntos PDF
    Reparar PDF dañados (Siempre que sea posible, claro!)

  11. Uso Debian y funcionó perfecto.
    Gracias.
    Solo una nota curiosa: Las páginas web que hacen las cosas “gratis” pero que en alguna esquina tienen un Login o Register SIEMPRE tienen limitaciones que aparecen cuando menos necesitas que aparezcan.
    Aprender a usar ambos métodos es importante… por si a caso.
    Abrazo fraternal todos.


Deja un comentario

XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Blog de WordPress.com. | Theme: Pool by Borja Fernandez.
Entries and comments feeds.