PDF->TXT / Lendo arquivos pdf no terminal

Já pensou em abrir arquivos Portable Document Format (PDF) diretamente no terminal. Ótima solução para visualização rápida de arquivos em servidores.

Trata-se do pacote Poppler-utils e de seu comando pdftotext. Mais informações em http://poppler.freedesktop.org/

Instalação:



  • RedHat / RHEL / Fedora / CentOS:

# yum install poppler-utils


  • Debian / Ubuntu Linux: 


$ sudo apt-get install poppler-utils




Sintaxe:


$ pdftotext arquivo_existente.pdf novo_arquivo.txt

Quer mais?


  • Apenas as 5 primeiras páginas e as 10 últimas:

$ pdftotext -f 5 -l 10 arquivo_existente.txt


  • Converter um arquivo protegido e criptografado com senha de proprietário:

$ pdftotext -opw 'password' arquivo_existente.pdf novo_arquivo.txt


  • Converter um arquivo protegido e criptografado com senha de usuário:

$ pdftotext -upw 'password' arquivo_existente.pdf novo_arquivo.txt


  • Espetificando o final da linha no texto de saída da conversão:

$ pdftotext -eol unix arquivo_existente.pdf novo_arquivo.txt





Para ver o novo_arquivo.txt no terminal:
$ cat novo_arquivo.txt
Para Editar
$ vi novo_arquivo.txt

Comentários

Postagens mais visitadas deste blog

EXTRAINDO ARQUIVOS NO FORMATO .exe

Resolvendo caracteres estranhos no site do community.grafana.com com Linux Debian/Ubuntu