Como extrair texto de PDF

Como extrair texto de PDF

Por Felipe Freitas | Editado por Guadalupe Carniel | 16 de Fevereiro de 2022 às 09h00
Canaltech/Felipe Freitas

Saber como extrair texto de um arquivo em PDF, pode ser muito útil quando estamos estudando, fazendo anotações ou elaborando trabalhos, seja no celular ou no computador. É que com tantos tipos de texto, hoje em dia o formato PDF é uma das principais referências na hora de imprimir, visualizar e encaminhar textos online. Ele também é uma alternativa para apresentações e até mesmo imagens.

Por isso, usar ferramentas para editar e extrair textos desses arquivos pode ajudar bastante no dia a dia. Existem algumas plataformas gratuitas e acessíveis que funcionam tão bem quanto o Adobe Acrobat. Assim, é possível editar seus arquivos gratuitamente sejam eles apresentações de trabalho ou textos científicos. Nesta matéria, veja como extrair texto de PDF!

No computador

Caso você precise copiar alguns trechos de um arquivo PDF no PC, uma ótima alternativa é o leitor da XODO através dele é possível copiar e traduzir textos até mesmo de livros escaneados em PDF. Veja como fazer:

  1. Acesse o site do XODO (Web);
  2. Arraste ou selecione seu arquivo no leitor virtual;
  3. Em seguida, você pode clicar e selecionar trechos do texto que você deseja extrair;
  4. Daí é só clicar no ícone de “Copiar”.

    Você pode extrair trechos de PDFs com facilidade no XODO (Captura de tela: Canaltech/Felipe Freitas)

No celular

  1. Acesse o aplicativo do XODO (Android | iOS);
  2. Toque no ícone de “Menu” lateral para ver mais opções;
  3. Selecione “All Files” para encontrar todos os arquivos em PDF no seu celular;
  4. Feito isso, você pode pressionar e segurar sobre uma parte do texto para copiá-la, destacá-la e traduzi-la.

    Use o XODO para copiar trechos com facilidade de arquivos em PDF (Captura de tela: Canaltech/Felipe Freitas)

Como converter PDF em texto

Caso você queira extrair texto de um PDF inteiro, não apenas trechos, você pode fazer isso através da extensão Acrobat Reader da Adobe, lá é possível converter seus arquivos PDF gratuitamente para outros formatos.

Você pode converter arquivos em PDF para diversos formatos (Imagem: Canaltech/Felipe Freitas)

Você só precisa instalar a extensão ou acessar o site do Adobe Acrobat (Chrome Web Store) em seu navegador. Veja como fazer nas próximas linhas:

  1. Acesse o site PDF online do Adobe Reader (Web);
  2. Em seguida, é só fazer login com sua conta Google ou Adobe;
  3. Então, selecione o formato “PDF para Word” para extrair completamente o texto daquele arquivo;
  4. Daí é só arrastar ou selecionar o PDF que você deseja converter;
  5. Com tudo certo, é só clicar em “Exportar para DOCX”.

    Clique em "PDF para Word" (Captura de tela: Canaltech/Felipe Freitas)

O formato (.Docx) é um tipo de arquivo padrão para arquivos de texto. Ele é compatível com vários programas e serviços como Microsoft Word, Google Docs e Pages da Apple. Vale a pena conferir!

Gostou dessa matéria?

Inscreva seu email no Canaltech para receber atualizações diárias com as últimas notícias do mundo da tecnologia.