Guia

Como extrair texto de uma imagem ou captura de tela no Windows

Extraindo texto de uma captura de tela no Windows usando OCR

O texto está bem ali na sua tela — em uma captura de tela, em uma foto de um quadro branco, em um documento digitalizado, em uma receita que alguém te mandou como imagem. Você consegue ler com os próprios olhos. Mas quando tenta copiar, não acontece nada. O texto está preso dentro da imagem, e o Windows trata o conjunto inteiro como um único bloco de pixels em vez de palavras legíveis.

Essa é uma daquelas frustrações do dia a dia que já deveriam ter sido resolvidas há tempos. Você consegue pedir ao seu celular que identifique uma planta a partir de uma foto, mas copiar um número de telefone de uma captura de tela ainda exige digitar tudo de novo na mão ou encontrar a ferramenta certa.

A tecnologia que resolve isso se chama OCR — reconhecimento óptico de caracteres. Ela existe há décadas, mas ficou drasticamente melhor nos últimos anos. A pergunta não é se funciona (funciona), e sim qual abordagem faz sentido para o que você está tentando fazer.

Resposta rápida: o Windows tem algumas formas integradas de extrair texto de imagens, mas elas são limitadas e nem sempre óbvias. Para uma extração de texto confiável a partir de capturas de tela, fotos e documentos digitalizados, uma ferramenta de OCR dedicada como o OCR Text Recognition Tool da Microsoft Store dá conta do recado com configuração mínima: abra a imagem, extraia o texto, copie. Para uso ocasional, o Windows PowerToys também inclui um recurso de extração de texto que vale a pena conhecer.


O que o OCR realmente faz

OCR é o processo de analisar uma imagem para identificar os caracteres nela e convertê-los em texto que você pode selecionar, copiar e editar. Em alto nível, o software observa as formas na imagem, compara-as com padrões de caracteres conhecidos e produz o melhor palpite sobre o que é cada caractere.

O OCR moderno vai muito além do simples reconhecimento de padrões. Os motores atuais usam modelos de aprendizado de máquina que entendem o contexto — eles sabem que “rn” em certa fonte fica quase idêntico a “m” e usam as palavras ao redor para descobrir qual dos dois é de fato. Eles conseguem lidar com texto inclinado, iluminação irregular, caracteres manuscritos (em graus variados) e vários idiomas na mesma página.

A precisão depende de alguns fatores: o quão nítida é a imagem de origem, qual fonte o texto usa, se o texto é impresso ou manuscrito e quanto ruído visual há na imagem. Uma captura de tela limpa de um documento converte quase à perfeição. Uma foto borrada de um recibo amassado tirada com pouca luz é um problema mais difícil.


📊 Métodos de OCR no Windows comparados

Método Custo Ideal para Vários idiomas
OCR Text Recognition Tool Grátis (algumas extrações por dia) / plano pago acessível Extração de texto confiável no dia a dia com suporte a vários idiomas Sim
PowerToys Text Extractor Grátis Extração rápida e pontual se você já usa o PowerToys Limitado
Google Lens (web) Grátis Extração rápida de fotos pelo navegador Sim
OneNote OCR Grátis com conta Microsoft Quem já vive no ecossistema da Microsoft Sim
Adobe Acrobat Pro Assinatura mensal paga OCR profissional em PDFs digitalizados Sim

As situações em que você precisa disso

Antes de mergulhar nas ferramentas, ajuda entender os cenários mais comuns. As pessoas buscam extração de texto por motivos surpreendentemente diferentes, e a melhor abordagem depende de qual deles você está enfrentando.

Capturas de tela de mensagens de erro ou código. Um colega te manda a captura de tela de um bug. Você precisa pesquisar o texto do erro ou colá-lo em um chamado. Redigitar uma stack trace caractere por caractere é tedioso e propenso a erros. O OCR extrai o texto exato em segundos.

Documentos digitalizados. Você tem um contrato digitalizado, a foto de um recibo ou um PDF que, na verdade, é só uma imagem de cada página. O texto parece normal na tela, mas nada é selecionável. O OCR converte a imagem em texto de verdade, que você pode copiar e pesquisar.

Fotos de material impresso. Uma página de um livro, um quadro branco depois de uma reunião, uma tabela nutricional, uma placa de rua em outro idioma. Sempre que você consegue fotografar o texto, mas não consegue selecioná-lo digitalmente, o OCR é a ponte.

Dados presos em imagens. Alguém te manda uma tabela como captura de tela em vez de planilha. Um gráfico tem rótulos que você precisa citar. Um slide de apresentação tem um texto que você quer reaproveitar. Tudo isso exige extrair o texto da imagem, e não do arquivo original.

Texto em outro idioma. Você tem uma imagem com texto em um idioma que não lê. Extrair o texto primeiro e depois traduzi-lo é mais confiável do que tentar traduzir direto da imagem, porque as ferramentas de tradução funcionam melhor com texto limpo na entrada.


Método 1: PowerToys Text Extractor

O Microsoft PowerToys é um conjunto grátis de utilitários para Windows, e um deles — o Text Extractor — faz OCR básico. Se você já tem o PowerToys instalado, dá para usar na hora. Pressione Win + Shift + T e desenhe uma caixa em torno do texto que quer extrair. O texto reconhecido vai direto para a área de transferência.

Ele funciona bem para texto limpo e bem iluminado em idiomas padrão. Onde ele deixa a desejar é em imagens complexas, conteúdo em vários idiomas ou situações em que você precisa de mais controle sobre o processo. Não há prévia do que foi reconhecido, não há como corrigir erros antes de copiar, e o suporte a idiomas depende de quais pacotes de idioma de OCR você tem instalados no Windows.

Para um uso rápido e ocasional — pegar uma linha de texto de uma captura de tela, copiar um endereço de uma imagem —, ele é surpreendentemente útil. Para qualquer coisa mais elaborada, parece limitado.

Se você não tem o PowerToys instalado, ele está disponível na Microsoft Store ou no GitHub. A instalação é simples, embora você receba o pacote inteiro do PowerToys, não só o recurso de OCR.


Método 2: um aplicativo de OCR dedicado

Se extrair texto é algo que você faz mais do que de vez em quando, um aplicativo de OCR dedicado é a escolha mais prática. O fluxo é mais simples: abra a imagem, clique em extrair e o texto reconhecido aparece pronto para copiar. Nada de atalhos de teclado para decorar, nada de desenhar caixas de seleção na tela, nada de ficar adivinhando se a extração deu certo até colar em algum lugar.

Aplicativos dedicados também tendem a lidar melhor com os casos difíceis — imagens com idiomas misturados, texto em ângulos estranhos, fotos de qualidade mais baixa, documentos digitalizados com ruído de fundo. Eles concentram todo o esforço de engenharia no fluxo de OCR especificamente, o que se reflete na precisão com entradas difíceis.

Alguns aplicativos de OCR processam as imagens com motores de reconhecimento na nuvem. É uma decisão prática de projeto: os motores na nuvem são treinados com conjuntos de dados muito maiores e tendem a ser mais precisos, especialmente com escrita à mão, fontes incomuns e alfabetos não latinos. A concessão é que a imagem sai da sua máquina brevemente para ser processada. Para a maioria dos casos — extrair texto de uma captura de tela, ler um recibo digitalizado — isso não é um problema. Se você trabalha com material confidencial, vale levar em conta.


Método 3: o recurso de OCR escondido do OneNote

O OneNote tem OCR embutido, mas não é nada óbvio. Se você colar ou inserir uma imagem em uma página do OneNote, clique nela com o botão direito e selecione “Copiar Texto da Imagem”. O OneNote processa a imagem e copia o texto reconhecido para a área de transferência.

A precisão é razoável para imagens limpas e texto impresso. A desvantagem é o fluxo: você precisa abrir o OneNote, criar uma página ou navegar até ela, inserir a imagem, esperar um instante pelo processamento e só então clicar com o botão direito. Se você já usa o OneNote para outras coisas, é um truque bacana. Se não usa, abrir um aplicativo de anotações só para extrair texto de uma imagem é um desvio meio sem graça.

Outra peculiaridade: o OneNote às vezes precisa de alguns segundos para processar a imagem antes que a opção “Copiar Texto” apareça. Se você clicar com o botão direito logo depois de inserir, a opção pode ainda não estar lá.


Método 4: Google Lens no navegador

O Google Lens consegue extrair texto de imagens direto no Chrome. Clique com o botão direito em qualquer imagem de uma página da web e selecione “Pesquisar imagem com o Google Lens”, depois mude para o modo “Texto”. Você pode selecionar e copiar o texto reconhecido.

Para imagens que já estão no seu navegador — uma captura de tela publicada em um site, a prévia de um documento, uma imagem incorporada —, isso é prático porque não há nada para instalar. Para imagens na sua área de trabalho ou em uma pasta, você precisaria arrastá-las para o navegador primeiro, o que adiciona um passo.

A qualidade do OCR é forte, especialmente para vários idiomas. O motor de reconhecimento do Google é um dos melhores disponíveis, e o Lens se beneficia da mesma tecnologia. A limitação é que ele só funciona dentro do Chrome e exige conexão com a internet.


O que afeta a precisão do OCR

Nem toda imagem produz os mesmos resultados, independentemente da ferramenta que você usa. Entender os fatores ajuda a calibrar as expectativas e, quando possível, a melhorar a imagem de origem antes de extrair.

A resolução importa. Imagens de maior resolução produzem resultados melhores de OCR. Uma digitalização a 300 PPP (DPI) converte quase à perfeição. Uma captura de tela a 72 PPP de um bloco de texto pequeno pode gerar erros. Se você tem controle sobre a origem, capture na maior resolução que conseguir.

O contraste importa mais do que a cor. Os motores de OCR convertem as imagens para alto contraste internamente antes de processar. Texto preto sobre fundo branco produz os melhores resultados. Texto cinza-claro sobre um fundo cinza um pouco mais claro — esse tipo de coisa que parece tranquila aos seus olhos — pode confundir o motor, porque a razão de contraste é baixa demais.

Texto reto é mais fácil que texto inclinado. Se você está fotografando uma página, tente capturá-la de frente em vez de em ângulo. O OCR moderno aguenta um certo nível de inclinação, mas cada grau de rotação reduz um pouco a precisão. Se você está digitalizando, use um scanner de mesa em vez da câmera do celular para resultados mais limpos.

Texto impresso versus manuscrito. Texto impresso em fontes padrão converte com altíssima precisão — 99% ou mais para imagens limpas. O reconhecimento de escrita à mão melhorou muito, mas ainda varia. Letra arrumada e consistente funciona razoavelmente bem. Letra bagunçada ou estilos incomuns continuam difíceis para qualquer motor de OCR.

Ruído e artefatos. Borrões, manchas de café, vincos e artefatos de compressão reduzem a precisão. A compressão JPEG, em especial, pode borrar as bordas dos caracteres o suficiente para causar leituras erradas. Se a origem é uma imagem muito comprimida, o motor de OCR tem menos com o que trabalhar.


Lidando com PDFs digitalizados

Uma variação específica do problema de extração de texto é o PDF digitalizado. É um PDF em que cada página é, na verdade, uma fotografia — o texto parece normal quando você visualiza, mas tente selecioná-lo e nada se destaca. O visualizador de PDF trata cada página como uma única imagem.

Para verificar se um PDF é digitalizado ou baseado em texto, abra-o e tente clicar e arrastar para selecionar uma palavra. Se você consegue destacar palavras individuais, ele é baseado em texto e você não precisa de OCR — dá para copiar o texto diretamente. Se nada se destaca, ou se a página inteira é selecionada como um único bloco, ele é digitalizado.

Para PDFs digitalizados, a abordagem é a mesma de qualquer imagem: rode o OCR nele. Algumas ferramentas de OCR aceitam arquivos PDF diretamente e processam cada página como uma imagem. Outras exigem que você converta as páginas do PDF em imagens primeiro. De um jeito ou de outro, o resultado é texto extraível.

Se você também precisa do documento de volta em formato PDF com o texto incorporado (para que outras pessoas possam pesquisar e selecionar), precisa de uma ferramenta capaz de criar um “PDF pesquisável” — uma camada com o texto reconhecido por OCR colocada atrás da imagem, de modo que a aparência visual é preservada enquanto o texto se torna selecionável. O Adobe Acrobat faz isso bem. Algumas ferramentas de OCR dedicadas também oferecem isso.


Solução de problemas

O texto extraído está cheio de erros. É provável que a imagem de origem seja de baixa resolução, baixo contraste ou contenha fontes incomuns. Tente melhorar a imagem primeiro — aumente o contraste, recorte apenas a área do texto ou digitalize de novo em resolução maior.

O texto sai na ordem errada. Layouts de várias colunas e designs de página complexos podem confundir os motores de OCR quanto à ordem de leitura. Se o texto é extraído, mas os parágrafos saem embaralhados, talvez você precise extrair trechos menores de cada vez — uma coluna, um bloco, um parágrafo.

Caracteres especiais ou símbolos saem errados. Os motores de OCR lidam melhor com texto alfabético padrão. Símbolos matemáticos, sinais de moeda e pontuação especial são mais difíceis de reconhecer e podem aparecer como caracteres errados. Revise esses casos com atenção.

Alfabetos não latinos têm precisão menor. O OCR para chinês, japonês, coreano, árabe e outros alfabetos não latinos melhorou, mas em geral é menos preciso do que o reconhecimento de alfabeto latino. Confira se a sua ferramenta de OCR dá suporte ao idioma específico e se os pacotes de idioma estão instalados.

A escrita à mão não é reconhecida de jeito nenhum. Nem todo motor de OCR dá suporte a manuscrito. Os que dão geralmente exigem que a letra seja razoavelmente arrumada e consistente. Se você precisa digitalizar anotações à mão com frequência, procure uma ferramenta que anuncie especificamente o reconhecimento de escrita à mão.


Perguntas frequentes (FAQ)

O Windows consegue extrair texto de imagens nativamente?

Não por nenhum recurso integrado óbvio. O PowerToys Text Extractor adiciona essa capacidade quando instalado. O OneNote tem um recurso de OCR escondido. Nenhum dos dois é uma solução de um clique de fábrica.

O OCR é preciso o suficiente para confiar sem revisar?

Para imagens limpas e de alta resolução com texto impresso, a precisão costuma ser de 99% ou mais. Para imagens de qualidade inferior, escrita à mão ou fontes incomuns, sempre revise. Nunca suponha que o resultado do OCR está perfeito em documentos importantes.

Dá para extrair texto de uma foto tirada com o celular?

Sim. A precisão depende da qualidade da foto. Boa iluminação, foco firme e um ângulo de frente produzem os melhores resultados. Fotos borradas ou em ângulo terão mais erros.

O OCR funciona com escrita à mão?

Até certo ponto. Letra arrumada e consistente em alfabetos comuns pode ser reconhecida com precisão razoável. Letra bagunçada, alfabetos incomuns ou escrita muito estilizada continuam difíceis para todas as ferramentas de OCR.

Dá para extrair texto de um vídeo ou de uma tela ao vivo?

Não diretamente. Você precisaria tirar uma captura de tela do quadro com o texto que quer e então rodar o OCR nessa captura. Algumas ferramentas de captura de tela permitem congelar um quadro para isso.

E quanto a extrair texto em vários idiomas?

A maioria das ferramentas modernas de OCR dá suporte a dezenas de idiomas. Se a imagem contém texto em mais de um idioma, algumas ferramentas lidam com isso automaticamente, enquanto outras precisam que você especifique os idiomas com antecedência. O suporte a vários idiomas é uma área em que as ferramentas de OCR dedicadas costumam superar as opções integradas.


Fontes


Conclusão

Extrair texto de imagens é um problema resolvido — as ferramentas existem, a precisão é alta e o processo é rápido. A verdadeira questão é só qual abordagem combina com a frequência com que você precisa disso e o quão fluida você quer que a experiência seja. O PowerToys serve para pegar algo rápido de vez em quando. O recurso escondido do OneNote serve se você já está por lá. Para qualquer coisa mais regular, o OCR Text Recognition Tool oferece algumas extrações grátis por dia com suporte a vários idiomas e um fluxo direto — abra a imagem, extraia, copie.

Seja qual for a sua escolha, pare de redigitar texto de capturas de tela. A vida é curta demais para isso.