Guía

Cómo extraer texto de una imagen o captura de pantalla en Windows

Extraer texto de una captura de pantalla en Windows con OCR

Tienes el texto ahí mismo, en la pantalla: en una captura, en la foto de una pizarra, en un documento escaneado, en una receta que alguien te envió como imagen. Lo lees con los ojos sin problema. Pero cuando intentas copiarlo, no pasa nada. El texto está atrapado dentro de la imagen, y Windows trata todo el conjunto como un único bloque de píxeles en lugar de palabras legibles.

Es una de esas frustraciones cotidianas que parece que ya deberían estar resueltas. Puedes pedirle a tu móvil que identifique una planta a partir de una foto, pero copiar un número de teléfono de una captura sigue obligándote a teclearlo a mano o a buscar la herramienta adecuada.

La tecnología que resuelve esto se llama OCR (reconocimiento óptico de caracteres). Existe desde hace décadas, pero ha mejorado muchísimo en los últimos años. La pregunta no es si funciona (funciona), sino qué método tiene sentido para lo que tú quieres hacer.

Respuesta rápida: Windows tiene un par de formas integradas de extraer texto de imágenes, pero son limitadas y no siempre evidentes. Para una extracción fiable de texto a partir de capturas, fotos y documentos escaneados, una herramienta de OCR dedicada como OCR Text Recognition Tool de Microsoft Store hace el trabajo con muy poca configuración: abres la imagen, extraes el texto y lo copias. Para un uso puntual, Windows PowerToys también incluye una función de extracción de texto que conviene conocer.


Qué hace realmente el OCR

El OCR es el proceso de analizar una imagen para identificar los caracteres que contiene y convertirlos en texto que puedes seleccionar, copiar y editar. A grandes rasgos, el software observa las formas de la imagen, las compara con patrones de caracteres conocidos y produce su mejor estimación de qué es cada carácter.

El OCR moderno va mucho más allá de la simple comparación de patrones. Los motores actuales usan modelos de aprendizaje automático que entienden el contexto: saben que “rn” en cierta fuente se parece casi igual a una “m”, y usan las palabras de alrededor para deducir cuál es en realidad. Pueden manejar texto inclinado, iluminación irregular, caracteres manuscritos (con resultados variables) y varios idiomas en la misma página.

La precisión depende de varios factores: lo nítida que sea la imagen de origen, qué fuente usa el texto, si está impreso o escrito a mano y cuánto ruido visual hay en la imagen. Una captura limpia de un documento se convierte casi a la perfección. La foto borrosa de un recibo arrugado tomada con mala luz es un problema más difícil.


📊 Métodos de OCR en Windows comparados

Método Coste Ideal para Varios idiomas
OCR Text Recognition Tool Gratis (unas extracciones al día), luego plan de pago asequible Extracción de texto fiable para el día a día con soporte multilingüe
PowerToys Text Extractor Gratis Extracción rápida y puntual si ya usas PowerToys Limitado
Google Lens (web) Gratis Extracción rápida de fotos desde el navegador
OneNote OCR Gratis con cuenta de Microsoft Quienes ya están en el ecosistema de Microsoft
Adobe Acrobat Pro Suscripción mensual de pago OCR profesional sobre documentos PDF escaneados

Las situaciones en las que necesitas esto

Antes de entrar en las herramientas, ayuda entender los escenarios habituales. La gente busca extraer texto por motivos sorprendentemente distintos, y el mejor método depende de cuál de ellos tengas entre manos.

Capturas de mensajes de error o de código. Un compañero te envía la captura de un fallo. Necesitas buscar el texto del error o pegarlo en una incidencia. Reescribir un seguimiento de pila (stack trace) carácter a carácter es tedioso y propenso a errores. El OCR extrae el texto exacto en segundos.

Documentos escaneados. Tienes un contrato escaneado, la foto de un recibo o un PDF que en realidad son solo imágenes de cada página. El texto se ve normal en pantalla, pero no se puede seleccionar nada. El OCR convierte la imagen en texto real que puedes copiar y buscar.

Fotos de material impreso. Una página de un libro, una pizarra tras una reunión, una etiqueta nutricional, un cartel en otro idioma. Siempre que puedas fotografiar texto pero no seleccionarlo digitalmente, el OCR es el puente.

Datos atrapados en imágenes. Alguien te envía una tabla como captura en lugar de una hoja de cálculo. Un gráfico tiene etiquetas que necesitas citar. Una diapositiva de una presentación tiene texto que quieres reutilizar. Todo esto exige extraer el texto de la imagen en lugar del archivo original.

Texto en otro idioma. Tienes una imagen con texto en un idioma que no lees. Extraer primero el texto y traducirlo después es más fiable que intentar traducir directamente desde la imagen, porque las herramientas de traducción funcionan mejor con texto limpio como punto de partida.


Método 1: PowerToys Text Extractor

Microsoft PowerToys es una colección gratuita de utilidades para Windows, y una de ellas —Text Extractor— hace OCR básico. Si ya tienes PowerToys instalado, puedes usarla de inmediato. Pulsa Win + Shift + T y dibuja un recuadro alrededor del texto que quieres extraer. El texto reconocido va directo a tu portapapeles.

Funciona bien con texto nítido y bien iluminado en idiomas estándar. Donde se queda corto es con imágenes complejas, contenido en varios idiomas o situaciones en las que necesitas más control sobre el proceso. No hay vista previa de lo que reconoció, no puedes corregir errores antes de copiar y el soporte de idiomas depende de qué paquetes de idioma de OCR tengas instalados en Windows.

Para un uso rápido y ocasional —pillar una línea de texto de una captura, copiar una dirección de una imagen— es sorprendentemente útil. Para algo más complejo, se siente limitado.

Si no tienes PowerToys instalado, está disponible en Microsoft Store o en GitHub. La instalación es sencilla, aunque obtienes todo el conjunto de PowerToys, no solo la función de OCR.


Método 2: una app de OCR dedicada

Si extraer texto es algo que haces más que de vez en cuando, una app de OCR dedicada es la opción más práctica. El flujo es más sencillo: abres la imagen, haces clic en extraer y el texto reconocido aparece listo para copiar. Sin atajos de teclado que memorizar, sin dibujar recuadros de selección en la pantalla, sin adivinar si la extracción funcionó hasta que lo pegas en algún sitio.

Las apps dedicadas también suelen manejar mejor los casos difíciles: imágenes con idiomas mezclados, texto en ángulos raros, fotos de menor calidad, documentos escaneados con ruido de fondo. Dedican su esfuerzo de ingeniería específicamente al proceso de OCR, lo que se nota en la precisión con entradas difíciles.

Algunas apps de OCR procesan las imágenes con motores de reconocimiento en la nube. Es una decisión de diseño práctica: los motores en la nube se entrenan con conjuntos de datos enormemente mayores y tienden a ser más precisos, sobre todo con la escritura a mano, las fuentes poco comunes y los alfabetos no latinos. La concesión es que la imagen sale de tu equipo un instante para procesarse. Para la mayoría de los casos —extraer texto de una captura, leer un recibo escaneado— no es un problema. Si trabajas con material confidencial, conviene saberlo.


Método 3: la función de OCR oculta de OneNote

OneNote lleva el OCR integrado, pero no es evidente. Si pegas o insertas una imagen en una página de OneNote, haz clic derecho sobre ella y selecciona “Copiar texto de la imagen”. OneNote procesa la imagen y copia el texto reconocido a tu portapapeles.

La precisión es decente con imágenes limpias y texto impreso. El inconveniente es el flujo de trabajo: tienes que abrir OneNote, crear una página o navegar hasta ella, insertar la imagen, esperar un momento a que se procese y luego hacer clic derecho. Si ya usas OneNote para otras cosas, es un truco práctico. Si no, abrir una app de notas solo para extraer texto de una imagen es un rodeo incómodo.

Otra peculiaridad: a veces OneNote necesita unos segundos para procesar la imagen antes de que aparezca la opción “Copiar texto”. Si haces clic derecho justo después de insertarla, puede que la opción aún no esté.


Método 4: Google Lens en el navegador

Google Lens puede extraer texto de imágenes directamente en Chrome. Haz clic derecho sobre cualquier imagen de una página web y selecciona “Buscar imagen con Google Lens”; luego cambia al modo “Texto”. Podrás seleccionar y copiar el texto reconocido.

Para imágenes que ya están en tu navegador —una captura publicada en una web, la vista previa de un documento, una imagen incrustada— es cómodo porque no hay nada que instalar. Para imágenes en tu escritorio o en una carpeta, primero tendrías que arrastrarlas al navegador, lo que añade un paso.

La calidad del OCR es notable, sobre todo con varios idiomas. El motor de reconocimiento de Google es uno de los mejores que existen, y Lens se beneficia de la misma tecnología. La limitación es que solo funciona dentro de Chrome y requiere conexión a internet.


Qué afecta a la precisión del OCR

No todas las imágenes dan los mismos resultados, sea cual sea la herramienta que uses. Entender los factores te ayuda a ajustar expectativas y, cuando es posible, a mejorar la imagen de origen antes de extraer.

La resolución importa. Las imágenes de mayor resolución producen mejores resultados de OCR. Un escaneo a 300 PPP se convierte casi a la perfección. Una captura a 72 PPP de un bloque de texto pequeño puede dar errores. Si controlas el origen, captura a la mayor resolución que puedas.

El contraste importa más que el color. Los motores de OCR convierten internamente las imágenes a alto contraste antes de procesarlas. El texto negro sobre fondo blanco da el mejor resultado. El texto gris claro sobre un fondo gris algo más claro —ese tipo de cosa que a tus ojos parece estar bien— puede confundir al motor porque la relación de contraste es demasiado baja.

El texto recto es más fácil que el inclinado. Si fotografías una página, intenta capturarla de frente y no en ángulo. El OCR moderno tolera algo de inclinación, pero cada grado de rotación reduce un poco la precisión. Si estás escaneando, usa un escáner plano en lugar de la cámara del móvil para obtener los resultados más limpios.

Texto impreso frente a escritura a mano. El texto impreso en fuentes estándar se convierte con mucha precisión —más del 99 % en imágenes limpias—. El reconocimiento de la escritura a mano ha mejorado muchísimo, pero sigue siendo irregular. Una letra clara y uniforme funciona razonablemente bien. La letra descuidada o los estilos poco habituales siguen siendo difíciles para cualquier motor de OCR.

Ruido y artefactos. Manchas, marcas de café, dobleces y artefactos de compresión reducen la precisión. La compresión JPEG, en particular, puede emborronar los bordes de los caracteres lo justo para provocar errores de lectura. Si el origen es una imagen muy comprimida, el motor de OCR tiene menos con lo que trabajar.


Cómo lidiar con los PDF escaneados

Una variante concreta del problema de extraer texto es el PDF escaneado. Es un PDF en el que cada página es en realidad una fotografía: el texto se ve normal cuando lo abres, pero intenta seleccionarlo y no se resalta nada. El visor de PDF trata cada página como una única imagen.

Para comprobar si un PDF es escaneado o de texto, ábrelo e intenta hacer clic y arrastrar para seleccionar una palabra. Si puedes resaltar palabras sueltas, es de texto y no necesitas OCR: puedes copiar el texto directamente. Si no se resalta nada, o toda la página se selecciona como un único bloque, es escaneado.

Con los PDF escaneados, el método es el mismo que con cualquier imagen: pásales el OCR. Algunas herramientas de OCR aceptan archivos PDF directamente y procesan cada página como una imagen. Otras te exigen convertir antes las páginas del PDF en imágenes. En cualquier caso, el resultado es texto extraíble.

Si además necesitas el documento de vuelta en formato PDF con el texto incrustado (para que otros puedan buscarlo y seleccionarlo), necesitas una herramienta capaz de crear un “PDF con búsqueda” (searchable PDF): una capa con el resultado del OCR colocada detrás de la imagen, de modo que se conserva el aspecto visual mientras el texto se vuelve seleccionable. Adobe Acrobat lo hace bien. Algunas herramientas de OCR dedicadas también lo ofrecen.


Solución de problemas

El texto extraído tiene muchos errores. Lo más probable es que la imagen de origen sea de baja resolución, de bajo contraste o que contenga fuentes poco habituales. Prueba a mejorar primero la imagen: sube el contraste, recorta solo la zona del texto o vuelve a escanear a mayor resolución.

El texto sale en el orden equivocado. Los diseños a varias columnas y las páginas complejas pueden confundir a los motores de OCR sobre el orden de lectura. Si el texto se extrae pero los párrafos quedan desordenados, puede que tengas que extraer secciones más pequeñas de una en una: una columna, un bloque, un párrafo.

Los caracteres especiales o los símbolos salen mal. Los motores de OCR manejan mejor el texto alfabético estándar. Los símbolos matemáticos, los signos de moneda y la puntuación especial son más difíciles de reconocer y pueden aparecer como caracteres incorrectos. Revísalos con cuidado.

Los alfabetos no latinos tienen menor precisión. El OCR para el chino, el japonés, el coreano, el árabe y otros alfabetos no latinos ha mejorado, pero suele ser menos preciso que el reconocimiento de alfabeto latino. Asegúrate de que tu herramienta de OCR admita el idioma concreto y de que tengas instalados los paquetes de idioma correspondientes.

La escritura a mano no se reconoce en absoluto. No todos los motores de OCR admiten texto manuscrito. Los que lo hacen suelen exigir que la letra sea bastante clara y uniforme. Si necesitas digitalizar notas manuscritas con frecuencia, busca una herramienta que anuncie específicamente el reconocimiento de escritura a mano.


Preguntas frecuentes (FAQ)

¿Puede Windows extraer texto de imágenes de forma nativa?

No mediante ninguna función integrada evidente. PowerToys Text Extractor añade esta capacidad si lo instalas. OneNote tiene una función de OCR oculta. Ninguna de las dos es una solución de un solo clic lista para usar.

¿Es el OCR lo bastante preciso como para fiarse sin revisar?

Con imágenes limpias y de alta resolución con texto impreso, la precisión suele superar el 99 %. Con imágenes de menor calidad, escritura a mano o fuentes poco habituales, revisa siempre. Nunca des por hecho que el resultado del OCR es perfecto en documentos importantes.

¿Puedo extraer texto de una foto tomada con el móvil?

Sí. La precisión depende de la calidad de la foto. Una buena luz, un enfoque estable y un ángulo frontal dan los mejores resultados. Las fotos borrosas o en ángulo tendrán más errores.

¿Funciona el OCR con la escritura a mano?

Hasta cierto punto. Una letra clara y uniforme en alfabetos comunes puede reconocerse con una precisión razonable. La letra descuidada, los alfabetos poco habituales o la escritura muy estilizada siguen siendo difíciles para todas las herramientas de OCR.

¿Puedo extraer texto de un vídeo o de una pantalla en directo?

No directamente. Tendrías que hacer una captura del fotograma con el texto que quieres y luego pasarle el OCR a esa captura. Algunas herramientas de captura de pantalla te permiten congelar un fotograma con este fin.

¿Qué hay de extraer texto en varios idiomas?

La mayoría de las herramientas modernas de OCR admiten decenas de idiomas. Si la imagen contiene texto en más de un idioma, algunas herramientas lo gestionan automáticamente, mientras que otras necesitan que indiques los idiomas de antemano. El soporte multilingüe es una de las áreas en las que las herramientas de OCR dedicadas tienden a superar a las opciones integradas.


Enlaces de referencia


En resumen

Extraer texto de imágenes es un problema resuelto: las herramientas existen, la precisión es alta y el proceso es rápido. La verdadera pregunta es solo qué método encaja con la frecuencia con que lo necesitas y con lo fluida que quieres que sea la experiencia. PowerToys sirve para capturas rápidas y puntuales. La función oculta de OneNote funciona si ya estás dentro. Para algo más habitual, OCR Text Recognition Tool te da unas extracciones gratis al día con soporte multilingüe y un flujo de trabajo directo: abre la imagen, extrae, copia.

Elijas lo que elijas, deja de reescribir texto a partir de capturas. La vida es demasiado corta para eso.