OCR · Imagen a Texto
OCR (Optical Character Recognition) es la tecnología que extrae texto legible de imágenes. Esta herramienta usa Tesseract.js —el mismo motor OCR de Google pero corriendo en tu navegador— para convertir fotos, capturas y documentos escaneados a texto editable, sin subir ninguna imagen a ningún servidor.
Cómo funciona Tesseract.js en el navegador
Tesseract alcanza una precisión superior al 95% en documentos impresos de buena calidad. En escritura manuscrita la precisión cae al 60-80% dependiendo de la legibilidad. Para documentos torcidos, la función de enderezamiento automático (deskewing) puede mejorar los resultados en 10-20%.
Tesseract es el motor OCR de código abierto más usado del mundo, originalmente desarrollado por HP y mantenido actualmente por Google. Tesseract.js es su versión compilada a WebAssembly que corre directamente en el navegador. La primera vez que usás la herramienta, descarga el modelo de reconocimiento del idioma seleccionado (~3 MB para español). Este modelo queda en caché en tu navegador, así que las ejecuciones siguientes son inmediatas.
El proceso de OCR tiene tres etapas: segmentación de la imagen (identificar bloques de texto, líneas y caracteres), clasificación de cada carácter contra el modelo entrenado, y post-procesamiento con diccionario del idioma para corregir errores de clasificación. Por eso el reconocimiento mejora notablemente con imágenes bien iluminadas, texto negro sobre fondo blanco y tipografías regulares.
Qué tipos de imágenes dan mejores resultados
Los mejores candidatos son: capturas de pantalla de documentos PDF (texto nítido, fondo uniforme), fotos de pizarrón o pantalla proyectada tomadas perpendicularmente con buena iluminación, documentos físicos escaneados a 300 dpi (la resolución mínima recomendada para OCR), y libros o revistas impresas fotografiados con luz natural uniforme.
Los casos más difíciles son: fondos con patrones o texturas, texto superpuesto sobre imágenes, tipografías decorativas o muy condensadas, texto muy pequeño (menor a 12px en la imagen), y escritura manuscrita no caligráfica. Para estos casos, el resultado puede requerir revisión manual significativa.
Usos prácticos en el día a día
En el trabajo: extraer datos de facturas o recibos escaneados para ingresarlos en una planilla, copiar texto de una presentación de PowerPoint cuando no tenés el archivo original, o digitalizar notas tomadas a mano en reuniones. En el ámbito académico: transcribir citas de libros físicos, extraer texto de capturas de papers académicos en formato imagen.
Para accesibilidad: convertir imágenes de texto que no son legibles por lectores de pantalla a texto accesible. Para archivos históricos: digitalizar documentos antiguos o periódicos escaneados para hacer búsquedas de texto en colecciones digitales. El soporte de seis idiomas cubre la mayoría de los casos de América Latina y España.
Cómo funciona — paso a paso
- 1Subí la imagenArrastrá o seleccioná una imagen JPG, PNG o WebP. La imagen nunca abandona tu navegador.
- 2Seleccioná el idioma del textoElegí el idioma predominante en la imagen. Para documentos con texto en varios idiomas, el idioma principal es el que mejor resultado da.
- 3Ejecutá el OCR y copiá el resultadoHacé click en Extraer texto. El proceso toma entre 2 y 15 segundos según el tamaño de la imagen. Copiá el texto resultante o descargalo como .txt.
Sobre OCR · Imagen a Texto
OCR (Optical Character Recognition) usando Tesseract.js que corre 100% en tu navegador (la imagen NUNCA se sube a un servidor). Soporta español, inglés, portugués, francés, italiano y alemán. Primera vez tarda ~10s en cargar el modelo (~3MB), después es instantáneo. Útil para extraer texto de capturas de pantalla, fotos de pizarrón, documentos físicos escaneados, libros antiguos.
Preguntas frecuentes
¿Es gratis?+
100% gratis. Tesseract.js es open source. No hay límite de imágenes.
¿Sube mi imagen a algún servidor?+
No. Todo el reconocimiento se hace en tu navegador con WebAssembly. Tu imagen nunca sale de tu computadora.
Herramientas relacionadas
Voz a Texto (Speech to Text)
Dicta y convierte tu voz a texto en tiempo real · 12 idiomas.
Texto a Voz Online (Text to Speech)
Convierte texto en audio con voces nativas · 40+ idiomas · Sin límite.
Rotar y Voltear Imagen
Rotación 90/180/270° + flip horizontal y vertical · Sin servidor.
Generador de prompts para IA
Construí prompts estructurados para ChatGPT, Claude o Gemini.