Reconocimiento óptico de caracteres

El reconocimiento óptico de caracteres (ROC) es la conversión mecánica o electrónica de imágenes de texto escrito o impreso en texto codificado por máquina. Se utiliza ampliamente como una forma de entrar los datos impresos de papel, por ejemplo, documentos de pasaporte, facturas, extractos bancarios, recibos computarizados, tarjetas de visita, correo, impresiones de datos estáticos o cualquier documentación adecuada. Es un método común de digitalización de textos impresos para que puedan editarse electrónicamente, buscarse, almacenarse de manera más compacta, mostrarse en línea y usarse en procesos automáticos como traducción automática, conversión de texto a voz, datos clave y minería de texto. Además, ROC sirve para la exploración y los estudios en el reconocimiento de pautas, inteligencia artificial y la visión por computadora.

Las primeras versiones debían entrenarse con imágenes de cada caracter y trabajar con una fuente a la vez. Ahora se utilizan los sistemas avanzados que tienen un alto grado de precisión de reconocimiento para la mayoría de las fuentes. Algunos sistemas son capaces de reproducir una salida formateada que se aproxima mucho a la página original, incluso imágenes, columnas y otros componentes no textuales.

Propiedades

Rango 2440–245F
Personajes 32

Lista de Caracteres

Tabla de Caracteres

¡Copiado!