Главная ›
Юникод ›
Разделы ›
Оптическое распознавание символов

Оптическое распознавание символов

Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе. Распознавание широко используется для конвертации книг и документов в электронный вид, для автоматизации систем учета в бизнесе или для публикации текста на веб-странице. Оптическое распознавание текста позволяет редактировать текст, осуществлять поиск слова или фразы, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тесту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения.

Системы оптического распознавания текста требуют калибровки для работы с конкретным шрифтом; в ранних версиях для программирования было необходимо изображение каждого символа, программа одновременно могла работать только с одним шрифтом. В настоящее время больше всего распространены так называемые «интеллектуальные» системы, с высокой степенью точности распознающие большинство шрифтов. Некоторые системы оптического распознавания текста способны восстанавливать исходное форматирование текста, включая изображения, колонки и другие нетекстовые компоненты.

Свойства

Диапазон	2440–245F
Символы	32

Список символов

Таблица символов

2400–243F Пиктограммы управляющих символов 2460–24FF Обрамлённые буквы и цифры

0: Основная многоязычная плоскость

1: Дополнительная многоязычная плоскость

2: Дополнительная идеографическая плоскость

3: Третичная идеографическая плоскость

4-13: Не используется

14: Специализированная дополнительная плоскость

15: Дополнительная область для частного использования – A

16: Дополнительная область для частного использования – B