РусEng

Министерство культуры Российской Федерации

Сотрудничество Россия – Европа в области культуры

Министерство культуры Российской Федерации
Совет Европы
ЮНЕСКО
Российский комитет Программы ЮНЕСКО “Информация для всех”
Европейская цифровая библиотека ЕВРОПЕАНА
MINERVA PLUS в России
Европейский проект ATHENA
Европейский фонд культуры
Европейская культура в действии
Печать
Главная  /  Новости

Новости

27|082010IBM и Евросоюз создают технологии для крупномасштабной оцифровки исторических текстов

Корпорация IBM и Европейский Союз расширили свое исследовательское партнерство, в котором теперь участвуют около тридцати национальных библиотек, научно-исследовательских институтов, университетов и организаций со всей Европы. Цель этого расширенного партнерства – создать новую технологию, которая позволит с высокой точностью и на массовой основе преобразовывать в цифровую форму исторически и культурно значимые текстовые материалы.

Технология IMPACT оптимизирует, упрощает и ускоряет процесс исследования отсканированного текста и отбора спорных (сомнительных) участков, предоставляя корректорам возможность эффективно править текст. Данная методика существенно облегчает правильное определение букв в словах текста и сокращает время его обработки.

Так, например, текст небольшой книжки, который «набивается» вручную на компьютере, в среднем, за четыре часа, можно оцифровать с помощью стандартной OCR-технологии и вручную откорректировать за час. Внедрение новой технологии коллективной корректуры сокращает этот процесс до 30 минут. Исследователи IBM отмечают, что новая адаптивная система оптического распознавания текста может дополнительно снизить это время еще на 15 минут.

Один из технологических партнёров – компания ABBYY  (Россия), один из ведущих мировых разработчиков ПО в области распознавания документов (OCR), ввода форм (ICR) и прикладной лингвистики.
 

Источник: новости Президентской библиотеки им. Б.Н. Ельцина