22.12.2010 00:00
Аналитика.
Просмотров всего: 3809; сегодня: 1.

Технологии ABBYY помогают Институту востоковедения РАН в лингвистических исследованиях

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявляет об интеграции инструментария разработчика ABBYY FineReader Engine 9.0 с приложением, разработанным специалистами Института востоковедения РАН для внутренних нужд учреждения. Приложение используется для перевода в электронный вид бумажных документов на японском и китайском языках с целью их последующей лингвистической обработки. Технология ABBYY автоматизировала оцифровку текстов, избавив специалистов ИВ РАН от трудоёмкой работы по ручному вводу, и повысила точность вводимых данных.

Институт востоковедения РАН – академическое научное учреждение, ведущее фундаментальные исследования в области востоковедения. Научные изыскания института охватывают различные отрасли знания: историю, политику, экономику, религию, языки стран Ближнего и Дальнего Востока. Для решения ежедневных исследовательских задач ИВ РАН была необходима удобная встраиваемая технология распознавания, которая бы обеспечила тесную интеграцию процессов распознавания и верификации текстов с оригинальными процедурами лингвистического анализа, разработанными специалистами института. Решение ABBYY FineReader Engine 9.0 было выбрано как наиболее отвечающее потребностям ИВ РАН.

Теперь при обработке текстов на японском и китайском языках специалистам учреждения доступна широкая функциональность технологии ABBYY, в том числе инструменты коррекции отсканированного изображения для более качественного распознавания, функции анализа расположения блоков текста на странице и определения его ориентации. Также с помощью ABBYY FineReader Engine разработчикам ИВ РАН удалось реализовать удобный интерфейс верификации результатов распознавания. В процессе обработки текстов приложение строит гипотезы для неуверенно распознанных символов и предлагает их пользователю в виде контекстно-оптимизированных списков. Эта функция оказалась особенно полезна, учитывая сложность японского и китайского языков, отличающихся большим количеством символов, графической вариативностью, отсутствием чётко выраженных межсловных границ. В результате специалисты ИВ РАН добились заметного повышения точности распознавания текстов, при этом процесс оцифровки документов ускорился в несколько раз.

«Точное воспроизведение исходного документа в электронном виде необходимо для его корректного лингвистического анализа. Это особенно важно при оцифровке текстов, написанных идеографическим письмом, в котором отдельные символы обозначают не звуки, а целые слова или их значимые части. В таких случаях любая ошибка в распознавании может существенно исказить исходный смысл текста. С технологией ABBYY мы смогли перевести процесс оцифровки документов на японском и китайском языках на качественно новый уровень», – говорит Александр Костыркин, специалист Отдела языков и народов Азии ИВ РАН.


Ньюсмейкер: ABBYY — 211 публикаций
Поделиться:

Интересно:

Новые российские бренды представили на 24-м МКММ в Москве
26.11.2024 23:40 Мероприятия
Новые российские бренды представили на 24-м МКММ в Москве
В Москве на Большой Якиманке, 26  ярко и феерично прошел 24-й МКММ - показ новых брендов России. Проект МКММ (Международное московское комьюнити молодых модельеров) – это социальный проект в сфере моды, который ежегодно проходит в Москве более двенадцати лет.  МКММ – это некоммерческое...
Забота о сотрудниках и система управления здоровьем коллектива
26.11.2024 18:04 Мероприятия
Забота о сотрудниках и система управления здоровьем коллектива
14 ноября прошла совместная встреча членов Клуба «Экоздрав» Центра развития здравоохранения Школы управления Сколково и Клуба Сeo Remap, а также партнеров Addwise Executive Search «Благополучие сотрудников. Как создать культуру заботы». В дискуссии принял участие генеральный директор сети клиник...
Мифология Древней Руси
26.11.2024 12:54 Аналитика
Мифология Древней Руси
Наука о мифах (мифология) представляет мифы как наследие древнейших знаний и как систему повествований, имеющих священное значение. Тематика мифов (греческое слов mythos означает «слово», «сказание») обширна, с их помощью люди пытались объяснить происхождение жизни, природу природных явлений...
26 ноября 1812 года началось сражение на реке Березине
26.11.2024 09:03 Новости
26 ноября 1812 года началось сражение на реке Березине
26 ноября 1812 года началась битва, которая вошла в мировую историю как сражение на реке Березине. Русская армия, пытаясь отрезать французам пути отхода, преследовала отступающее войска. Главное сражение произошло вблизи города Борисов, ныне это территория Белоруссии. Это битва не только вошла в...
Одежда и обувь крестьян на Руси
25.11.2024 15:09 Аналитика
Одежда и обувь крестьян на Руси
В старину одежда и обувь не были так доступны, как сегодня. Их делали вручную, что было не так уж и просто. Что носили крестьяне во времена, когда не существовало торговых центров, из чего и как делали обувь и одежду, что такое понёва и армяк? Как носили лапти Лапти – это символ крестьянства на...