Компания Cognitive Technologies объявляет об открытие кода системы распознавания печатных текстов Cuneiform. Для распространения программы выбрана лицензия BSD (Berkeley Software Distribution). Исходный код доступен для скачивания со 2 апреля 2008 года на сайте www.cuneiform.ru.
Разработка и развитие OCR технологий — очень сложная и наукоемкая задача, имеющая более, чем 50-летнюю научную историю. Сегодня OCR массово востребованы не как отдельный продукт, а как части информационных систем (в том числе и офисных программ). Публикуя исходные коды системы Cuneiform с промышленным качеством распознавания, компания открывает возможность повсеместного использования OCR в различных программных продуктах и привлекает к развитию технологии сообщество Open Source.
Это событие — очередной этап реализации программы «Распознавание должно быть на каждом компьютере», в рамках которого к созданию OCR системы будет подключено сообщество разработчиков ПО с открытым кодом. Первый этап программы, когда OCR Cuneiform стала бесплатной, вызвал огромный общественный интерес. Об этом говорит тот факт, что только с сайта www.cuneiform.ru программу скачали более 300 000 раз. А всего по оценкам Cognitive Technologies за этот период количество скачиваний превысило 700 000.
Выбор лицензии BSD для открытия ядра OCR Cuneiform был обусловлен в первую очередь научно-исследовательской и образовательной направленностью проекта. В его рамках предполагается получить новые идеи и методы, которые смогут значительно усилить систему и повысить привлекательность OCR-технологий как сервиса. Для общества статус BSD означает возможность использования результатов работы в коммерческих проектах.
«По мере развития проекта мы планируем вести диалог с сообществом и рассматривать изменения условий лицензирования в сторону GPL (General Public License), как всего комплекса, так и его отдельных модулей.», — отмечает руководитель направления ПО с открытым кодом Cognitive Technologies В.В. Арлазаров.
На текущий момент заявку на участие в проекте уже подали более 30 человек из разных стран мира. В планах на 2008 год подготовка первой версии OCR с открытым кодом на базе Cuneiform, при разработке которой приоритетными направлениями будут: создание современного интерфейса, поддержка Linux и добавление новых языков распознавания.
Одновременно с открытием кодов Cognitive Technologies заканчивает работы по созданию web-сервиса, предоставляющего возможность распознавания текстов в сети Интернет без установки программного обеспечения на локальный компьютер.