Smart Engines выпустила новую версию системы ИИ для распознавания документов Smart IDReader

Софт Корпоративная мобильность Российское ПО
мобильная версия

Smart Engines представила новую версию системы искусственного интеллекта для распознавания документов Smart IDReader 2.0. Вторая версия, созданная с применением глубоких разреженных дискретных нейронных сетей, может распознавать в видеопотоке и на изображениях сотни видов официальных документов, типовые формы формата А4 и поддерживает произвольные ракурсы съемки, удобные пользователю. Продукт нацелен на рынки РФ и стран бывшего СССР.

«3 года назад мы первыми предложили клиентам распознавать паспорт РФ в мобильных приложениях, показывая документ камере телефона. Это был новый пользовательский опыт, и мы очень рады, что рынок его принял. Вторая версия Smart IDReader — это история про новые стандарты в распознавании документов. Клиентам не нужны системы OCR, которые распознают скан паспорта за 5 секунд на мощном компьютере и не умеют обрабатывать фотографии с легко читаемым текстом просто потому, что система не научена законам перспективы. Пользователи хотят буквально за 1 секунду распознавать наспех сделанные фотографии и выполнять real-time распознавание в видеопотоке», – сказал генеральный директор Smart Engines к.т.н. Владимир Арлазаров.

Использование в версии Smart IDReader 2.0 вычислительно-эффективных алгоритмов машинного зрения и 8-битной модели вычислений позволило специалистам Smart Engines перейти технологический барьер от распознавания на мобильных телефонах документов размера А5 и В5 (паспорт РФ) до типовых удостоверяющих документов и произвольных анкет, заявлений, договоров формата А4. При распознавании «больших» документов в видеопотоке в мобильном приложении требуются принципиально новые подходы к проведению вычислений, так как в отличие от серверных решений производительность смартфона ограничена и для ускорения распознавания невозможно просто подключить дополнительное «ядро».

Развитие дистанционных каналов обслуживания является одной из основных сфер применения технологий распознавания документов. Зачастую клиенты отправляют при обращении фотографии, на которых документы из-за проективных искажений представляют собой непрямоугольные четырехугольники, а в случае паспорта РФ — так называемую «книжку». OCR-технологии, ориентированные на работу со сканами, при обработке таких фотографий могут давать качество на уровне 5-10% и менее. Smart IDReader 2.0 умеет исправлять проективные искажения как на фотографиях, так и при работе с видеопотоком в мобильных приложениях, предлагая пользователю показывать документ камере как ему удобно. Технологически возможность распознавания при этом обеспечивается практически до того момента, пока документ может прочитать без ошибок человек.

Благодаря проведенным алгоритмическим и программным оптимизациям в Smart IDReader 2.0 удалось достигнуть двукратного увеличения точности распознавания. Это означает, что количество ошибок распознавания, которые попадают на верификацию человеку, по сравнению с первым поколением системы сократилось примерно в два раза.

В новой версии появилась возможность распознавания паспортов гражданина РФ с рукописным заполнением. И, хотя количество таких документов относительно общего числа невелико, их обработка не только актуальна в различных финансовых сервисах, но и является очередным научным вызовом. Для обработки рукописных паспортов в решении Smart Engines реализованы автоматическая детекция рукописного заполнения и возможность распознавания (помимо номера документа) пола, дат и номера подразделения.

Достигнутые сотрудниками Smart Engines результаты стали возможны благодаря решению целого пласта сложных научно-технических задач в области компьютерного зрения и искусственного интеллекта. Научное подтверждение полученных результатов нашло свое отражение в двух защищенных кандидатских диссертациях и в более чем 40 статьях, опубликованных в рейтинговых российских и международных журналах.

Помимо распознавания паспорта РФ, СНИЛС, водительских удостоверений, СТС и документов с машиночитаемой зоной, доступного уже в первой версии, Smart IDReader 2.0 умеет распознавать 15 новых видов документов РФ, 20 документов стран бывшего СССР и более 200 документов стран мира на более чем 35 языках. Добавление новых типов документов и языков распознавания реализовано на базе оригинальной разработки Smart Engines в области зрительного интеллекта — технологической платформы Hieroglyph.

С точки зрения базовой функциональности улучшено качество распознавания эмбоссированных и неэмбоссированных банковских карт, машиночитаемой зоны на любых документах с MRZ и реализовано распознавание штрихкодов с высокой плотностью печати. В видеопотоке, на фотографиях и сканах обеспечена поддержка распознавания одномерных штрихкодов UPC-A, UPC-E, EAN-8, EAN-13, Code 39, Code 93, Code 128 и двумерных QR Code, Data Matrix, Aztec, PDF 417.

Алгоритмическая база Smart IDReader оптимизирована для архитектур «Эльбрус», SPARC, MIPS, ARM, x86 и совместима с операционными системами iOS, Android, Sailfish Mobile OS RUS, «Эльбрус», Linux (включая Astra Linux и «Атликс»), Windows, macOS и Solaris. Решение относится к классу платформонезависимых — качество распознавания не зависит от используемой ОС и аппаратной платформы, а быстродействие определяется доступными вычислительными ресурсами.

По заявлению Smart Engines, Smart IDReader применяется в банках, страховых компаниях, проектах шеринговой экономики, финтехе, в различных сервисах с дистанционным и выездным обслуживанием, где для оказания услуг клиентам требуется предоставление своих данных. Пользователями системы являются Альфа-Банк, «Почта Банк», «Тинькофф Банк», Совкомбанк, «Альфастрахование», «Ингосстрах», «Ренессанс Страхование», «СКБ Контур», Qiwi и др.

Колонка эксперта

CNews100: Крупнейшие ИТ-компании России 2016

№ 2016 Название компании Совокупная выручка компании в 2016 г., c НДС, ₽тыс. Рост выручки 2016/2015
1 НКК 163 958 372 16,4%
2 Ланит 114 514 106 11,4%
3 Epam* 77 612 831 40,0%
4 Softline 57 291 368 20,5%
5 Техносерв 52 442 285 1,3%
6 Газпром Автоматизация*** 50 756 310 -15,9%

смотреть полный рейтинг

Крупнейшие ИТ-разработчики России 2016

№ 2016 Название компании Город (расположение центрального офиса) Выручка от продажи продуктов собственной разработки (АО, ПО, в том числе продукты, поставляемые по модели SaaS) в 2016 г., с НДС, ₽тыс.
1 Epam* Ньютаун (США) 77 612 831
2 Luxoft * Цуг (Швейцария) 50 215 140
3 Лаборатория Касперского* Москва 43 083 600
4 1С** Москва 37 300 000
5 Cognitive Technologies Москва 28 390 373

смотреть полный рейтинг