Отправить статью

«Как мы подбирали сервис для распознавания паспортов» — кейс OrbSoft

При обработке больших потоков документов компании важно подобрать инструмент, который избавит сотрудников от рутинных действий. Александр Соколов, технический директор Орбсофт, поделился кейсом по выбору сервиса автоматического распознавания паспортов.

«Как мы подбирали сервис для распознавания паспортов» — кейс OrbSoft
© TShaKopy/Shutterstock
Технический директор Орбсофт

Мы в Орбсофт занимаемся интеграцией цифровых решений для бизнеса, в том числе сами разрабатываем ПО. В этот раз мы искали готовый продукт под довольно популярную задачу — автоматическое распознавание паспортов.

Зачем нужно распознавание паспортов

Вспомните, как вы заселяетесь в гостиницу. Есть очередь? Причина, как правило, в том, что администраторы вручную переносят информацию из документов в базу данных. Автоматическое распознавание дает возможность просто отсканировать документ, данные сами попадают в систему — и никаких очередей.

С обработкой паспортов связана деятельность банков, финансовых структур, многих коммерческих и государственных организаций и ведомств. На больших потоках документов возникает столько рутинных действий, что люди банально выдыхаются. Это порождает, во-первых, потерю времени, во-вторых, ошибки или недостаток данных в электронной базе.

Основные боли заказчиков систем распознавания в этой связи: устранить влияние человеческого фактора, разгрузить сотрудников, дать клиенту быстрый сервис, экономя ему даже несколько драгоценных минут. Все привыкли к высоким скоростям.

Наш кейс: микрофинансовая организация

МФО в борьбе за заемщиков ввела простую регистрацию по разворотам паспорта через личный кабинет на сайте (посчитали, что 70% трафика — с мобильных устройств). Профит: клиенту не надо ничего заполнять вручную, в ЛК достаточно просто отправить фото документа, информация напрямую попадает в систему, после чего начинаются проверки заемщика на благонадежность. Для распознавания данных на первом этапе наняли операторов ввода. Получилось долго (штат небольшой), дорого (надо платить зарплаты, оборудовать рабочие места) и с ошибками (люди такие люди). Наступив на эти грабли, задумались об автоматизации распознавания. В идеале, искомая система должна отрабатывать без сбоев, чтобы заемщику не делать повторные фотографии, а проверки проходили корректно. По гипотезе заказчика, нововведение поможет увеличить число выданных займов.

Кого сравнивали и как выбирали

Критерии отбора: продукт должен быть отечественным (в реестре Минцифры), должен быть известным среди МФО и банков, в наличии есть демо-доступ.

В результате посмотрели в сторону трех российских вендоров: Smart Engines (можно быстро скачать мобильное приложение в App Store или Google Play), «Биорг» (веб-сервис Биорг.Паспорт на сайте компании, с быстрой регистрацией, для которой потребуется номер телефона — поступит SMS-код подтверждения), Dbrain (для доступа к демо-версии нужно было связаться с компанией, пообщаться по своей задаче, после этого консультант выдал ключ для доступа к триальной версии; это несколько дольше, чем в предыдущих двух случаях, но, в целом, не критично для дела).

Что сравнивали

Распознавание первого и второго разворота паспорта. Наборы полей, которые присутствуют во всех сервисах: кем выдан паспорт, дата выдачи, код подразделения, серия (лицевой скан), номер (лицевой скан), пол, фамилия, имя, отчество, дата рождения, место рождения, адрес регистрации.

В некоторых случаях прогоняли через систему многостраничный документ — посмотреть, что из этого выйдет.

Как сравнивали и зачем

Главный вопрос, на который мы попытались ответить — что такое качественное распознавание паспорта: скорость при определенных ошибках или обработка «под ключ» (как выразились два из трех поставщиков)? Считаем, что каждый заказчик должен решить это сам, исходя из своих потребностей.

Мы протестировали систему автоматического распознавания и два сервиса с верификацией данных на реальных документах. Верификация — это когда прямо в контуре распознавания за машиной может проверить человек, и только после этого уточненные данные уходят в систему. По идее, это гарантирует качество итогового результата.

Паспорта для теста собрали буквально у своих сотрудников по офису. Всего около 20 паспортов.

Примерно половину документов отсканировали, чтобы получить изображения в хорошем качестве. Другие паспорта сотрудники просто сфотографировали на телефоны, как получилось.

Оценивали решения по 5-ти балльной шкале: смотрели скорость, отсутствие ошибок распознавания на хороших и плохих картинках, рукописных документах, удобство интеграции, возможность подключать верификацию.

Результаты

На качественных изображениях

В целом, принцип «лучше картинка — точнее распознавание» никуда не делся. Технологии OCR разрабатывают более 30 лет, совершенного решения не найдено.

С оговорками, все испытуемые хорошо справились с распознаванием отсканированных или аккуратно сфотографированных изображений — без бликов, с нормальным разрешением и освещением.

Smart Engines — общая оценка 3/5. Работают очень быстро. На качественных картинках с печатными данными скорость распознавания, в среднем, 2 секунды (на мобильном устройстве, через тестовое приложение). Иногда до 5 секунд. За это накинули полбалла. Впечатление портит, что решение работает с ошибками на всех видах изображений (мало ошибок на хороших, много — на плохих и рукописных). Самые элементарные — пропуск пробелов. Из 5 попыток распознать разворот паспорта с московским ОВД РАЙОНА НАГАТИНСКИЙ ЗАТОН, все 5 раз оно так и осталось «ОВД РАЙОНАНАГАТИНСКИЙ ЗАТОН». На сайте пишут, что «возможность распознавания обеспечивается практически до того момента, пока документ может прочитать без ошибок человек».

Кажется, что для потоковой обработки рукописных документов решение не подходит (см. таблицу ниже). Верификации нет. Smart Engines можно рекомендовать, если есть уверенность, что клиенты присылают хорошие изображения, без рукописных данных.

Как мы поняли, в компании полностью сосредоточены на разработке ПО, в совете директоров — ученые. Видно, что делают ставку на развитие качественных технологий. В то же время подход не сервисный, не могут гарантировать итоговый результат распознавания «здесь и сейчас».

Dbrain — общая оценка 2/5. Сервис тратил около 6 секунд на разворот паспорта. Средняя скорость при одной ошибке на 10 качественных изображений. Практически не работает заявленное распознавание рукописных данных и верификация, от которой в сервисах может многое зависеть. В целом, могут работать с реальными изображениями, но ошибаются на сфотографированных документах и рукописных формах. Осталось впечатление недосказанности, когда общались с консультантами и посмотрели сайт. Единственные, кто не оказывает поддержки по интеграции. Подробнее об этих наблюдениях — в выводах.

Биорг.Паспорт — общая оценка 4/5. Сервис распознавал качественное изображение разворота документа, в среднем, за 10 сек. Не так быстро, как другие решения, но вообще без ошибок. На сайте говорят про 2–5 секунд. Распознавание рукописных данных работает хорошо. Решение обрабатывает первые два разворота, для остальных страниц проставляет нумерацию. Есть распознавание многостраничных документов — сразу несколько паспортов в одном файле.

Компания на год старше Dbrain, но как сервис для распознавания «под ключ» действует очень уверенно. Позиционируют, что за обработку паспортов отвечает комплекс нейросетей, а не простые и менее требовательных к «железу» алгоритмы, «как у других». За формулировку оценок не ставим, для нас главным показателем стало высокое качество итоговых данных.

На некачественных и рукописных изображениях. Кошмар распознавания

С бликами, низким разрешением и рукописными документами хорошо справился только Биорг.Паспорт — ноль ошибок. Сервис отработал даже там, где другие не смогли распознать данные совсем.

Оценка «хорошо», а не «отлично» — из-за скорости. При обработке рукописи время распознавания у «Биорг» ощутимо возросло: минимальное время составило 38 секунд на разворот, максимальное 1 минута 53 секунды на рукописную прописку, среднее 70 сек. Это вместо 5–10 секунд в случае с хорошей картинкой. Конечно, на фоне стопроцентного результата замедление не драматично, но все же заметно. Думаем, это как раз момент подключения верификаторов. Как компания подключает их так быстро на анонимном тесте — остается вопросом.

Сравнительные таблицы

Приводим несколько небольших таблиц с примерами. Понятно, что в случае паспортами, а значит, персональными данными, мы сильно ограничены в демонстрации. На приведенных скринах выделили проблемные места (прим. — работа выполнена профессионалами, дома не повторять — мы устали закрашивать поля с данными :) ) Уточненную информацию, кому интересно, можно будет обсудить по почте — оставим контакт в конце статьи.

Таблица 1

Качественные изображения, печатные формы 10 разворотов
Решение Среднее время распознавания Количество ошибок на 10 разворотов Примеры разворотов Количество ошибок на разворот/вид интерфейса при отсутствии ошибок
Smart Engines 2 сек 1 1
2
  1. 1
  2. 0
Dbrain 5 сек 1
  1. 0
  2. 1
Биорг.Паспорт 10 сек 0
  1. 0
  2. 0

Таблица 2

Некачественные изображения, печатные формы блики, низкое разрешение, 10 разворотов
Решение Среднее время распознавания Количество ошибок на 10 разворотов Примеры разворотов Количество ошибок на разворот/вид интерфейса при отсутствии ошибок
Smart Engines 2 сек 7 1
2
  1. 2
  2. 1
Dbrain 6 сек 9
  1. 2
  2. 0
Биорг.Паспорт 46 сек 0
  1. 0
  2. 0

Таблица 3

Рукописный текст, 10 разворотов
Решение Среднее время распознавания Количество ошибок на 10 разворотов Примеры разворотов Количество ошибок на разворот/вид интерфейса при отсутствии ошибок
Smart Engines 2 сек 25,
4 не распознано


1
2
3
  1. 4
  2. 8
  3. не распознан
Dbrain 6 сек 19
  1. 2
  2. 4
  3. 1
Биорг.Паспорт 70 сек 0
  1. 0
  2. 0
  3. 0

Общение с вендорами. Вопросы безопасности. Общие выводы

Результаты тестирования оставили вопросы. Почему решение, которое отлично работает с печатным текстом, не работает с рукописным? Чем принципиально отличается «коробочное» ПО от сервисного подхода, когда распознавание паспортов предлагают как облачную услугу (SaaS)? Почему так заметно падает скорость распознавания на некачественных картинках? Решили пообщаться с поставщиками, чтобы уточнить детали.

Smart Engines

Предлагают только автоматическое распознавание. Верификации данных нет даже в виде опции.

Гарантируют качество 93–94 процента по всем печатным полям, на рукописных полях — около 60 процентов. Основной разворот распознают печатный или рукописный (как мы видим, с ошибками), прописку — только печатную.

Нераспознанные данные придется вводить повторно либо самим пользователям, либо операторам-верификаторам на стороне компании-заказчика. Это снижает вау-эффект от скорости работы. Жизнь оказывается сложнее и разнообразней чистой технологии.

Не любят облачные сервисы, объясняя это безопасностью: данные не должны выходить за периметр заказчика. По этой же причине нет верификации — не берут к себе чужих данных. ПО работает в контуре.

Уверенно рекомендуют клиенту два варианта: использовать ПО Smart Engines или разработать собственную распознавалку. На вопрос, как надо делать собственный сервис, прислали посмотреть статью конкурентов.

Ориентированы на большие потоки документов. С такой скоростью — оно и понятно. Остается вопрос — что с качеством на больших объемах. Действует модель подписки по количеству документов — минимальный пакет распознаваний 20 тысяч в год.

Для интеграции отдают пакет разработчика (SDK), обещают помощь в настройке, есть простая инструкция. Расширенный функционал предлагают через настройку по API, как в случае с облаком.

Наше мнение

На рынке конкурируют коробочное ПО и облачные сервисы. Это говорит о том, что у клиентов потребности разные. Кому-то нужна верификация, кто-то на этом не заморачивается или отказывается по соображениям безопасности. В последнее время мы часто слышим о массовых утечках данных, это настораживает. Но если бы не могли дистанционно передавать свои персональные данные разным сервисам и госведомствам — что тогда? Живая очередь? Наше мнение — хорошо бы верификацию иметь, хотя бы как опцию.

Dbrain

Предоставляют облачный сервис распознавания. Также предлагают установить ПО в контур заказчика, но тогда и качество распознавания заказчику придется обеспечивать своими силами. Последний вариант — уже не сервисная услуга, и преимущество Dbrain перед теми же Smart Engines здесь отсутствует. При прочих равных «коробка» выигрывает у сервиса если не по цене, то по технологиям.

Качество автоматического распознавания декларируют на уровне 85 процентов. Проблемой остаются засветы и блики на изображении, поэтому без верификации не обойтись. Процесс верификации заявлен через интеграцию с облачным сервисом Яндекс.Толока. Данные в облаке могут верифицировать как сторонние люди, так и собственные сотрудники — на выбор.

SLA прописывают от 30 до 3000 секунд (sic!). Если система не справляется за это время, то документ надо будет перезагрузить. Оплата постраничная: один разворот = одна страница.

Интеграция традиционная для «облаков» — по API. Помощь в установке системы не оказывают — говорят, что «не зарабатывают на консалтинге». Немного странно.

Наше мнение

Многим заказчикам, в принципе, не очень важно, как именно происходит процесс: с верификацией или без. Главное, что данные из паспорта попадают в информационную систему быстро, без ошибок, с гарантией безопасности. У Dbrain есть трудности с финальными результатами на обычных и плохих изображениях. Для технологии это нормально, для сервиса — не очень. Гораздо хуже, что у компании, как оператора персональных данных, нет сертификатов ФСТЭК, ФСБ. На сайте сказано про некий меморандум соответствия от консалтинговой компании. Глобально ничего плохого про решение сказать нельзя, просто кажется, что оно немного «сырое», как и общий подход. Кажется, это нормально для стартапа с очевидными зонами роста. Компания возникла в 2018 году.

Биорг

Биорг.Паспорт работает и как облачный сервис, и как «коробка» в контуре заказчика. Опцию верификации компания подключает по желанию клиента. Операторы могут быть и на стороне «Биорг», и на стороне заказчика, подключаясь через облачную платформу вендора.

На нашей выборке сервис показал себя как самый жизнеспособный в условиях реальных изображений. Хотя скорость обработки уступает конкурентам, качество — превосходит. В договоре официально готовы прописывать SLA до 2-х минут. Подчеркнули итоговое качество формулировкой «фирменное двухэтапное распознавание», когда за автоматическую обработку документов отвечают нейросети, за верификацию изображений, распознанных с низкой уверенностью — люди. Оплату предлагают за разворот паспорта.

Это не очень отличается от концепции Dbrain, где тоже декларируют и верификацию, и оплату за разворот. Разница в том, что у «Биорг» проверка данных работает и включается очень быстро. Хотя так и не удалось выяснить, как это происходит. Интересно, в компании утверждают, что сервис работает автоматически, паспорта распознают продвинутые нейросетевые комплексы. Под это специально брали грант в «Сколково».

Консультант отметил, что облачная платформа для верификации у «Биорг» — собственная, данные не передаются третьей стороне. Операторы официально трудоустроены, проходят проверки и обучение. Платформу обкатали в федеральных проектах оцифровки.

Единственная компания, которая сказала, что застраховала свою профессиональную ответственность (обработку персональных данных) на случай претензий третьих лиц. Страховых случаев не наступало. На сайте есть лицензии ФСТЭК и ФСБ, «Биорг» официально зарегистрирован в качестве оператора обработки персональных данных и отвечает за обращение с ними. Для сервиса с верификацией это очень правильный подход.

Общее наблюдение

Почему-то ни в одной из компаний сразу не вышли на обратную связь с информацией по дальнейшему сотрудничеству. С паузой ответили из Биорг (иронично получилось прямо как с распознаванием: чуть медленнее, но без осечек). Dbrain никаких уточнений по итогам общения не прислал, хотя записывал наши вопросы, чтобы вернуться. Промолчали и в Smart Engines. Списываем это на высокую занятость распознаванием паспортов или на летние отпуска.

Общее сравнение сервисов

Распознавание паспорта Smart Engines Dbrain Биорг.Паспорт
Скорость + +
2–5 сек
+
4–6 сек
+ –
2–46 сек
Верификация данных + – +
Распознавание рукописных данных +
Распознавание «под ключ» на любом качестве документов +
Общее удобство при тестировании + + – +
IT компания Орбсофт является частью цифровой индустрии с 2003 года. За это время компания реализовала более 400 успешных проектов, разработала собственные уникальные решения для финансовых компаний и ритейла.

Клиентами компании являются крупные российские банки и финансовые организации, ритейлеры и небольшие торговые компании, производственные структуры, транспортные и логистические компании, рекламные агентства, маркет плейсы и интернет-магазины.

Александр Соколов, технический директор Орбсофт, почта для связи: sokolov@orbsoft.ru
Деловой мир в
и
Деловой мир в
и
0 комментариев
Отправить
Чтобы оставить комментарий, авторизируйтесь или зарегистрируйтесь