Нажмите "Enter", чтобы перейти к содержанию

Распознавание документов: Распознавание документов на частном примере — обзор доступных платных и бесплатных решений

Содержание

Распознавание удостоверяющих документов 193 стран — компания Smart Engines

Smart ID Engine

— высокоточное и безопасное программное обеспечение для распознавания данных 1555 типов удостоверяющих документов 210 юрисдикций мира.

 

Smart ID Engine (ранее Smart IDReader) работает автономно на конечном устройстве: смартфоне, планшете, умной камере, терминале, персональном компьютере, сервере — автоматически распознавая видео, фотографии или скан образы документов удостоверяющих личность (ДУЛ): паспорта, удостоверения личности (ID карты), водительские удостоверения, визы, виды на жительства, разнообразные свидетельства и др.

 

Программное обеспечение НЕ передает личные данные ваших клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода, НЕ сохраняет данные — все обработка ведется в локальной оперативной памяти устройства, НЕ требует сетевого соединения.

 

При использовании Smart ID Engine (Smart IDReader) НЕ требуется выполнять дополнительных действий, связанных с получением согласия субъекта на обработку его персональных данных (юридическое заключение).

 

Smart ID Engine — инструмент цифровой трансформации процессов дистанционного привлечения и обслуживания клиентов банков, страховых компаний, операторов связи, микрофинансовых организаций, брокеров, туроператоров, риэлтеров, игорного бизнеса, финансовых супермаркетов, онлайн торговли и других отраслей электронной коммерции. С его помощью просто наладить удобное, быстрое, безопасное и бесконтактное обслуживание посетителей банковских и страховых офисов и внесение данных в CRM системы, обеспечив распознавание текста по фото российского паспорта или удостоверений личности других стран. Продукт позволяет организовать продажу финансовых, страховых, транспортных услуг и продуктов, билетов и сим карт в вендинговых машинах и терминалах.

 

Разработанная нашими специалистами технология оптического распознавания текста: GreenOCR позволяет точно распознавать текст на 100 языках, включая арабский, персидский, урду, японский (кандзи, катакана и хирагана), и специально оптимизирована для минимизации воздействия на окружающую среду в рамках подхода Green AI.

А наши технологии Edge OCR и 4D OCR обеспечивают быстрое и автономное распознавание текста в видеопотоке на мобильных устройствах.

 

Smart ID Engine помогает выявлять и предотвращать попытки мошенничества с документами в процессе оказания услуг, защищая как организацию, так и клиента. Важными преимуществами использования Smart ID Engine являются: соблюдение прав и свобод личности, высокие стандарты безопасности обработки персональных данных (ФЗ-152, GDPR, CCPA), выполнение требований регуляторов (KYC/AML), формирование передового пользовательского опыта и минимизация воздействия на окружающую среду (Green AI).

 

Поставка Smart ID Engine осуществляется в виде автономного SDK (software developer kit), содержащий все необходимые описания API (application programmable interface) и примеры по интеграции на разных языках программирования.

 

Подробные сведения о функциональных возможностях, архитектуре, совместимости с различными архитектурами ЭВМ и операционными системами представлены в спецификации.

Заказать продукт

Решение для массового ввода и распознавания документов

Решение  для массового ввода и распознавания документов позволяет исключить риски ошибок при ручном вводе и автоматизировать рутинные процессы. С его помощью финансовые службы могут ускорить ввод данных в учетные системы в 3 раза. Компания TerraLink предлагает решения, реализованные на базе продуктов Opentext или ABBYY.

Каждый день компании сталкиваются с проблемой интеграции факсов, электронной почты и бумажных документов в бизнес-процессы. Проблема заключается в том, что, хотя ваши клиенты, поставщики и партнеры могут легко направить вам документы по факсу или электронной почте, обработка полученной информации может быть затруднена.

Это особенно верно, когда информация поступает в различных форматах и различного качества. Часто персоналу приходится вводить эту информацию в системы вручную, что приводит к человеческим ошибкам, дополнительным затратам времени, задержкам обработки, проблемам с обслуживанием клиентов и перерасходу средств.

Решение для распознавания документов и их последующей обработки


Решение TerraLink для массового ввода и распознавания документов автоматизирует ваши процессы, устраняя затраты, задержки и ошибки, связанные с необходимостью ввода данных вручную. Решение совмещает сложную технологию распознавания, проверки и автоматизированные рабочие процессы, чтобы получить данные, непосредственно используемые вашими системами.

При построении решений TerraLink использует промышленные системы массового ввода, чье применение гарантирует наилучшие результаты в соответствии с потребностями наших пользователей:

  • OpenText Business Center for SAP Solutions – промышленная система, заслуженно котирующаяся в числе лидеров рынка программных средств массового ввода, представляющая непревзойденные встроенные возможности в части интеграции с хранилищами контента, реализованными на платформах SAP и OpenText.
  • Kofax Transformation Module (KTM) – промышленная, лидирующая в мире система для управления массовым вводом документов и их последующей обработкой.
  • ABBYY FlexiCapture – наиболее распространенная отечественная система, заслужившая заслуженное признание как в России, так и за рубежом.

Типичные проблемы, связанные с вводом документов

  • Информация поступает в разных форматах (факсы, вложения электронной почты, бумажные документы) и разного уровня качества.
  • Интеграция входящих документов в бизнес-системы может быть сложной задачей.
  • Ручной ввод входящей информации в бизнес-системы приводит к увеличению затрат, человеческим ошибкам, дополнительным рабочим циклам, задержкам обработки, проблемам обслуживания клиентов.

Функционал решения для массового ввода и распознавания документов

  • Автоматическая обработка неструктурированных документов различных форматов с использованием технологии распознавания, проверок качества персонала и автоматизированных рабочих процессов.
  • Превращение входящих документов в данные, непосредственно используемые бэк-офисными приложениями.
  • Предоставление данных в различных форматах, включая XML, CSV и IDOC.
  • Поддержка различных протоколов передачи данных, включая SMTP, HTTPS, FTP.
  • Точность на уровне поля ваших входящих документов и форм на уровне 99,5%.
  • Соблюдение конфиденциальности, безопасности и других норм.
  • Ежемесячные отчеты о проверках и исключениях.
  • Обеспечение работы ОЦО.

Бизнес-выгоды от внедрения решения для массового ввода и распознавания документов

  • Устранение затрат, задержек и ошибок, связанных с необходимостью повторного ввода данных вручную.
  • Оптимизация штата сотрудников, отвечающих за первичную обработку поступающих документов
  • Оптимизация и автоматизация работы операторов сканирования в филиалах
  • Оптимизация затрат на инфраструктуру за счет эффективного управления данными
  • Минимизация влияния человеческого фактора при контроле ошибок
  • Автоматизированный контроль полноты данных и правильности оформления документов
  • Решение проблемы пиковых нагрузок при закрытии учетных периодов
  • Сокращение времени исполнения ключевых корпоративных бизнес-процессов за счет перехода на работу с электронными образами документов вместо бумажных.

Результаты наших клиентов

  • Увеличение скорости ввода документов почти в 3 раза
  • Увеличение скорости ввода данных учетные системы почти в 2,5 раза с одновременным практически полным исключением ошибок
  • Повышение скорости обработки документов на всех этапах корпоративных бизнес-процессов почти в 4 раза
  • Уменьшение трудозатрат при обработке документов почти в 2 раза
  • Снижение нагрузки на каналы передачи данных почти в 3-4 раза, экономия трафика

OCR для распознования документов с помощью нейросети

Арнольд работает страховым консультантом. Ежедневно он тратит 2 часа на правку отчетов и оформление страховых полисов. Агентов в фирме много, но всех объединяет одна проблема: слишком много ручной работы. Время, потраченное на набор текста и исправление ошибок, лучше потратить на общение с клиентами или развитие новых навыков. Все это негативно отражается на бизнесе.

Чтобы оптимизировать работу, сократите бессмысленный ручной труд. В этом поможет OCR.

Что такое OCR?

Оптическое распознавание символов или OCR — это технология для переноса бумажного документа или цифрового изображения в текстовый документ, который легко читать, копировать и редактировать.

OCR пригодится там, где нужно обрабатывать большие объемы текста или работать с бумажными носителями. Страховые компании, банки, государственные учреждения, транспортные компании. Все, кто хочет извлечь текст из изображения, могут делать это проще и быстрее.

Как это работает?

Потребуется цифровое изображение или бумажная распечатка. Специальная программа распознает текст на бумаге или изображении и переводит его в редактируемый текст. Дальше — полная свобода действий и минимум потраченного времени.

Для компании Арнольда мы разработали специальный алгоритм обработки паспортов и водительских прав. Страховые агенты просто фотографируют нужный документ на телефон.

Программа сама заполняет ФИО, серию, номер паспорта и другие поля заявления.

В чем выражается польза?

Вы работаете быстрее

Раньше на оформление страховки требовалось 15-20 минут. С помощью нашего OCR-софта все решается за 5 минут и 3 простых шага:

  • Сотрудник фотографирует документ
  • Поля электронного заявления заполняются автоматически
  • Быстро проверяет текст на наличие ошибок

Вы работаете с удовольствием

Чем меньше рутинной работы, тем лучше. Монотонное печатание утомляет. Просто наведите камеру телефона на паспорт, права или любой другой документ. Программа распознает текст и автоматически заполнит необходимые поля.

Так Арнольд и его коллеги перестали тратить время на ручную печать и освободили время для настоящей работы.

Как мы распознавали документы для страховой компании

Рассказываем, как работаем над алгоритмами распознавания текста. С небольшими изменениями процесс общий для обработки любых бумажных документов.

Указанные ниже методы мы использовали для распознавания паспорта и водительских прав.

  • Локализация
  • Фильтрация
  • Извлечение строк
  • Распознавание текста по символам или по строкам

Локализация

Это нахождение документа на изображении. Для локализации мы пробовали три основных подхода:

  • OpenCV и обученный классификатор Хаара
  • Полносверточные нейронные сети
  • Аналитический подход на основе поиска связных компонент

В первом подходе документ помечается прямоугольником и обрезается до тех пор, пока в рамке не останется выделенной область с текстом; если документ на видео не найден, то алгоритм продолжает поиск в видеопотоке.

Во втором подходе мы применяем полносверточные нейронные сети. На вход сети подается цветное изображение паспорта. На выходе формируется два канала: первый используется для поиска центра первой страницы паспорта, второй - для поиска центра второй страницы. При этом сеть тренируется предсказывать маску, в которой над центрами страниц паспорта находятся гауссовы пики.

Третий подход мы применили для распознавания паспорта. Использовали шаблон, где на развороте паспорта находились две области с серией и номером документа. Если такой шаблон в кадре, то перед нами паспорт. В основе данного подхода лежит поиск связанных компонент. Смотрите видео ниже.

Фильтрация

Фон документов ламинированный, с бликами света и водяными знаками. Для нейронной сети все это - шум, который мешает распознавать символы. Поэтому мы этот шум постарались убрать. Для этого использовали:

  • Алгоритм фильтрации шума fastNlMeansDenoisingColored с окном подходящего размера для затирания линий
  • Билатеральный фильтр для получения однородного фона
  • Метод адаптивной бинаризации

Извлечение строк

Для водительских прав мы применили OpenCV и детектировали контуры букв.Затем мы разбивали строки на буквы, которые потом подавали на вход нейронной сети для распознавания.

Для извлечения строк паспорта мы применили полносверточную нейронную сеть.

Распознавание текста

Для распознавания текста мы использовали нейронные сети. Текст на правах мы распознавали по буквам с помощью сверточной нейронной сети, обученной на большом датасете изображений букв. Для создания и обучения нейронной сети мы использовали фреймворк Torch.

Текст в паспорте также распознавали с помощью полносверточной нейронной сети. Регистр буквы при распознавании не учитывается. Для обучения сети мы подготовили специальный скрипт — генератор обучающей выборки:

1. Водительское удостоверение

2. Камера

3. Исполняемый бинарный файл

4. Исходные коды C++, из которых собран исполняемый файл

5. Lua скрипт, осуществляющий работу с нейросетью. В нем описана архитектура сети.

6. Бинарный файл с весами сети, подгружаемый Lua скриптом. Веса получены после обучения сети

Почему вашему бизнесу нужны наши алгоритмы распознавания текста

Комбинируя различные подходы, мы добились точности распознавания 90%. Это больше, чем предлагают доступные на рынке инструменты.

Высокая точность достигается за счет специализированного подхода. Мы проверяем множество гипотез и выбираем то, что работает лучше для конкретной бизнес-задачи.

Используйте OCR в бизнесе для распознавания документов. Так вы повысите скорость работы, увеличите продуктивность и освободите сотрудников от малоэффективного ручного труда.

В 1С:Бухгалтерии появилось распознавание документов: как это работает

В 1С:Бухгалтерии с версии 3.0.81 появилась возможность упростить ввод некоторых первичных документов с помощью сервиса распознавания бухгалтерских документов. Специалист 1С:ИТС Тимофей Антипин рассказал, как это работает.

Тратите время на заведение первички вручную? Эта статья для вас.   

Неважно, в офисе или дома — теперь для ввода первичных документов достаточно отсканировать или сфотографировать документы и отправить их на распознавание. Если дома нет сканера — смартфон всегда под рукой. 

Распознавание документов есть только в сервисе 1С:Фреш в программе 1С:Бухгалтерия. На данный момент доступно распознавание Счетов-фактур, ТОРГ-12, УПД, Актов и Счетов на оплату. 

Обращаем внимание, что пользователи с действующим договором 1С:ИТС уровня ПРОФ могут работать в облачном сервисе 1С:Фреш бесплатно
 


На наш взгляд, распознавание документов — это первое значимое отличие в функционале облачной и коробочной версии, которое позволяет сделать однозначный выбор в пользу 1С:Фреш.

Для того чтобы воспользоваться сервисом распознавания документов в приложении 1С:Бухгалтерия нужно зайти в «Администрирование» — «Настройки распознавания документов» и поставить галочку «Использовать распознавание документов».

Рис. 1 (нажмите, чтобы увеличить) 


Представим, что пришли 3 документа, которые надо ввести в информационную базу:

  • поступление с УПД;
  • один Акт оказанных услуг; 
  • счет на оплату.

Сканируем документы и получаем файл с изображениями. В приложении 1С:Бухгалтерия откройте «Продажи» или «Покупки» и нажмите «Загрузить документы из сканов (фото)». В открывшемся окне нажмите кнопку «Добавить файлы».

Рис. 2 (нажмите, чтобы увеличить) 


Перетащите файлы в открывшееся окно или выберите их с диска.

Рис. 3 (нажмите, чтобы увеличить) 


Далее нажмите кнопку «Распознать».

Рис. 4 (нажмите, чтобы увеличить) 


В списке задач на распознавание появились новые записи в статусе «В обработке».

Рис. 5 (нажмите, чтобы увеличить) 


Спустя несколько минут документы распознаются и сменят статус на «Распознанные».

Рис. 6 (нажмите, чтобы увеличить) 


Открываем первый документ.

Рис. 7 (нажмите, чтобы увеличить) 


Слева отображаются основные свойства документа, справа — изображение отсканированного документа, а снизу — табличная часть документа. Далее проверяем номер, дату и сумму и контрагента. Если контрагента нет в информационной базе, 1С предложит создать контрагента по данным отсканированного документа. После проверки корректного заполнения всех полей, нажмите кнопку «Создать документ». В базе создался документ «Поступление услуг».

Рис. 8 (нажмите, чтобы увеличить) 


После создания документа программа автоматически перейдет к вводу следующего распознанного документа. Аналогичным образом создаем оставшиеся документы. Предварительно проверьте корректность автоматического заполнения полей, в том числе наименование номенклатуры, и при необходимости исправьте ошибки.

Таким образом, всего за несколько минут мы завели в базу 3 документа.

Для ускорения работы рекомендуем сканировать (фотографировать) документы и загружать их по несколько штук.



                       
Автор статьи: Тимофей Антипин,
специалист отдела 1С:ИТС 
«АСП-Центр сопровождения».
                                               
Заказать консультацию                  

Вместе с этим читают: