Сервис по распознаванию документов, созданный при участии ЦК НТИ по большим данным МГУ, поможет бизнесу получить субсидии

На портале i.moscow Московского инновационного кластера в пилотном режиме планируется запустить сервис автоматизированного анализа документов. Решение поможет столичным предпринимателям правильно подать документы для получения субсидий. Встроенные в сервис функции распознавания и проверки документов на основе искусственного интеллекта разработаны специалистами Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ (ЦК НТИ МГУ).

При подаче заявки на субсидию предпринимателю необходимо прикрепить набор заверенных документов. Сервис, созданный Департаментом предпринимательства и инновационного развития (ДПИР) города Москвы совместно с ЦК НТИ МГУ, проанализирует, правильные ли документы поданы и нет ли в них ошибок. При наличии ошибок решение даст рекомендации по их устранению. В основе сервиса лежат современные технологии, среди которых нейронные сети, машинное обучение, обработка текстов на естественном языке (NLP).

Роман Смирнов, руководитель направления информационных технологий и data science ЦК НТИ МГУ, рассказал, что решение основано на применении концепции transfer learning и использует передовые модели машинного обучения (такие как BERT, YOLO, Inception). «Отдельно необходимо обратить внимание, что данное решение является MVP: для обеспечения большей точности необходимо дальнейшее дообучение моделей, улучшение механизмов графического распознавания текстов (OCR), в том числе с использованием собственных моделей OCR. Мы сейчас ведем их разработку и надеемся внедрить в рамках продолжения сотрудничества с Департаментом предпринимательства и инновационного развития города Москвы», – отметил Роман Смирнов.

ДПИР ожидает кратного роста числа заявок в ходе субсидийной кампании для бизнеса в 2021 году, сообщил глава департамента Алексей Фурсин на презентации кампании. По результатам 2020 года Правительство Москвы одобрило более 3 тыс. заявок на получение финансовой поддержки на общую сумму почти 3 млрд рублей. Всего за две кампании было подано около 11 тыс. заявок.

«Мы делаем вывод, что то количество, которое подавалось с заявками на получение помощи, кратно вырастет. Мы видим на сегодняшний день совершенно другую готовность [бизнеса]. Даже вторая кампания серьезно отличалась от первой, – обратил внимание Алексей Фурсин. – Наш KPI основной заключается в следующем: получил заявку – получи субсидию. Оно должно быть равно». Спикер подчеркнул, что поставлена цель прийти к модели «одна заявка – одна субсидия».

По словам Кристины Костромы, первого заместителя руководителя ДПИР, эксперимент по внедрению сервиса распознавания документов, который ведется в рамках Постановления Правительства Москвы № 741-ПП «Об утверждении порядков предоставления субсидий из бюджета города Москвы в целях государственной поддержки субъектов малого и среднего предпринимательства...», соотносится с целью «одна заявка – одна субсидия». Алгоритмы распознавания образов сравнят прикрепленный предпринимателем документ с неким «идеальным» документом, который требуется для рассмотрения заявки на субсидию, отметила спикер.

После внедрения «первого функционала» будет рассмотрен вопрос о расширении эксперимента. «Если все будет хорошо, то мы прикрутим это в оставшиеся порядки», – поделилась Кристина Кострома.

«Как это будет выглядеть организационно? Вы будете подгружать документы. Если документ нормальный, то он будет отображаться зеленым (все хорошо). Если в документе (по нашим алгоритмам) выявлены нарушения, чего-то не хватает, будут даны соответствующие маркеры: [например,] на 16 странице не хватает печати, на 15 странице не хватает подписи и т. д. Ваше право – игнорировать это, но в любом случае наша задача – сделать ваши документы более соответствующими требованиям, поэтому эти сигналы мы будем транслировать», – добавила спикер.

Сервис стал результатом работы специалистов ЦК НТИ МГУ, которая началась еще в октябре 2020 года: тогда в рамках хакатона Правительства Москвы «Лидеры цифровой трансформации» был создан правовой помощник для предпринимателей, занявший первое место в своей категории.

«Мы знаем про принцип Парето: 80% результата достигается за счет 20% усилий. Примерно то же самое мы видим здесь: 80% ошибок, которые люди совершают в документах при обращении куда-либо, довольно легко можно находить с помощью автоматизации, можно проверять их наличие или отсутствие, делать на основании этого рекомендации», – ранее сообщал Роман Смирнов.

Фото: YouTube (канал «Предпринимай ТВ»).


01.04.2021