Команда Центра компетенций НТИ по большим данным МГУ – победитель хакатона Audithon 2021 Счетной палаты РФ

Команда MSUBIGDATA Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ стала победителем онлайн-хакатона Audithon 2021 Счетной палаты РФ, который прошел с 25 по 28 марта. Представители Центра стали лучшими в номинации «Аналитика данных», предложив собственное решение по анализу и оценке особенностей правоприменения и судебной статистики во взаимосвязи с показателями развития субъектов малого и среднего предпринимательства (МСП) в регионах России.

Перед командой MSUBIGDATA стояла задача от Департамента аудита цифрового развития и господдержки предпринимательства Счетной палаты РФ – собрать и сформировать базу знаний и информации в части показателей развития сектора МСП, правоприменительной практики в отношении субъектов МСП и соответствующей обратной связи предпринимательского сообщества.

В состав команды MSUBIGDATA вошли Роман СмирновИгорь ТерещенкоДарья ЯцкевичВиктор Прилепский и Валерия Пономарева.

Игорь Терещенкоруководитель направления правовых исследований и юридического сопровождения Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ, рассказал о проделанной в рамках хакатона работе: «Наша команда провела анализ влияния размеров штрафов, которые назначались предпринимателям за их деятельность без регистрации, на количество субъектов МСП и их оборот в отдельных регионах РФ (Москве, Республике Башкортостан, Ульяновской области). Размер штрафов и иные данные распознавались автоматически из текста судебного решения с помощью разработанной нейросети. Для ее обучения было проанализировано и размечено несколько тысяч судебных решений».

«В ходе работы также были выявлены пробелы в наполнении государственных информационных систем, таких как ГАС “Правосудие”, и данных Росстата, однако команда Центра готова к взаимодействию и совместному решению задач с заинтересованными ведомствами», – заметил Игорь Терещенко.

Роман Смирнов, руководитель направления информационных технологий и data science Центра, обратил внимание: «К основным ценностям нашего решения можно отнести, во-первых, обучение нейронной сети на основе BERT-архитектуры для извлечения сущностей из текстов судебных актов (с ее помощью мы, в частности, сформировали уникальную базу данных о назначенных штрафах и прочих санкциях в отношении предпринимателей и физических лиц), во-вторых, проведенный корреляционно-регрессионный анализ собранных данных, а также моделирование влияния жесткости политики на показатели развития МСП на его основе».

«К следующим планируемым шагам можно отнести дальнейшее обучение нейронных сетей для формирования эффективного машинного понимания текстов судебных актов. Будем надеяться, что результатом хакатона станет то, что наша разработка найдет свое практическое применение, в том числе в рамках деятельности Счетной палаты РФ», – добавил Роман Смирнов.

«Стратегия развития Счетной палаты предусматривает использование цифровых решений, и мы видим, что технологии действительно становятся все более востребованными во всех областях и направлениях контрольно-счетной деятельности. Идеи и разработки, возникающие в результате проведения открытых конкурсов, позволяют опробовать новые методы аналитической работы с данными каждому сотруднику, что меняет культуру организации и ускоряет трансформационные процессы», – ранее сообщал директор Департамента цифровой трансформации Счетной палаты РФ Михаил Петров.

Всего участникам Audithon 2021 были предложены 24 задачи в области государственного управления и аудита, распределенные по трем номинациям: «Визуализация данных», «Аналитика данных» и «Программное решение». Специальная номинация «Нестандартное решение» включала все задачи хакатона. Каждая команда-победитель получила приз в размере 125 тыс. рублей.

Хакатон Audithon 2021 – уже третье открытое соревнование по аналитике данных Счетной палаты РФ. В 2019 году состоялся хакатон DataAudit, а в 2020 году был проведен конкурс DataContest.


31.03.2021