Эксперты МГУ, ИРИО, Всемирного банка обсудили регулирование данных и технологии анализа данных в правоприменении

31 мая в офлайн- и онлайн-форматах прошел круглый стол «Право данных и данные права: государственная политика регулирования». Организаторами мероприятия выступили Национальный центр цифровой экономики МГУ имени М.В. Ломоносова (базовая организация для Центра компетенций НТИ по технологиям хранения и анализа больших данных), Институт права и публичной политики и Институт развития информационного общества (ИРИО).

«В названии круглого стола зашиты две смысловые части мероприятия. Первая часть будет посвящена непосредственно вопросам регулирования оборота данных, больших данных – как это делается в России, каков зарубежный опыт такого регулирования… Во второй части мы обсудим вопрос о том, как данные могут помогать развиваться праву и правоприменительной практике», – сообщил модератор круглого стола, ведущий специалист Национального центра цифровой экономики МГУ Сергей Афанасьев.

Юрий Хохлов, председатель совета директоров ИРИО, руководитель проекта по мониторингу и стандартизации больших данных Центра компетенций НТИ по большим данным МГУ, выступил с докладом о национальной политике работы с данными в России. «Ситуация в России такова, что мы пока неконкурентоспособны на глобальном уровне ни на рынке работы с данными физических лиц, ни на рынке работы с промышленными данными (то есть данными, используемыми в промышленном производстве, сельском хозяйстве, здравоохранении и т. д.)», – рассказал спикер. В связи с этим, по его мнению, крайне важно сформировать в Российской Федерации национальную государственную политику по работе с данными, выработать инструменты для реализации такой политики. 

«Задачи формирования национальной политики и ее реализации – это та первоочередная задача, которую нужно сейчас решать, в том числе и в рамках разрабатываемой сегодня стратегии социально-экономического развития России до 2030 года. По целому ряду направлений в явном виде нужно учитывать возможности, которые несут за собой цифровые технологии и данные, обрабатываемые с помощью этих технологий», – обратил внимание Юрий Хохлов.

Он добавил: «Вопрос, связанный с национальной безопасностью и управлением промышленными данными, чем дальше, тем больше будет выходить на первый план, прежде всего для европейцев и у нас в Российской Федерации. Поэтому наличие целенаправленной государственной политики, подкрепленной соответствующей национальной стратегией и планом действий по ее реализации, – это один из тех вызовов, который стоит перед Российской Федерацией (как перед правительством страны, так и перед бизнесом, гражданами, научно-образовательным сообществом)».

Ярослав Еферин, консультант глобальной практики по цифровому развитию Всемирного банка, поделился, что, согласно прогнозу IDC, глобальный объем данных вырастет через пять лет в пять-шесть раз. «Важный момент состоит в том, чтобы извлекать ценность из этих данных, которые собираются в таких больших объемах, и использовать их в интересах граждан, государств, частного бизнеса, научного сообщества, чтобы получать те самые цифровые дивиденды. Особую роль здесь, конечно же, играет государство в качестве ключевого агента всей экосистемы и основного регулятора, принимающего стратегические решения в этой области… В том числе государство решает ряд моральных проблем – то, что мы называем этикой данных», – сообщил спикер. Он пояснил, что в большинстве стран этика использования данных не закреплена документально и находится на уровне экспертных обсуждений.

В своем докладе Ярослав Еферин отметил растущее по всему миру число стратегий по искусственному интеллекту (ИИ) и данным: по меньшей мере 50 стран уже разработали или разрабатывают собственные стратегии.

Национальная политика в области данных направлена на обеспечение и поддержание доверия к экосистеме данных и соответствующим институтам. В частности, на правовом уровне этому способствуют законы о защите персональных данных, кибербезопасности, открытых данных, а также отдельные законы и нормативно-правовые акты.

Всемирным банком разработана концептуальная схема анализа национальных политик, содержащая три основополагающих элемента: ценность данныхдоверие к даннымданные как инфраструктура. Эта концептуальная рамка представлена в докладе Всемирного банка по политике данных в России. Презентация доклада запланирована на июнь 2021 года.

Николай Дмитрик, заведующий лабораторией правовой информатики и кибернетики юридического факультета МГУ, поднял вопрос о том, кто устанавливает правила работы с данными, выразив альтернативную относительно предыдущего доклада точку зрения. «Правила работы с данными сейчас устанавливает не государство… Из-за чего вдруг сломалось государственное регулирование? Потому что каждое государство, пытаясь регулировать данные, устанавливает правила, настаивающие на собственной исключительности и эксклюзивности: Россия применяет федеральный закон “О персональных данных”; Европа – GDPR; США – законодательство того штата, где происходят отношения; КНР – гражданский кодекс и т. д. Все делают вид, что они исключительны, что действуют только они, таким образом обнуляя друг друга», – считает спикер.

По его мнению, вопрос регулирования данных требует взаимодействия на международном уровне. «Необходимо взаимодействие. Оно должно быть направлено на такую важную теоретическую категорию, как правовая определенность, когда всем интуитивно и органически понятно, что надо делать… В случае с международным регулированием нам необходимо использовать международные инструменты. Для России это Евразийский экономический союз, где мы можем разрабатывать собственные международные инструменты по политике работы с данными», – уверен Николай Дмитрик.

Затем последовала дискуссия участников круглого стола. На ней, в частности, выступил ведущий научный сотрудник Института проблем управления РАН, эксперт проекта по мониторингу и стандартизации больших данных Центра компетенций НТИ по большим данным МГУ Александр Райков. Он предложил критерии и принципы оценки данных в России: стратегичность, корректность , полнота, когнитивность , конвергентность. «Данные должны создавать условия для реализации стратегии развития страны», – подытожил Александр Райков.

Во второй части мероприятия руководитель направления информационных технологий и науки о данных Центра компетенций НТИ по большим данным МГУ Роман Смирнов рассказал, как современные технологии распознавания текстов могут способствовать развитию машиночитаемого права.

В частности, команда Центра разработала решение, способное классифицировать и верифицировать документы на основе технологий обработки естественного языка (NLP) и графического распознавания. Совокупность этих технологий помогает машине классифицировать даже визуально неотличимые документы (например, устав организации, накладную, договор купли-продажи, договор аренды и т. д.). Верификация подразумевает проверку, соответствует ли документ определенным требованиями (например, содержит ли печати и подписи в необходимых местах).

Один из вариантов применения разработки – создание умного правового помощника для предпринимателей и граждан. Такая программа на основании переписки с пользователем формирует простой и верный ответ на правовые вопросы. Алгоритм работы помощника предполагает, что сначала распознается входящий запрос, затем запрашивается необходимая информация (в том числе документы по определенному перечню с проверкой их содержания), после на основе полученных сведений автоматически формируется проект ответного документа с возможностью оценки правовых рисков.

Обучение нейросетей на массивах данных законодательства и правоприменительной практики с помощью NLP также позволяет приблизиться к машиночитаемому праву. Например, команда Центра создала модель, способную извлекать из текстов судебных решений следующие данные: ответчика, статью, по которой он привлечен к ответственности, год, приговор, регион, город и пр. Эти результаты могут быть применены для формирования баз знаний (например, качественной и достоверной статистики), создания учебных тренажеров, мониторинга изменения законодательства.

Руководитель направления правовых исследований и юридического сопровождения Центра компетенций НТИ по большим данным МГУ Игорь Терещенко рассказал, что анализ данных уже применяется в уголовном праве США, в этой же стране существуют базы данных для исполнения нормативных актов, классификации документов и пр. Программы, осуществляющие поддержку принятия решений, позволяют судьям минимизировать количество рутинных задач и сконцентрироваться на более творческих. «Замена судьи полностью искусственным интеллектом исключается, поскольку все равно это только вспомогательный инструмент», – пояснил Игорь Терещенко.

В России в пилотном режиме ИИ используется на трех судебных участках Белгородской области. С использованием технологии готовятся приказы по взысканию имущественных, транспортных и земельных налогов.

Автоматизация права неизбежна, уверен Игорь Терещенко. Она поможет по-настоящему реализовать принципы правовой определенности и системности.

Полноценное появление машиночитаемого права, по мнению спикера, требует единой онтологии – высшего уровня формализации знаний для представления правовых норм в точной цифровой форме. «Сейчас автоматизация права требует своей онтологии, своих единиц, на которых будет базироваться правовая норма, сформулированная по-новому, новым языком, понятная различным машинам, компьютерным технологиям. Это очень крупная проблема, которая должна решаться постепенно и путем взаимодействия различных сторон», – считает Игорь Терещенко.

На текущем (начальном) этапе, когда единая онтология еще не создана, спикер видит задачу исследователей в создании решений, подобных тем, о которых рассказал Роман Смирнов. «При создании текущих решений мы не заменяем существующие нормы, не заменяем человеческий язык. Мы работаем с уже имеющимися нормами и языком. Это уже помогает автоматизировать право. В полноценном виде машиночитаемое право, конечно, будет предполагать глобальную онтологию, созданную усилиями множества юристов. Думаю, это должны быть распределенные усилия с доступом к единой инфраструктуре, где все смогут принять участие, работая по определенным правилам», – пояснил Игорь Терещенко.

В свою очередь, Юрий Хохлов в рамках дискуссии выразил сомнение в возможности и необходимости построения подобной глобальной онтологии и на ее основе – онтологии регулирования отношений с помощью права. «Необходимо начинать с построения онтологий отдельных узких предметных областей (сфер деятельности), которые гораздо проще, и решение подобной задачи вполне достижимо в обозримой перспективе, чего не скажешь о построении “онтологии всего”», – считает спикер.


07.06.2021