Юрий Хохлов об участии ЦК НТИ по большим данным МГУ в международной и национальной стандартизации больших данных

25 февраля состоялось заседание Комитета по промышленной и инновационной политике Московской торгово-промышленной палаты (МТПП) на тему «Big Data: технологии, меняющие жизнь». Юрий Хохлов, руководитель одного из ключевых проектов Центра компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ имени М.В. Ломоносова, на заседании рассказал о международной и национальной стандартизации больших данных, а также участии Центра в этой деятельности.

Заседание вступительным словом открыли Михаил Коган, председатель Комитета МТПП по промышленной и инновационной политике, председатель совета директоров ПАО «Калибр», и Сурен Варданян, вице-президент МТПП.

На встрече с докладом выступил Юрий Хохлов, председатель совета директоров Института развития информационного общества (входит в консорциум Центра компетенций НТИ на базе МГУ), руководитель подкомитета «Данные» (ПК 02) технического комитета «Искусственный интеллект» (ТК 164), руководитель проекта «Мониторинг и стандартизация развития и использования технологий хранения и анализа больших данных в цифровой экономике РФ» Центра компетенций НТИ на базе МГУ.

В начале своего выступления спикер привел определение понятия «большие данные», закрепленное в международном стандарте ISO/IEC 20546:2019 Information technology – Big data – Overview and vocabulary: под ними понимаются «большие массивы данных, отличающиеся главным образом такими характеристиками, как объем, разнообразие, скорость обработки и/или вариативность, которые требуют использования технологии масштабирования для эффективного хранения, обработки, управления и анализа».

Эксперт также назвал факторы, влияющие на производство, использование и воздействие (экономические и неэкономические эффекты) технологий хранения и анализа больших данных. Среди таких факторов: государственная политика и регулирование, система управления и механизмы финансирования, человеческий капитал, исследования и разработки, цифровая инфраструктура и информационная безопасность.

На международном уровне, по словам Юрия Хохлова, уже сформирован пакет стандартов по большим данным, состоящий из терминологического стандарта и серии из пяти стандартов по эталонной архитектуре больших данных. «Большинство промышленных решений, которые предлагаются крупными компаниями-вендорами, следуют этой эталонной архитектуре, поэтому крайне важно, чтобы эту же эталонную архитектуру реализовывали наши и крупные компании, и малые предприятия, которые реализуют отдельные ее компоненты», – считает спикер.

Сегодня на международном уровне завершается разработка стандарта по структуре процесса управления аналитикой больших данных, а также начинается работа над новой серией из четырех стандартов по качеству данных для аналитики и машинного обучения.

В России работу по стандартизации больших данных, по сообщению Юрия Хохлова, ведут Ассоциация больших данных, Ассоциация интернета вещей, Ассоциация участников рынка данных, Центр компетенций НТИ по технологиям хранения и анализа больших данных на базе МГУ, Институт развития информационного общества, подкомитет «Данные» ТК 164 «Искусственный интеллект» на базе Российской венчурной компании.

ТК 164 создан в 2019 году как зеркальное отражение на национальном уровне профильного международного подкомитета ISO/IEC JTC 1 SC 42 Artificial Intelligence. Деятельность подкомитета «Данные» поддерживается в рамках проекта «Мониторинг и стандартизация развития и использования технологий хранения и анализа больших данных в цифровой экономике РФ» Центра компетенций НТИ на базе МГУ. Сотрудники Центра участвуют в деятельности международных рабочих групп по стандартизации больших данных и в координации разработки национальных стандартов в этой области.

На текущий момент подкомитет «Данные» разработал пять проектов национальных стандартов по большим данным, один из которых находится на стадии нормоконтроля, два – на стадии формирования окончательной редакции, еще два проходят публичное обсуждение. «Мы хотим ускоренным темпом сократить отставание в стандартизации на национальном уровне от международной стандартизации. Поэтому мы запустили сразу же разработку серии национальных стандартов, в некоторых случаях идентичных, в некоторых – модифицированных по отношению к международным стандартам ISO, чтобы наша индустрия работы с данными могла этим пользоваться», – поделился Юрий Хохлов.

В рамках проекта «Мониторинг и стандартизация развития и использования технологий хранения и анализа больших данных в цифровой экономике РФ» Центр компетенций НТИ на базе МГУ также разработал модель зрелости работы с большими данными в организации (Big Data for Digital Economy Maturity Model, BD4DE-MM). В 2020 году на основе этой модели проведено пилотирование методики (само)оценки уровня зрелости работы с большими данными в организации, а также создан онлайн-инструмент для (само)оценки, который в апреле станет доступен публично. Благодаря этому инструменту, по словам Юрия Хохлова, каждая организация сможет оценить, «действительно ли она обладает всем тем набором условий, которые позволят ей эффективно работать с большими данными».

Концептуальная схема BD4DE-MM включает семь размерностей, по которым были логически сгруппированы аспекты работы с большими данными. Определены также пять уровней зрелости – наборы свойств, которыми обладает организация. «Нам крайне важно сформировать свою отечественную индустрию работы с большими данными, куда входит довольно большое количество игроков – как производителей соответствующих решений и услуг, так и разработчиков технологий», – добавил Юрий Хохлов.

Выступление Ярослава Еферина, консультанта Всемирного банка по цифровой трансформации, было посвящено теме «Этика использования данных: международный опыт регулирования».

«Тема доверия к данным (и, в частности, тема этики использования данных) является одной из центральных тем будущего доклада Всемирного банка о политике работы с данными в России. За последние полтора года в сотрудничестве с представителями госорганов, бизнеса, науки, некоммерческих организаций Всемирный банк провел исследование для определения ключевых стратегических задач по реализации политики в области данных в России. На основе многочисленных консультаций и интервью… был подготовлен доклад, его презентация состоится ориентировочно в апреле/мае этого года», – сообщил Ярослав Еферин.

Одним из российских авторов доклада является Юрий Хохлов.

На заседании МТПП также выступили:

• Алексей Фролов, основатель Biometrics Labs, вице-президент Ассоциации лабораторий по искусственному интеллекту;

• Эдгар Григорян, генеральный директор ATF MEDIA.


26.02.2021