В России планируется центр по обезличиванию персональных данных для обучения моделей искусственного интеллекта



Министерство цифрового развития России начало создание специальной инфраструктуры внутри своей информационной системы, которая будет обезличивать персональные данные для различных целей, в том числе для обучения моделей искусственного интеллекта.

Построение центра обезличивания планируется завершить в 2024 году. Для этого создается макет программно-аппаратного комплекса, на котором будут проводиться соответствующие исследования по обезличиванию персональных данных. Центр обезличивания будет создаваться параллельно.

Макет будет разрабатываться на базе Национального технологического центра цифровой криптографии. Вопрос обезличивания достаточно сложный не только с технической точки зрения, но и с нормативной. Законопроект по нормативному регулированию процесса обезличивания внесен в Госдуму на рассмотрение.

В процессе работы с обезличенными данными должны решаться две главные ключевые задачи:

  • обеспечение невозможности восстановления исходной личной информации конкретного гражданина по обезличенным данным;
  • сохранение данных в максимально качественном виде для возможности их дальнейшего использования, в данном случае для обучения технологиям искусственного интеллекта.

Работа по обезличиванию персональных данных для обучения моделей искусственного интеллекта будет происходить примерно по следующей схеме:

1.   Министерство цифрового развития РФ будет обезличивать полученные персональные данные.

2.   Из них будут создаваться датасеты (от англ. dataset) – обработанный и структурированный массив данных для определенных задач.

3.   Эти данные будут направляться в центр обезличивания.

4.   Далее разработчики технологий искусственного интеллекта смогут обучать свои модели на специализированных и заранее подготовленных для них наборах данных.

5.   Не покидая при этом периметр системы министерства.

Без правильной обработки и защиты персональных данных, их использование может привести к серьезным последствиям и нарушить доверие к компаниям и государственным учреждениям. Поэтому вопросы обезличивания персональных данных должны учитываться во всех сферах, где они используются, особенно при использовании искусственного интеллекта.

Поделиться:
data-counter>