Российские IT‑компании могут обязать отчитываться о происхождении данных для обучения нейросетей

В России может появиться требование для IT‑компаний раскрывать происхождение данных, на которых обучались нейросети. В рамках подготовки законопроекта о регулировании ИИ обсуждается обязанность раскрывать подробную информацию о датасетах — включая источник, формат и назначение — что должно повысить прозрачность обучения моделей и способствовать проверке соблюдения авторских прав.

Компании могут обязать отчитываться о происхождении данных для обучения ИИ

В России обсуждается инициатива, согласно которой разработчики искусственного интеллекта могут быть обязаны раскрывать сведения о наборах данных, на которых обучались и тестировались их нейросети. Такая норма может появиться в рамках подготовки нового законопроекта о регулировании ИИ.

Предлагается, чтобы компании раскрывали подробный «паспорт» каждого используемого датасета — включая наименование, формат, объём, назначение, источник и дату создания. Эти требования должны повысить прозрачность разработки моделей и помочь проверять соблюдение авторских прав при использовании данных.

Дискуссия о создании реестра таких данных ведётся при участии отраслевых ассоциаций, компаний в области ИИ и профильных регуляторов. Рассматривается как вариант формирования единого реестра отечественных нейросетей, так и отдельной базы данных для датасетов.

Представители ИТ‑компаний, в том числе крупных игроков на рынке, отмечают, что требования отчётности могут увеличить нагрузку на разработчиков и привести к сущеительным затратам на документирование больших массивов информации.

В Министерстве цифрового развития подчёркивают, что действующая рамочная версия законопроекта пока не содержит конкретных параметров таких обязательств, а обсуждаемые нормы находятся на стадии проработки.

Источник: Ведомости

Читайте также по теме:

В Max появился счётчик просмотров постов для всех пользователей 

Суд в Москве оштрафовал Google почти на 23 млн рублей за неудаление запрещённой информации 

Avito запускает обновлённый API для рекламных агентств