Компании могут обязать отчитываться о происхождении данных для обучения ИИ
В России обсуждается инициатива, согласно которой разработчики искусственного интеллекта могут быть обязаны раскрывать сведения о наборах данных, на которых обучались и тестировались их нейросети. Такая норма может появиться в рамках подготовки нового законопроекта о регулировании ИИ.
Предлагается, чтобы компании раскрывали подробный «паспорт» каждого используемого датасета — включая наименование, формат, объём, назначение, источник и дату создания. Эти требования должны повысить прозрачность разработки моделей и помочь проверять соблюдение авторских прав при использовании данных.
Дискуссия о создании реестра таких данных ведётся при участии отраслевых ассоциаций, компаний в области ИИ и профильных регуляторов. Рассматривается как вариант формирования единого реестра отечественных нейросетей, так и отдельной базы данных для датасетов.
Представители ИТ‑компаний, в том числе крупных игроков на рынке, отмечают, что требования отчётности могут увеличить нагрузку на разработчиков и привести к сущеительным затратам на документирование больших массивов информации.
В Министерстве цифрового развития подчёркивают, что действующая рамочная версия законопроекта пока не содержит конкретных параметров таких обязательств, а обсуждаемые нормы находятся на стадии проработки.
Источник: Ведомости
Читайте также по теме:
В Max появился счётчик просмотров постов для всех пользователей
Суд в Москве оштрафовал Google почти на 23 млн рублей за неудаление запрещённой информации