Федеральная антимонопольная служба определила новые критерии для интернет-рекламы
А Илон Маск согласен с тем, что мы исчерпали данные для обучения ИИ.
В 2024 году Telegram предоставил властям США данные о более чем 2200 пользователях
Особенно активно запросы на предоставление информации поступали в последнем квартале 2024 года, когда Павел Дуров был задержан во Франции.
Так, с 1 января по 30 сентября 2024 года Telegram выполнил 14 запросов на предоставление информации от властей США, которая затронула 108 пользователей. А за весь год мессенджер выполнил 900 запросов из США, которые затронули 2253 пользователя.
В сентябре 2024 года Telegram обновил политику конфиденциальности. Теперь мессенджер готов предоставлять персональные данные по запросу суда. Это произошло через месяц после задержания Павла Дурова во Франции.
Помимо США, запросы на предоставление информации стали поступать и от других стран:
Индия — 14 641 запрос; Бразилия — 302 запроса; Испания — 213 запросов; Бельгия — 223 запроса.
При этом Telegram не удовлетворял запросы из России, Беларуси, Украины, Казахстана, Китая, Индонезии, Израиля, Японии, Мексики, Новой Зеландии, Таиланда и Турции.
Федеральная антимонопольная служба определила новые критерии для интернет-рекламы
Эти критерии необходимы для понимания нового закона, который вступит в силу 1 апреля 2025 года.
Ранее ФАС подробно объясняла, какой контент считается рекламой, а какой нет. Теперь же служба приводит новые критерии в контексте принятия закона о сборе за рекламу. Эти критерии касаются объявлений, которые размещаются на поисковых системах, сайтах-агрегаторах и маркетплейсах — эти ресурсы «требуют наиболее частого разграничения рекламы и другой информации».
Согласно уточнению ФАС, под понятие рекламы не подпадают:
- справочные материалы, включая каталоги товаров;
- аналитические материалы;
- объявления физических или юридических лиц, не связанных с предпринимательской деятельностью.
МТС разработала сервис, который способен выявлять дипфейки
Сервис использует передовые технологии, включая нейросети, для обнаружения различных видов дипфейков, включая подмену и генерацию лиц, а также для выявления сгенерированного голоса.
Кроме того, сервис способен находить запрещённый контент, такой как изображения и видео, содержащие алкоголь, наркотики, оружие или экстремистскую символику.
Ожидается, что этот сервис будет активно применяться для модерации контента в социальных сетях и на медиаплатформах, а также для проверки подлинности участников видеоконференций и выявления поддельных обращений от имени компании.
В основе работы сервиса лежит использование нейросетей для распознавания дипфейков.
По данным за 2024 год, количество случаев мошенничества с использованием дипфейков увеличилось более чем на 10%.
Илон Маск согласен с тем, что мы исчерпали данные для обучения ИИ
Илон Маск отметил, что для обучения моделей ИИ осталось не так много реальных данных.
«Мы уже использовали все доступные человеческие знания для обучения ИИ», — сказал Маск в ходе прямой трансляции беседы с председателем совета директоров компании Stagwell Марком Пенном на канале X в конце среды.
Маск, который владеет компанией xAI, занимающейся разработкой ИИ, повторил слова Ильи Суцкевера, бывшего главного научного сотрудника OpenAI. В декабре на конференции по машинному обучению NeurIPS Суцкевер высказал мнение, что индустрия ИИ достигла «пика данных», и нехватка обучающих материалов может привести к изменению нынешнего способа разработки моделей.
Маск высказал мнение, что синтетические данные (данные, которые генерируются самими моделями искусственного интеллекта) являются ключом к дальнейшему развитию. «Единственный способ дополнить [реальные данные] — это синтетические данные, когда ИИ сам создает их», — сказал он. «С синтетическими данными... [ИИ] будет как бы оценивать себя и проходить через процесс самообучения».
Другие компании, например, технологические гиганты, как Microsoft, Meta, OpenAI и Anthropic, уже используют синтетические данные для обучения своих флагманских моделей искусственного интеллекта. По оценкам Gartner, к 2024 году 60% данных, используемых в проектах искусственного интеллекта и аналитики, будут синтетическими.
Модель Phi-4 от Microsoft была обучена на синтетических данных в сочетании с реальными. То же самое касается моделей Gemma от Google. Компания Anthropic использовала синтетические данные для создания одной из своих самых эффективных систем — Claude 3.5 Sonnet. А Meta доработала свою последнюю серию моделей Llama с помощью данных, созданных искусственным интеллектом.
Обучение на синтетических данных имеет и другие преимущества, такие как экономия средств. Стартап в области искусственного интеллекта Writer утверждает, что его модель Palmyra X 004, созданная практически полностью на синтетических источниках, обошлась всего в 700 000 долларов. Для сравнения, оценка сопоставимой по размеру модели OpenAI составляет 4,6 миллиона долларов.