VK усовершенствовала технологии распознавания речи

А еще в Telegram появилась возможность авторизации через менеджеры паролей.

VK усовершенствовала технологии распознавания речи

Команда AI VK значительно улучшила технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Новая версия системы распознает речь на 20% точнее по сравнению с предыдущей, что положительно сказывается на качестве субтитров, расшифровок голосовых сообщений и "кружочков" в продуктах компании.

Технология ASR преобразует голосовые данные в текстовый формат. Она анализирует аудиозаписи, удаляет шумы и распознает слова, опираясь на особенности произношения. Современные алгоритмы машинного обучения и нейронные сети позволяют системе учитывать контекст, смысловые связи и устойчивые выражения, что делает расшифровку более естественной и точной.

Обновленная версия ASR-технологий VK была дообучена на расширенной базе данных аудиозаписей из открытых видеороликов VK Видео. Это позволило модели лучше понимать темп и интонацию речи. По результатам внутренних тестов, новая модель превосходит зарубежные аналоги по качеству распознавания звуковых дорожек на русском языке.

ASR-технологии VK применяются для создания субтитров в VK Видео, VK Клипах и на Учи.ру, а также для обработки голосовых сообщений в мессенджере ВКонтакте. Они также используются для решения внутренних задач, таких как расшифровка записей встреч и их краткое изложение, а также для улучшения мультимодальных моделей в системе рекомендаций Discovery. Новая версия технологии уже доступна в VK Видео и VK Клипах, а также во внутренних сервисах компании, и постепенно будет интегрирована в другие продукты VK. В будущем команда AI VK планирует повысить точность распознавания голосовых сообщений, расширить поддержку языков и внедрить функцию диаризации (разделения речи по спикерам).

В Telegram появилась возможность авторизации через менеджеры паролей

В последних версиях Telegram для iOS и Android добавлена функция входа с использованием ключей доступа.

Для активации этой опции откройте «Настройки» в приложении, затем перейдите в раздел «Конфиденциальность» и выберите «Passkey».

  • Passkey представляет собой ключ доступа, который сохраняется в менеджерах паролей и поддерживается такими сервисами, как Google, Apple, Samsung и другие.

  • Этот ключ хранится на устройстве и обеспечивает вход в аккаунт без необходимости подтверждения через SMS-коды или пароли.

Управление ключами доступа осуществляется через раздел конфиденциальности. Для авторизации потребуется подтвердить личность с помощью сканирования лица (Face ID), отпечатка пальца или ввода код-пароля.

Впервые о тестировании данной функции в бета-версии «Код Дурова» стало известно в начале декабря. Спустя некоторое время эта возможность стала доступна в публичных версиях приложения.

OpenAI удаляет рекламу из ChatGPT после жалоб пользователей

Разработчики OpenAI приступили к устранению рекламы из ChatGPT после негативных отзывов от владельцев платных аккаунтов. Ранее компания утверждала, что в ChatGPT нет рекламы, однако это не соответствует действительности.

Марк Чен, главный исследователь OpenAI, признал, что компания не справилась с задачей контроля за рекламными сообщениями внутри ChatGPT. После жалоб пользователей на рекламу от Peloton и Target, представители OpenAI объяснили, что проводили тестирование способов показа объявлений без финансового вознаграждения.

«Я согласен с тем, что всё, что похоже на рекламу, должно быть воспринято с осторожностью, и мы не смогли этого избежать. Мы решили отключить такие предложения, чтобы улучшить точность работы модели», — отметил Марк Чен.