VK усовершенствовала технологии распознавания речи
Команда AI VK значительно улучшила технологию автоматического распознавания речи (ASR), основанную на моделях машинного обучения. Новая версия системы распознает речь на 20% точнее по сравнению с предыдущей, что положительно сказывается на качестве субтитров, расшифровок голосовых сообщений и "кружочков" в продуктах компании.
Технология ASR преобразует голосовые данные в текстовый формат. Она анализирует аудиозаписи, удаляет шумы и распознает слова, опираясь на особенности произношения. Современные алгоритмы машинного обучения и нейронные сети позволяют системе учитывать контекст, смысловые связи и устойчивые выражения, что делает расшифровку более естественной и точной.
Обновленная версия ASR-технологий VK была дообучена на расширенной базе данных аудиозаписей из открытых видеороликов VK Видео. Это позволило модели лучше понимать темп и интонацию речи. По результатам внутренних тестов, новая модель превосходит зарубежные аналоги по качеству распознавания звуковых дорожек на русском языке.
ASR-технологии VK применяются для создания субтитров в VK Видео, VK Клипах и на Учи.ру, а также для обработки голосовых сообщений в мессенджере ВКонтакте. Они также используются для решения внутренних задач, таких как расшифровка записей встреч и их краткое изложение, а также для улучшения мультимодальных моделей в системе рекомендаций Discovery. Новая версия технологии уже доступна в VK Видео и VK Клипах, а также во внутренних сервисах компании, и постепенно будет интегрирована в другие продукты VK. В будущем команда AI VK планирует повысить точность распознавания голосовых сообщений, расширить поддержку языков и внедрить функцию диаризации (разделения речи по спикерам).
В Telegram появилась возможность авторизации через менеджеры паролей
В последних версиях Telegram для iOS и Android добавлена функция входа с использованием ключей доступа.
Для активации этой опции откройте «Настройки» в приложении, затем перейдите в раздел «Конфиденциальность» и выберите «Passkey».
-
Passkey представляет собой ключ доступа, который сохраняется в менеджерах паролей и поддерживается такими сервисами, как Google, Apple, Samsung и другие.
-
Этот ключ хранится на устройстве и обеспечивает вход в аккаунт без необходимости подтверждения через SMS-коды или пароли.
Управление ключами доступа осуществляется через раздел конфиденциальности. Для авторизации потребуется подтвердить личность с помощью сканирования лица (Face ID), отпечатка пальца или ввода код-пароля.
Впервые о тестировании данной функции в бета-версии «Код Дурова» стало известно в начале декабря. Спустя некоторое время эта возможность стала доступна в публичных версиях приложения.
OpenAI удаляет рекламу из ChatGPT после жалоб пользователей
Разработчики OpenAI приступили к устранению рекламы из ChatGPT после негативных отзывов от владельцев платных аккаунтов. Ранее компания утверждала, что в ChatGPT нет рекламы, однако это не соответствует действительности.
Марк Чен, главный исследователь OpenAI, признал, что компания не справилась с задачей контроля за рекламными сообщениями внутри ChatGPT. После жалоб пользователей на рекламу от Peloton и Target, представители OpenAI объяснили, что проводили тестирование способов показа объявлений без финансового вознаграждения.
«Я согласен с тем, что всё, что похоже на рекламу, должно быть воспринято с осторожностью, и мы не смогли этого избежать. Мы решили отключить такие предложения, чтобы улучшить точность работы модели», — отметил Марк Чен.