Яндекс работает над SpeechGPT

Это новая мультимодальная модель.

Яндекс пока не анонсировал нейросеть официально.

Она будет способна работать не только с текстом, но и со звуком, в том числе и с речью — без задержек. При этом преобразовывать один вид данных в другой не потребуется. СМИ отмечают: в компанию ищут инженера машинного обучения.

Мультимодальные модели с поддержкой аудио способны:

  • распознавать речь на нескольких языках;
  • разделять реплики дикторов;
  • снизить порог входа в речевые технологии;
  • определять эмоции и сложные приёмы (сарказм и иронию).

Ранее появилась нейросеть YaGPT 3 Lite.

Теги: