Вчені розробили технологію, з якою розумні колонки будуть краще розуміти власників

Вчені з Університету Карнегі-Меллона розробили модель машинного навчання, яка оцінює напрямок, звідки виходить голос, вказуючи на намір людини без необхідності використання спеціальної фрази або жесту.

Система розпізнає, що перший, найгучніший і чистий звук завжди спрямований безпосередньо на заданий об’єкт. Все інше, як правило, тихіше, повільніше і більш приглушено. Модель також знає, що частота людської мови залежить від напрямку, в якому людина дивиться. Більш низькі частоти мають тенденцію бути більш всеспрямованими.

За словами дослідників, цей метод є «легким», програмним і не вимагає відправки аудіо в хмару.

Може пройти деякий час, перш ніж технологія буде використовуватися, хоча команда публічно опублікувала код і дані, щоб допомогти іншим продовжити свою роботу. Подальші розробки допоможуть спростити комунікацію з розумними колонками. Користувач зможе сказати розумній колонці, щоб вона відтворювала музику, не використовуючи спеціальне слово для її активації.

Нагадаємо, інженери з Гарварду і Sony створили хірургічного робота, надихнувшись орігамі