Популярні Пости

Вибір Редакції - 2019

Отримання телевізора, щоб краще зрозуміти вас

Anonim

Нове дослідження в Університеті Ватерлоо знайшло спосіб поліпшити можливості розуміння голосових запитів на домашніх розважальних платформах.

реклама


Дослідження, у співпраці з Університетом Меріленду та Comcast Applied AI Research Lab, використовує технологію штучного інтелекту (AI) для досягнення найбільш природних взаємодій на основі мовлення з телевізорами на сьогодні.

"Сьогодні ми вже звикли говорити з розумними агентами, які здійснюють наші торги - від Siri на мобільний телефон до Alexa вдома, чому ми не повинні робити те ж саме з телевізорами?" запитав Джиммі Лін, професор Університету Ватерлоо та голова Девіда Р. Черітона в Школи комп'ютерних наук Девіда Р. Черітона.

"Xfinity X1 Comcast має намір зробити саме це - платформа постачається з" голосовим віддаленим ", який приймає розмовні запити. Ваше бажання - це команда - повідомте вашому телевізорі про зміну каналів, запитайте про фільми про вільні діти та навіть про прогноз погоди."

У вирішенні складної проблеми розуміння голосових запитів дослідники мали ідею скористатися найновішою технологією AI - технікою, відома як ієрархічна періодична нейронна мережа - для кращого моделювання контексту та підвищення точності системи.

У січні 2018 року нова модель нейронних мереж дослідників була розгортана у виробництві для відповіді на запити від реальних користувачів. На відміну від попередньої системи, яку було заплутано близько восьми відсотків запитів, нова модель обробляє більшість дуже складних запитів належним чином, значно підвищуючи рівень роботи користувачів.

"Якщо глядач запитує" Чикагський пожежа ", який стосується як драматичної серії, так і футбольної команди, система може розшифрувати те, що ви дійсно хочете", сказав Лін. "Особливий аспект цього підходу полягає в тому, що ми користуємося контекстом, таким як попередньо переглянуті покази та улюблені канали, для персоналізації результатів, що підвищує точність".

Дослідники почали роботу над розробкою ще більш багатшої моделі. Інтуїція полягає в тому, що, аналізуючи запити з різних точок зору, система може краще зрозуміти, що говорить глядач.

Папір «Багатофункціональний навчальний процес з нейронними мережами для голосового запиту» «Розвиток розважальної платформи» був представлений на 24-й Міжнародній конференції ACM SIGKDD, присвяченій пошуку та вивченню знань, яка відбулася нещодавно в Об'єднаному Королівстві. Дослідження проводили Джинфенг Рао, випускник доктора філософії з Університету Меріленда, його радник Лін, та наставник Ферхан Туре, дослідник Comcast Applied AI Research Lab.

реклама



Джерело історії:

Матеріали надаються Університетом Ватерлоо . Примітка. Зміст можна редагувати за стилем та довжиною.