Специальные цены!
 
 

Как «Яндекс» создавал «Алису»

Как «Яндекс» создавал «Алису»

На азиатском — Duer от Baidu и Bixby от Samsung. К 2017 году своих голосовых помощников представили крупнейшие мировые ИТ-компании: на англоязычном рынке работает Siri от Apple, Assistant от Google, Alexa от Amazon, M от Facebook, Cortana от Microsoft.

Ассистент по имени Алиса встроен в поисковое приложение компании. Весной 2017 года тестирование собственного голосового помощника запустил российский «Яндекс». 10 октября 2017 года компания объявила об официальном запуске сервиса — помощник появился в стабильной версии поискового приложения для Android и iOS, а также в бета-версии «Голосового помощника» для Windows. Пользователь может решить свою задачу в форме диалога с ассистентом — вместо ввода запроса в поисковую строку.

Сервис начали разрабатывать потому, что вся индустрия движется в этом направлении: пользователь хочет и готов решать свои задачи в форме диалога с виртуальным помощником, готовы к этому и алгоритмы, — и можно переходить от голосового ввода к осмысленному диалогу. За создание «Алисы» компания принялась в конце 2016 года.

Так что привыкать к новому интерфейсу им не придётся. По словам разработчиков, пользователи «Яндекса» уже умеют обращаться к сервисам компании голосом — команда «Слушай, Яндекс» работает и в «Поиске», и в «Навигаторе», и в других приложениях.

Помимо диалогового интерфейса, помощник обрёл личность — «Алиса» проявляет эмоции, умеет шутить и «не терпит унизительного обращения в свой адрес». С пользовательской точки зрения, говорит команда проекта, с появлением «Алисы» меняется несколько вещей. К ней теперь можно обращаться по имени: «Слушай, Алиса».

Общаться с ассистентом можно как голосом, так и вводя запросы с клавиатуры. «Алиса» встроена в поисковое приложение «Яндекса». При возможности «Алиса» отвечает на заданный вопрос прямо в диалоговом интерфейсу, в других случаях — показывает поисковую выдачу по запросу или нужное приложение.

«Конечно, было бы интересно перенести часть вычислений на смартфон, чтобы «Алиса» иногда могла работать и без интернета, — говорит Илья Субботин. Почти все вычисления, помимо голосовой активации (распознавания фразы «Слушай, Алиса»), проводятся в облаке. — Но вычислительная мощность смартфонов слишком низкая для таких задач».

Распознавание речи, синтез, определение тематики беседы — всё это должно работать ещё лучше. При этом мировое научное и технологическое сообщество находится лишь в начале пути — алгоритмы будут совершенствоваться и дальше.

Но есть и более сложные параметры, объясняет Субботин. Есть общие продуктовые метрики, по которым можно оценивать работу помощника, — удовлетворенность пользователя, частота использования приложения. Например, умение находиться в контексте беседы: помощник должен помнить, о чём его спросил пользователь, уметь верно интерпретировать дополнительные вопросы и давать релевантные ответы.

Длина диалога мало говорит о его содержательности: беседа может затянуться, если пользователю интересно обсудить что-то с ассистентом или если помощник долго не может решить его задачу. Как объективно оценивать способность системы вести диалог, пока не ясно. Но и короткий диалог не всегда говорит об успешном решении проблемы.

Перед командой «Алисы» такой задачи не стоит, потому что «Алиса» — другой продукт. Разработчики голосового помощника Siri от Apple намеренно наращивают количество диалоговых сценариев — чтобы не демонстрировать пользователю поисковую выдачу.

В случае с колонкой упор будет сделан, вероятно, на музыке или новостях — и у нас есть музыкальный и новостной сервисы. «У пользователя в любом случае есть задача, которую он хочет решить — взаимодействуя с голосовой колонкой или, допустим, системой управления автомобилем. Вряд ли он будет спрашивать у машины: «пластиковые окна купить дёшево». В автомобиле водителя интересуют карты.

Если для ответа на вопрос устройству без экрана понадобится показать поисковую выдачу или открыть приложение, помощник сможет запустить нужный сервис на другом — например, на смартфоне. Крупные технологические компании делают ставку на развитие экосистем «умных» устройств — и это расширяет возможности взаимодействия с помощником.

Но, по-честному, мы пока ничего не знаем. «Это лишь вопрос адаптации под устройство, — продолжает Субботин. Один из лидеров отрасли — Amazon, — до сих пор экспериментирует с форматами: у компании есть колонка Echo, мини-версия Echo Dot, варианты с камерой, с экраном».

Проекты, рассчитанные на англоязычную аудиторию, не пытаются создать сильную эмоциональную связь с пользователем, а наоборот, скорее от него отстраняются. Личность «Алисы», считают разработчики, — одно из её главных конкурентных преимуществ.

Для каждого из таких сценариев заложено от двух до семи ответов, которые система выбирает случайным образом. Всего команда описала около 320 сценариев, в которых помощник отвечает редакторскими репликами. «Этого достаточно, чтобы сформировать личность, но недостаточно, чтобы потрепаться обо всём на свете», — говорит Субботин.

Она корректна и держит дистанцию, когда её пытаются оскорбить, но не высокомерна и не кичится своими знаниями. Разработчики решили, что ассистент будет молодой девушкой, которая всегда готова помочь владельцу смартфона, но при этом не допускает панибратского отношения.

«Дело в том, что наш алгоритм речевого синтеза, — да и все алгоритмы конкурентов, — не очень-то хороши в эмоциях. Помощник также должен быть ироничным и — это важно в контексте систем искусственного интеллекта — самоироничным. Потому что она знает про себя, что пока не может хорошо интонировать», — объясняют разработчики. «Алиса» немножечко над собой посмеивается, добавляя слова «шутка» или «сарказм», где это нужно.

К имени предъявлялись также технические требования: например, в нём не должно было быть буквы «р» — её не выговаривают маленькие дети. Команда составила список имён, которые, как показалось сотрудникам, лучше всего подходили к выбранным чертам характера.

В качестве одного из вариантов разработчики рассматривали имя Майя —, но оно могло спровоцировать ошибки распознавания на фразах вроде «Девятое мая». Кроме того, имя не должно было входить в другие слова или фразы. Алиса в такой список не входит, но для тех пользователей, у кого в семье есть Алиса, останется возможность активировать помощника командой «Слушай, Яндекс». Важно было также, чтобы имя не входило в список наиболее популярных женских имён в России — чтобы сократить количество ложных активаций.

В нём компания просила определить черты характера девушки по имени. Определившись с вариантами, разработчики вместе с социологами и аналитиками «Яндекса» составили опрос для пользователей сервиса «Толока». Взяли нужные нам характеристики — и наоборот, совсем неподходящие, и стали спрашивать: если у девушки вот такое имя, то она скорее, например, добрая или агрессивная?». «Пользователей нельзя спросить прямо, какое имя больше подходит ассистенту, и мы спросили хитро.

«И никто за время тестирования ни разу не сказал нам, что это плохое имя». С большим отрывом, говорит Субботин, в опросе победило имя «Алиса».

Отлично, чтобы рассказать о погоде, надо на что-то среагировать — на какие-то пользовательские фразы», — рассказывает Субботин. «Мы понимали, что людей волнует, к примеру, погода. Затем добавили более сложные варианты: прогноз погоды на конкретное число, на несколько дней, на несколько дней в следующем месяце. Определившись с темой, разработчики описали самые простые сценарии: например, когда пользователь просто спрашивает: «Какая сейчас погода?».

Изначально команда «Алисы» собрала несколько реплик, которыми пользователи могли бы активировать сценарий, но выяснилось, что зачастую люди задают вопросы совсем не так, как могли предположить разработчики. Ещё одна популярная тематика — определение местоположения. А пользователь спрашивает: «Подскажи, пожалуйста, где моя геолокация». «Мы включили: «где я», «где я нахожусь», «какое моё местоположение», «какой у меня сейчас адрес». Такое мы не могли предусмотреть».

Порой, говорят создатели, они не могут предугадать ответы «Алисы» — настолько человечными они оказываются, —, а иногда она может и нахамить собеседнику. «Болталка» обучается на больших массивах текстов, в том числе диалогов. Но разработчики отслеживают некорректные реплики и удаляют их из системы.


Дата публикации: 10.10.2017


Ещё новости


  20.10.2017  “Не важно сколько стоит интернет-проект - 10, 30, 50 или 100 млн рублей. Если он продается - скорее всего это воздух”

Более 70% россиян регулярно пользуются Интернетом и достаточно быстро осваивают преимущества всемирной паутины: социальные сети, аккаунты, а теперь вот технология blockchain и методология agile. По да...

  19.10.2017  В iPhone 8 все-таки есть радио

FM-модуля в этих смартфонах никогда не было и аппаратно в смартфоне не предусмотрено воспроизведение FM-станций. В конце сентября Фил Шиллер уже объяснял одному из представителей FCC, что в iPhone 7 ...

  21.10.2017  Apple выпустила четвертую тестовую сборку iOS 11.1 для разработчиков

Установить тестовую сборку смогут участники программы разработчиков Apple. Apple сегодня начала раздавать четвертую бета-версию iOS 11.1 разработчикам, всего через четыре дня спустя выпуска третьей «б...

  23.09.2017  Facebook объявил о перелицензировании React, Jest, Flow и Immutable.js

Вместо ранее применяемой для этих проектов лицензии BSD с дополнительным соглашением об использовании патентов («BSD+Patent») утверждена лицензия MIT. Facebook пришёл к компромиссному решению вопроса...

  20.10.2017  Владельцы Samsung Galaxy S8 и Note8 смогут работать с Linux

Она позволяет подключить к смартфону дисплей, а также мышь и клавиатуру. Для большего удобства необходимо будет использовать док-станцию Samsung DeX, которая была выпущена в начале года вместе с Galax...



Все новости




Корзина
Товаров: 0
Сумма: $0
Курс (нал.) 1$ = 62.00 руб.
Курс (безнал) 1$ = 65.00 руб.

НОВОСТИ

22.10.2017
Опубликованы изображения 3D-карт Asus GeForce GTX 1070 Ti Turbo и ROG Strix GTX 1070 Ti Gaming

21.10.2017
Apple возродит неттоп Mac Mini

21.10.2017
C++ User Group, встреча в Москве

21.10.2017
Huawei тоже работает над гибким смартфоном, который может выйти уже в следующем году

21.10.2017
Адаптер Sonnet Thunderbolt 3 to Dual HDMI 2.0 может выводить картинку 4К с одного ПК на два дисплея

21.10.2017
Apple обвинили в намеренном нарушении прав на торговую марку Animoji

21.10.2017
У Huawei есть складываемый смартфон

21.10.2017
Страх перед змеями и пауками — врождённый: новое исследование

21.10.2017
Apple выпустила четвертую тестовую сборку iOS 11.1 для разработчиков

21.10.2017
Фотографии подтверждают, что смартфон Xiaomi Redmi Note 5 станет первым аппаратом семейства, оснащённым дисплеем 18:9

21.10.2017
Дуэт GeForce GTX 1080 Ti обновил рекорд 3DMark11 Performance на частотах 2455/12420 МГц

21.10.2017
Системные платы Asus ROG Strix X370-I Gaming и Strix B350-I Gaming типоразмера mini-ITX рассчитаны на процессоры AMD Ryzen

21.10.2017
Застежки-молнии нового вида: 5 необычных модификаций

20.10.2017
Смарт-колонка Harman Kardon Invoke с помощником Cortana выходит в продажу

20.10.2017
Доля iOS 11 снизилась впервые с момента выхода финальной версии ОС

20.10.2017
Смарт-колонка Google Home Mini поступила в продажу

20.10.2017
Владельцы Samsung Galaxy S8 и Note8 смогут работать с Linux

20.10.2017
Sharp Aquos R Compact: самый компактный безрамочный смартфон в мире

20.10.2017
“Не важно сколько стоит интернет-проект - 10, 30, 50 или 100 млн рублей. Если он продается - скорее всего это воздух”

20.10.2017
Как устроен искусственный интеллект: всевидящее цифровое око

20.10.2017
Потребительские процессоры Intel Cannon Lake будут поддерживать набор команд AVX-512

20.10.2017
Стоимость биткоина превысила $6000

20.10.2017
Почему знак STOP — красный восьмиугольник?

20.10.2017
Alphabet построит умный район в Торонто

20.10.2017
Как выглядела iOS 6, последняя красивая прошивка iPhone

20.10.2017
Характеристики и стоимость Android One-смартфона HTC U11 Life

19.10.2017
NZXT представила корпуса H-серии и цифровой контроллер вентиляторов GRID+ V3

19.10.2017
В iPhone 8 все-таки есть радио

19.10.2017
На что способен портретный режим Google Pixel 2?

19.10.2017
HTC U11 Plus получит большой дисплей 18:9 и Android Oreo

18.10.2017
Почему мальчики чаще девочек страдают аутизмом: новое исследование

18.10.2017
Синтетические тесты производительности GeForce GTX 1070 Ti

18.10.2017
Microsoft представила мощные ноутбуки-трансформеры Surface Book 2

23.09.2017
Facebook объявил о перелицензировании React, Jest, Flow и Immutable.js

Все новости

ОБЗОРЫ

Все обзоры
 
   
   
Acer Aspire 5100

от $749 
Acer Aspire 3690

от $664 
Acer TravelMate 2400

от $705 
Acer TravelMate 2410

от $715 
Компьютеры Сервер IBM xSeri...

от $2400 
 
      © 2003-2017, Ноутбуки на Буденовском
Тел. (495) (499) 115-03-45
E-Mail: