Почему не работает алиса яндекс. Голосовой помощник яндекса Алиса: зачем он нужен и как им пользоваться

  • Машинное обучение ,
  • Поисковые технологии ,
  • Разработка мобильных приложений
  • В будущем, как нам кажется, люди будут взаимодействовать с устройствами с помощью голоса. Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать смысл произвольных фраз и даже поддерживать разговор на любые темы. Сегодня мы расскажем читателям Хабра о том, как мы приближаем это будущее на примере Алисы – первого голосового помощника, который не ограничивается набором заранее заданных ответов и использует для общения нейронные сети.

    Несмотря на кажущуюся простоту, голосовой помощник – один из самых масштабных технологических проектов Яндекса. Из этого поста вы узнаете, с какими сложностями сталкиваются разработчики голосовых интерфейсов, кто на самом деле пишет ответы для виртуальных помощников, и что общего у Алисы с искусственным интеллектом из фильма «Она».

    На заре своего существования компьютеры в основном применялись на крупных научных или оборонных предприятиях. Про голосовое управление тогда размышляли лишь фантасты, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и все нужно начинать сначала.

    С годами компьютеры становятся доступнее и начинают применяться в компаниях поменьше. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ – он применяется в профессиональной среде и по сей день, но требует подготовки. Поэтому когда компьютеры стали появляться в домах обычных пользователей, инженеры принялись искать более простые способы взаимодействия машины и человека.

    В лаборатории компании Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) – массовое применение она нашла в продуктах уже других компаний. Заучивать текстовые команды для управления домашним компьютером больше не требовалось - им на смену пришли жесты и клики мышью. Для своего времени это было настоящей революцией. И теперь мир приближается к следующей.

    Теперь почти у каждого в кармане лежит смартфон, вычислительных мощностей которого достаточно, чтобы посадить корабль на Луну. Мышь и клавиатуру заменили пальцы, но ими мы совершаем все те же жесты и клики. Это удобно делать, сидя на диване, но не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось осваивать язык машин. Мы верим, что сейчас пришло время научить устройства и приложения общаться на языке людей. Именно эта идея легла в основу голосового помощника Алиса.

    У Алисы можно спросить [Где поблизости выпить кофе?], а не диктовать что-то вроде [кофейня улица космонавтов]. Алиса заглянет в Яндекс и предложит подходящее место, а на вопрос [Отлично, а как туда пройти?] - даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные фактовые вопросы от желания увидеть классическую поисковую выдачу, хамство – от вежливой просьбы, команду открыть сайт – от желания просто поболтать.

    Может даже показаться, что где-то в облаке работает нейронная чудо-сеть, которая в одиночку решает любые задачи. Но в реальности за любым ответом Алисы скрывается целая цепочка технологических задач, решать которые мы учимся уже 5 лет. И начнем мы свой экскурс с самого первого звена – со способности слушать.

    Привет, Алиса

    Искусственный интеллект из научной фантастики умеет слушать – людям не приходится нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация – приложение должно понимать, что человек к нему обращается. Сделать это не так легко, как может показаться.

    Если вы просто начнете записывать и обрабатывать на сервере весь входящий звуковой поток, то очень быстро разрядите батарейку устройства и потратите весь мобильный трафик. В нашем случае это решается с помощью специальной нейронной сети, которая обучена исключительно на распознавание ключевых фраз («Привет, Алиса», «Слушай, Яндекс» и некоторых других). Поддержка ограниченного числа таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

    Если сеть обучается понимать лишь несколько фраз, вы могли бы подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы далеко не в идеальных условиях, а в окружении совершенно непредсказуемого шума. Да и голоса у всех разные. Поэтому для понимания лишь одной фразы необходимы тысячи обучающих записей.

    Даже небольшая локальная нейронная сеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому на передовой применяется менее тяжеловесный алгоритм, который дешево и быстро распознает событие «началась речь». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую тяжелую часть – распознавание речи.

    Если для обучения лишь одной фразе необходимы тысячи примеров, то вы можете себе представить, насколько трудоемко обучить нейросеть распознаванию любых слов и фраз. По этой же причине распознавание выполняется в облаке, куда передается звуковой поток, и откуда возвращаются уже готовые ответы. Точность ответов напрямую зависит от качества распознавания. Именно поэтому главный вызов – научиться распознавать речь настолько же качественно, насколько это делает человек. Кстати, люди тоже совершают ошибки. Считается, что человек распознает 96-98% речи (метрика WER). Нам удалось добиться точности в 89-95%, что уже не только сопоставимо с уровнем живого собеседника, но и уникально для русского языка.

    Но даже идеально преобразованная в текст речь ничего не будет значить, если мы не сможем понять смысл сказанного.

    Какая погода завтра в Питере?

    Если вы хотите, чтобы ваше приложение выводило прогноз погоды в ответ на голосовой запрос [погода], то здесь все просто – сравниваете распознанный текст со словом «погода» и если получаете совпадение, выводите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы иначе. Человек может спросить у помощника [Какая погода завтра в Питере?], и тот не должен растеряться.

    Первое, что делает Алиса при получении вопроса, это распознает сценарий. Отправить запрос в поиск и показать классическую выдачу с 10 результатами? Поискать один точный ответ и сразу выдать его пользователю? Совершить действие, например открыть сайт? А, может, просто поговорить? Невероятно сложно научить машину безошибочно распознавать сценарии поведения. И любая ошибка здесь малоприятна. К счастью, у нас есть вся мощь поисковой машины Яндекса, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие – нет. Это огромная база знаний, на основе которых можно обучить еще одну нейронную сеть – такую, которая бы с высокой вероятностью «понимала», чего именно хочет человек. Ошибки, конечно же, неизбежны, но их совершают и люди.

    С помощью машинного обучения Алиса «понимает», что фраза [Какая погода завтра в Питере?] – это запрос погоды (кстати, это заведомо простой пример для наглядности). Но о каком городе идет речь? На какую дату? Здесь начинается этап извлечения из пользовательских реплик именованных объектов (Named Entity Recognition). В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». И Алиса, у которой за плечами стоят поисковые технологии, «понимает», что «Питер» – синоним «Санкт-Петербурга», а «завтра» – «текущая дата + 1».

    Естественный язык – не только внешняя форма наших реплик, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог – он невозможен, если не помнить контекст. Алиса его помнит – это помогает ей разбираться со сложными лингвистическими явлениями: например, справляться с эллипсисом (восстанавливать пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так, если спросить [Где находится Эльбрус?], а потом уточнить [А какая у него высота?], то помощник в обоих случаях найдет верные ответы. А если после запроса [Какая погода сегодня?] спросить [А завтра?], Алиса поймет, что это продолжение диалога про погоду.

    И кое-что еще. Помощник должен не только понимать естественный язык, но и уметь говорить на нем – как человек, а не как робот. Для Алисы мы синтезируем голос, в оригинале принадлежащий актрисе дубляжа Татьяне Шитовой (официальный голос Скарлетт Йоханссон в России). Она озвучивала искусственный интеллект в фильме «Она» , хотя вы могли запомнить ее и по озвучке чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с применением нейронных сетей, а не о нарезке готовых фраз – записать все их многообразие заранее невозможно.

    Выше мы описали особенности естественного общения (непредсказуемая форма реплик, отсутствующие слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы далеко не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение будет отправлять такие запросы в поиск, то вся магия разрушится. Именно поэтому популярные голосовые ассистенты используют базу редакторских ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

    А поболтать?

    Мы научили машину отвечать на наши вопросы, вести диалог в контексте определённых сценариев и решать задачи пользователя. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить рассказывать о себе, поддерживать разговор на свободные темы?

    В индустрии голосовых помощников эта задача решается с помощью редакторских ответов. Специальная команда авторов берет сотни наиболее популярных у пользователей вопросов и пишет по несколько вариантов ответов на каждый. В идеале это нужно делать в едином стиле, чтобы из всех ответов складывалась цельная личность помощника. Для Алисы мы тоже пишем ответы – но у нас есть кое-что еще. Кое-что особенное.

    Помимо топа популярных вопросов существует длинный хвост из низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, с помощью чего мы решаем эту проблему, не так ли? С помощью еще одной нейросетевой модели. Для ответов на неизвестные ей вопросы и реплики Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Знатоков машинного обучения, возможно, заинтересует то, что начинали мы с 3-слойной нейронной сети, а теперь экспериментируем с огромной 120-слойной. Детали прибережем для специализированных постов, а здесь скажем, что уже текущая версия Алисы старается отвечать на произвольные фразы с помощью «нейросетевой болталки» – так мы ее называем внутри.

    Алиса учится на огромном количестве самых разных текстов, в которых люди и персонажи далеко не всегда ведут себя вежливо. Нейросеть может научиться совсем не тому, чему мы хотим ее научить.

    – Закажи мне сэндвич.
    – Обойдетесь.

    Как и любого ребенка, Алису нельзя научить не хамить, ограждая ее от всех проявлений хамства и агрессии – то есть обучая нейросеть на «чистой» базе, где нет грубостей, провокаций и прочих неприятных вещей, часто встречающихся в реальном мире. Если Алиса не будет знать о существовании подобных выражений, она будет отвечать на них бездумно, случайными фразами – для неё они останутся неизвестными словами. Пусть лучше она знает, что это такое – и выработает определённую позицию по этим вопросам. Если ты знаешь, что такое мат, ты можешь либо ругнуться в ответ, либо сказать, что не станешь разговаривать с ругающимся. И мы моделируем поведение Алисы так, чтобы она выбирала второй вариант.

    Бывает так, что сама по себе реплика Алисы вполне нейтральна, но вот в контексте, заданном пользователем, ответ перестаёт быть безобидным. Однажды, еще во время закрытого тестирования, мы попросили пользователя найти какие-то заведения – кафе или что-то подобное. Он сказал: «Найди другое такое же». И в этот момент в Алисе случился баг, и она вместо запуска сценария поиска организации дала довольно дерзкий ответ – что-то вроде «на карте поищи». И не стала ничего искать. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

    Когда Алиса использует «нейросетевую болталку», в ней может проявиться миллион разных личностей, так как нейросеть вобрала в себя немного от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, жизнерадостной или депрессивной. Мы же хотим, чтобы персональный помощник представлял собой целостную личность со вполне определенным набором качеств. Здесь на помощь приходят наши редакторские тексты. Их особенность в том, что они изначально написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно продолжать обучать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на эталон поведения, заложенный в редакторских ответах. И это то, над чем мы уже работаем.

    Алиса стала первым известным нам голосовым помощником, который старается поддерживать общение не только с помощью редакторских ответов, но и используя обученную нейронную сеть. Конечно же, мы еще очень далеки от того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому работы у нас еще много.

    Мы планируем сделать Алису самым человекоподобным помощником в мире. Привить ей эмпатию и любознательность. Сделать её проактивной – научить ставить цели в диалоге, проявлять инициативу и вовлекать собеседника в разговор. Сейчас мы одновременно и в самом начале пути, и на переднем крае наук, изучающих эту область. Чтобы двигаться дальше, придется этот край подвинуть.

    Чтобы начать разговор, запустите приложение и скажите: «Привет, Алиса» (или нажмите на кнопку с микрофоном).

    Когда вы нажимаете 👎, Алиса предлагает сообщить о проблеме разработчикам. Если вы нажали 👎 по ошибке или передумали жаловаться, выберите Да нет, все хорошо .

    Алиса меня не понимает

    Если Алиса неправильно распознаёт ваши слова (на экране появляется не тот текст, который вы произнесли), попробуйте приблизить микрофон и сказать фразу четче. Если Алиса все равно показывает неправильный текст, нажмите 👎 и выберите вариант Моя речь не распозналась . В мобильных приложениях текст можно набрать вручную - для этого нажмите значок клавиатуры на экране Алисы.

    Если же ваша речь распознаётся правильно, но Алиса отвечает невпопад или явно не понимает вопрос, нажмите 👎 и выберите вариант Ответ не соответствует вопросу .

    Алиса неправильно произносит слова

    Чтобы рассказать разработчикам об ошибке в произношении, нажмите 👎 под ответом Алисы и выберите вариант Неверно озвучен текст .

    Алиса грубит

    Алиса пытается ответить на каждый вопрос индивидуально - строгого соответствия между вопросом и ответом нет. Не подходящий по контексту ответ может обидеть или показаться неудачной шуткой. Пожалуйста, сообщите нам об этом: нажмите 👎 под ответом Алисы и выберите нужный вариант (например, Ответ обидный или оскорбительный ).

    Также как Яндекс.Строка, запущенная компанией ещё два года назад, Алиса интегрируется в панель задач рабочего стола Windows, в виде строки или пары кнопок (для вызова поиска и голосового помощника). Обратиться к Алисе можно, используя команды «Привет, Алиса», «Слушай, Алиса», «Окей, Алиса» и других (полный список указан в настройках), главное окно помощника вызывается также при помощи мыши, сенсорного экрана или горячих клавиш (Ctrl+~).


    Из главного окна Голосового помощника можно легко получить доступ списку часто посещаемых сайтов, последних программ, папок и файлов. Там же доступны популярные в эту секунду у пользователей Яндекса поисковые запросы. У Алисы можно поинтересоваться курсом валюты, получить информацию о погоде, уточнить маршрут движения к ближайшей аптеке. Можно просто поболтать с ней о чём-нибудь или попросить включить любимую музыкальную композицию на Яндекс.Музыке. Вряд ли Алиса поможет улучшить нам с вами продуктивность использования компьютера (не сможет напомнить о важной встрече, отследить посылку или выключить будильник), но упростить некоторые рутинные операции она способна.

    В настройках программы можно отключить голосовую активацию и голосовые ответы от Алисы, выбрать браузер по умолчанию, изменить горячие клавиши, очистить историю общения и задать поведение помощника при переходе к найденному файлу. Изменить размеры окна или расположение кнопок на панели задач в текущей версии нельзя.




    Распространяется программа бесплатно, русский язык разумеется поддерживается. Воспользоваться Голосовым помощником можно на планшетах и компьютерах с Windows 7, 8.1 и 10. Важно помнить, что на момент публикации этого материала программе был присвоен бета-статус, работа над ней ещё не завершена. Самая свежая её версия всегда доступна .

    – это уникальный и совершенно новый голосовой помощник по имени Алиса от популярной компании Яндекс. Она умеет выполнять много различных команд и является довольно приятным собеседником, от неё вы даже сможете услышать несколько забавных шуток. Приложение подходит всем моделям Android устройств и уже находится в свободном доступе.

    Мы давно мечтаем создать робота, который бы максимально походил на человека или был намного совершеннее него. А главная задача разработчиков – научить дроида разговаривать и мыслить. И ещё желательно, чтобы этого робота сумел позволить себе каждый из нас. В общем, требований довольно много. Однако с широким распространением мобильных телефонов и планшетов все они без исключения с лёгкостью претворяются в жизнь. И вот у нас уже есть Google Assistant, Siri, и другие голосовые помощники. Да, они очень хорошие и умные, но в них нет одного – толкового русского языка. Поэтому в задаче разработчиков Яндекса стоял вполне конкретный вопрос: научить робота понимать русскоязычные команды. И вот наконец скачать говорящую Алису можно в полном рабочем режиме, со всеми её уникальными интеллектуальными умениями. Мы очень надеемся, что разработчики учли все требования и пожелания пользователей и, в конечном итоге, довольны полученным результатом. Уже сегодня Алиса умеет вытворять много разных чудес:

    Вот как работает Яндекс с Алисой на Андроид:

    Для начала следует установить программу, запустить её и сказать Привет, Алиса
    Вы сможете задавать помощнику любой вопрос, если она не знает на него ответ, то найдёт его в Интернете
    Алиса легко расскажет вам прогноз погоды, найдёт нужный адрес и даже построит маршрут
    Приложение поделится информацией о заведениях – кафе, ресторанах, гостиницах, хостелах, бизнес-центрах
    Помощница отлично разбирается в политике, культуре, искусстве и других областях, она с удовольствием отыщет актуальные новости со всего мира
    Если Алиса в хорошем настроении, она даже споёт вам песню или расскажет анегдот!

    В общем, достоинств у этой виртуальной девушки огромное множество. Она настолько полюбилась русскоязычным пользователям, что в Сети её просто обожают. Программа завоевала сердца миллионов и с каждым днём приобретёт ещё больше новых почитателей. Поэтому уже сейчас предлагаем скачать Яндекс Алиса как отличную альтернативу зарубежным голосовым помощникам, которые не умеют говорить по-русски. Нельзя не отметить большой труд авторов программы, их проект действительно стал очень значимым. Алиса получилась умной и, что немаловажно, не лишённой чувства юмора собеседницей. Поэтому теперь уже довольно сложно представить. что когда-то можно было обходиться без Алисы и её подсказок.

    Что новенького: умная поисковая строка теперь умеет автоматически прятаться, чтобы не занимать лишнее место. А пользоваться помощником стало настолько удобно, что разработчики предложили сделать приложение основным браузером вашего устройства. Кроме того, в свежей версии персональная помощница умеет распознавать и отыскивать предметы на фото. А ещё умная говорящая Алиса вовсю "шазамит" музыку – только спросите её какая песня играет, и она вмиг выдаст вам название и даже имя артиста.

    И ещё немного обновлений! Те, кто уже успел скачать Яндекс с Алисой заценили уникальную страницу под названием Коллекции. Это новый сервис, который собрал огромное количество идей по всему миру. Отыскать здесь для себя что-нибудь новенькое и интересное не составит труда у любого пользователя. Наслаждайтесь обновленным приложением, теперь поддерживаемым и Андроид 9.

    Всем привет! Не так давно разработчики Яндекса выпустили свою версию интернет помощника — Алису, своеобразный аналог Сири, которая давно поселилась у владельцев айфонов. Сегодня поговорим о том, какие есть фишки и какие секреты и игрушки Яндекс Алиса может предложить пользователям. Люди играются с ней по всякому, задают неудобные вопросы, просят рассказать анекдот или найти нужную информацию в Интернете. В общем если вы еще не пробовали — заходим на Плей маркет, скачиваем и устанавливаем, это безумно весело и интересно, особенно в первые часы использования. Для тех, у кого совсем туго с фантазией спросите: «-Алиса, что ты умеешь?»

    Помимо вышеперечисленного Алиса умеет:

    • Дать ответ на вопрос не открывая поиск(Если вопрос ей понятен).
    • Подскажет погоду в вашем городе и поможет теплее одеться.
    • Найдет поблизости нужную аптеку, кафе или магазин, проложить маршрут и узнать какие пробки в городе.
    • С утра напомнит сегодняшнее число и день.
    • Запустить приложение или игру на устройстве.
    • Подсказать курс валют.

    Секреты и скрытые функции Яндекс Алисы

    У Алисы есть несколько скрытых функций, а так же некоторые способности, которые можно активировать. Не многие знают но с ней можно играть в полноценные игры, а первая игра в которую мы с ней сыграем называется «Что было раньше», для начала просто скажите: «Алиса, давай сыграем во что было раньше». Однако в данном режиме игры помощница Яндекса сама будет задавать вам вопросы и предлагать варианты ответов.

    Игра «что было раньше» с Алисой

    Нажмите палец вверх что бы начать игру и сразу получите первый вопрос от девушки робота.

    Если ответ оказался неверным помощница расскажет предысторию и приведет даты появления того или иного продукта. Игровой процесс и занимательный и познавательный, что помогает убить время с пользой. Вопросы самые разнообразные, кресло или тостер, атомный ледокол или акваланг, пульт от телевизора или кассетный магнитофон, антибиотики или крестовая отвертка и другие. Игровой раунд заканчивается после каждых 10ти вопросов с показателями верных ответов, после которых Алиса предложит вам сыграть еще раз. Рассказывать можно бесконечно, лучше попробуйте поиграть сами.

    Игра в города

    По голосовому запросу «Алиса, давай поиграем в города», можно вспомнить детство и освежить свои школьные знания по географии. Вы называете город, помощница использует последнюю букву, буквы «ы» и «мягкий знак» не считаются. Когда запас городов иссякает всегда можно попросить помощи фразой: «Алиса, дай подсказку».

    Еще игры от Алисы

    «Верю не верю» — придется поломать голову перед ответом на заданный вопрос.
    «Давай сыграем в слова» — эту игру так же все помнят: из одного большого слова придется составить как можно больше мелких.
    «Угадай песню» — назовите строчку из песни, которую помощница попробует подхватить.
    «Расскажи про день истории» — вам расскажут интересные и познавательные или просто забавные и веселые правдивые факты из истории.
    «Угадай актёра» -вам предстоит угадать звезду телеакрана после пяти вопросов.
    Для любителей мистики и предсказаний совсем недавно появились игры «Гадание» и «Шар судьбы».
    На официальном сайте в разделе игрушек на 24 и 25 ноября 2017 года анонсированы еще две игры: «Спасите космонавта» и «Дикий новый мир», интересно, что приготовили разработчики на этот раз, названия заманчивые и интересные.

    Заключение

    Надеюсь вы разобрались во что можно поиграть с Алисой от Яндекс, какие игры она знает, кто-то открыл для себя новые функции и фишки.
    Это только вершина айсберга, про все возможности и функции можно подробно почитать и посмотреть . Возможно кому-то из пользователей повезло узнать скрытые функции и секреты голосового помощника, делитесь с нами в комментариях или нашей группе в контакте и мы обязательно дополним нашу статью.