вакансия виртуальный ассистент амазон что это такое
Голосовой ассистент Amazon Alexa
Используя только собственный голос, вы можете воспроизводить музыку, искать в Интернете, создавать списки дел и покупок, делать покупки в интернете, получать мгновенные отчеты о погоде и контролировать популярные продукты умного дома. Но пока, к сожалению, только на английском языке.
Amazon Alexa — что это такое?
Amazon Alexa, названная в честь древнегреческой Александрийской библиотеки, – это голосовая система управления (виртуальный помощник) от Amazon, который был разработан в Lab 126, чтобы составить конкуренцию другим известным голосовым помощникам таким, как Сири, Гугл и другие.
На каких устройствах работает Алекса Амазон?
Алекса Амазон может быть загружена не только на Amazon Echo, но и на другие гаджеты и даже на некоторые умные часы. Установка виртуального помощника возможна на Amazon Echo Dot, LG SmartThingQ, Tap и другие.
Amazon Echo
Данный девайс – это умная колонка с подключением Алекса Амазон, которая активируется при помощи собственного голоса. Голосовой ассистент находится внутри колонки. Амазон Echo – первый в истории искусственный интеллект, которому разработчики дали отельное «тело».
Отличием такой колонки считается то, что Echo постоянно Вас «слышит». Здесь не нужно, как с Сири включать кнопку и что-то еще, чтобы задать команду для выполнения. С Amazon Echo все гораздо проще: достаточно вслух сказать команду, и она выполнить ее.
Функции Amazon Alexa?
Голосовой ассистент способен на выполнение команд различной сложности.
Она может планировать ваши дела на короткий и продолжительный срок, осуществлять контроль за домашними предметами интерьера (лампы, к примеру). В любой момент, по вашему запросу, Алекса способна включить музыку. если вы фанат какой-либо спортивной команды, то виртуальный помощник всегда может ответить с каким счетом закончилась та или иная спортивная игра.
При необходимости вы можете разработать собственный навык для Алексы или воспользоваться одним из готовых умений из каталога (более 15000 навыков из всех областей жизни).
Как скачать и установить приложение Alexa?
Скачать Алексу Амазон можно в привычном Google Play и App Store. Однако только не в российских версиях, а в американских. Если вы захотите скачать и установить данный виртуальный помощник через игровые магазины, то у вас ничего не выйдет.
Можно скачать приложения через сторонние Интернет-ресурсы, но нет гарантии, что файл будет без вирусов.
У компании Амазон есть свой магазин: Amazon Underground. В нем можно скачать виртуальный ассистент только Андроид.
Как включить и как отключить?
Алекса постоянно вас слышит, поэтому для команды нужно назвать лишь слово «Алекса, (команда)». Слово активации по умолчанию — «Alexa», но вы можете изменить его на «Echo», «Amazon» или другое.
На данный момент уже вышло второе поколение Alexa и Echo, которых от голосовых помощников первого поколения отличает отзывчивость. Нет кнопки активации для ручного включения. Просто произнесите активационную фразу («Alexa», «Echo», «Amazon» или «компьютер»), а затем то, что вы хотите, и это будет сделано (если вы настроили все правильно и используете правильную команду).
Как только вы привыкнете к причудам помощника, использование Alexa станет гораздо более естественным и интуитивно понятным, чем разговор с телефонным голосовым помощником, таким как Siri или Google Assistent. В результате, вы, вероятно, будете пользоваться телефоном реже, когда находитесь дома.
Настройка приложения.
Заходим в «Алекса». Settings → Echo Dot.
Подключаем звуковое подтверждение для того, чтобы колонка вас всегда слышала и находилась в ожидании получения различных команд.
Находим раздел General и нажимаем Edit. Здесь просят ввести адрес места жительства. Вводим его и затем сохраняем.
Потом температуру переводим на привычные нам градус Цельсия, а длину – на метры.
Выход Amazon Alexa на русском языке
Разработчики не внесли в голосовой ассистент русского языка и дата выхода неизвестна, и, честно говоря, маловероятна, так как Amazon не представлен на рынке России и других стран СНГ.
Напомним, что Алекса работает на трех зыках: английский, немецкий и японский.
Исследовательский практикум. Голосовые виртуальные ассистенты – что с ними не так?
Введение
Аналитики, исследующие сервисы чат-ботов и виртуальных ассистентов, обещают рост рынка как минимум 30% в год. В абсолютных цифрах, по состоянию на 2019 год, рынок оценивался более чем в 2 миллиарда долларов в год. Виртуальных голосовых помощников выпустили практически все ведущие мировые IT-компании, а основную работу по их популяризации уже провели Apple, Google и Amazon.
На российском рынке тоже наметились свои лидеры в этой области. Первым крупным игроком, запустивших собственного голосового ассистента в России, стал «Яндекс». По данным компании, публикуемым официально, Алисой пользуется 45 миллионов пользователей в месяц, а число ежемесячных запросов к ассистенту – составляет более 1 млрд. По мнению специалистов, 2020 год может стать для рынка голосовых ассистентов переломным – конкуренция платформ и брендов приведет к росту узнаваемости ассистентов.
В общем, то, что рынок голосовых ассистентов – интересная ниша, сомневаться не приходится. И первая идея, которая приходит в голову – взять любой из доступных сервисов ASR (Automatic Speech Recognition) и TTS (Text To Speech), связать их с конструктором ботов, имеющим поддержку NLU (Natural Language Understanding), и все! Тем более что все это довольно легко и быстро можно реализовать в облачных платформах, таких как Twilio и VoxImplant.
Проблема только в том, что полученный результат будет весьма посредственным. В чем же причина этого? Прежде всего попробуем понять почему совокупность довольно-таки неплохих технологий, собранных вместе дают такой посредственный результат. Это важно, т.к. в реальной жизни клиент всегда будет отдавать предпочтение тому сервису, чей голосовой сервис удобнее, интереснее, умнее и быстрее прочих.
Как работает типичный голосовой ассистент
Прежде всего отметим, что наша речь представляет из себя последовательность звуков. Звук в свою очередь — это наложение звуковых колебаний (волн) различных частот. Волна же, как нам известно из физики, характеризуются двумя атрибутами — амплитудой и частотой.
Речевой сигнал
Алгоритм работы ассистента:
После этого начинается процесс распознавания, и первой задачей, которую приходится решать, является разбиение всего аудио-фрагмента на отдельные слова. Речь содержит в себе некоторые паузы (промежутки тишины), которые можно считать «разделителями» слов. В итоге получается, что нам необходимо найти некоторое значение, порог — значения выше которого являются словом, ниже — тишиной. Вариантов тут может быть несколько, но это уже детали реализации, которые нам сейчас не особо интересны. Важно только понимать, что это не константа, а динамически вычисляемая величина, например, на основе анализа энтропии.
Далее происходит выделение фонем, работа с фонетическом алфавитом и в общем много чего еще, включая работу с вариантами произношения, морфологией и семантикой, причем исходя из контекста и статистики. Итогом становится то, что сервис ASR переводит набор фонем в слово.
Выделение набора слов в предложения и целые смысловые фразы, происходит аналогично делению речи на слова – по интервалам между словами. Только в этом случае величина интервала принимается большей, чем в случае деления на слова.
Возникающие проблемы
Несмотря на кажущуюся очевидную правильность реализуемого подхода, в случае голосового ассистента он несет массу проблем. Вот основные из них:
Я не просто так на первые три места поставил одну и туже проблему. Считается, что для комфортного общения ответ должен быть озвучен, примерно через 500 миллисекунд после того, как собеседник закончил формулировать свое сообщение.
Исходя из реальной практики по реализации голосовых ассистентов, в случае задержки более чем в 1 сек. голосовой ассистент довольно часто будет слышать от собеседника-человека характерные для «проверки связи» фразы: «Алло!» или «Меня слышно?». Это особенно свойственно для случаев, когда разработчики пытаются скрыть тот факт, что с человеком общается робот, особенно при исходящих телефонных обзвонах, используя вместо синтеза речи набор заранее предзаписанных аудио-файлов, сделанных реальным человеком.
Основная сложность здесь состоит в том, что в указанный интервал времени должно уместиться выполнение следующих действий:
— В каком отделении Банка вам будет удобно забрать готовую кредитную карту?
— На Ленинском проспекте. А кстати, когда оно работает? Там далеко от остановки?
— А-а-а-а… ну-у-у-у…
— Ну, как бы вам сказать, типа того как… э-э-э…
— Сейчас, одну минутку, да-а-а… Надо подумать, сразу так и не скажешь…
Что же делать?
Во-первых, при реализация голосового ассистента следует обязательно обеспечить «слушание» собеседника в т.ч. в те моменты, когда виртуальный ассистент сам озвучивает исходящее сообщение. Вариант: либо слушаем, либо отвечаем, является крайне плохой реализацией, которую следует избегать в реальной работе.
Во-вторых, следует провести оптимизацию по скорости работы всех компонентов системы. Однако, в какой-то момент времени мы обязательно упремся в пределы возможного сокращения задержек и усложнения сценариев обработки естественного языка. Поэтому, к нам приходит понимание, что требуется принципиально изменить подход к реализации голосового сервиса.
Основная идея, которая лежит в основе нового подхода, – брать пример с процесса реализуемого человеческим мозгом. Вы замечали, что человек, в процессе разговора, начинает анализировать сообщение, которое проговаривает собеседник, не в тот момент, как оно было полностью закончено, а практически сразу, в момент самого начала его звучания, уточняя с каждым новым словом? По этой причине мы, часто, готовы выдать ответ еще до того, как собеседник закончил свое сообщение.
Если вернуться к алгоритму, который должен реализовывать голосовой виртуальный ассистент, то он может выглядеть следующим образом (для иллюстрации рассмотрим входящий вопрос: «Где находится ближайший банкомат?»):
a) Запрос: «где». Результат: намерение не определено
b) Запрос: «где находится». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%
c) Запрос: «где находится ближайший». Результат: интент «Расположение отделения» с вероятностью 50%, «Расположение банкомата» с вероятностью 50%, сущность «Точка привязки» = «Текущее местоположение»
d) Запрос: «где находится ближайший банкомат». Результат: интент «Расположение банкомата» с вероятностью 100%, сущность «Точка привязки» = «Текущее местоположение»
Способы повысить качество работы ассистента
Давайте рассмотрим какие есть методы, что бы еще больше повысить качество работы нашего голосового виртуального ассистента:
Под этим усовершенствованием понимается возможность определять для некоторых интентов включение «перебивание» собеседника, когда содержимое выходного буфера начинает озвучиваться до того, как пользователь закончил свой рассказ. Данная настройка хорошо работает с предыдущей опцией, когда «перебивающий» ответ получает максимальный приоритет для озвучания из выходного буфера.
Очень желательно выявлять в выходном буфере ответы, которые противоречат друг-другу. В этом случае следует ответ с меньшим приоритетом просто удалять из выходного буфера.
В обычном разговоре двух и более людей, собеседники, как правило довольно точно могут определить эмоциональное состояние друг друга. Причем делается это не только по содержанию используемой лексики, например, факту наличия или отсутствия в речи ругательств, но и по тембру и скорости речи. Будет просто отлично, если ассистент сможет особым образом обслужить рассерженного пользователя.
Современные системы речевой аналитики достаточно хорошо справляются с задачей определения гендерной принадлежности и эмоционального состояния человека. Осталось только приспособить их к анализу разговора в режиме online.
Особенность реализации бизнес-кейсов
До сих пор мы рассматривали лишь технические особенности реализации виртуальных голосовых ассистентов. Но надо понимать, что не всегда успех зависит только от совершенства технической реализации. Давайте проанализируем уже рассмотренный пример: «Где находится ближайший банкомат?» и поймем, в чем есть особенность для его реализации в голосовом интерфейсе.
Знаете, есть такое правило, справедливое для менеджеров по продажам – «То, что нельзя продать по телефону, не следует продавать по телефону». По этой самой причине ответ вида «Ближайший банкомат находится по адресу …» является не информативным для человека. Если бы он хорошо знал район где сейчас находится, т.е. знал бы названия всех близлежащих улиц и номера домов, то скорее всего он и так бы знал где здесь находится ближайший банкомат. Так что такой ответ скорее всего сразу вызовет формирование другого вопроса: «А где тогда находится названный только что адрес?». Гораздо более информативным ответом будет вариант: «Ближайший банкомат находится примерно в ста метрах от вас по направлению на юго-восток», а еще лучше так же дополнительно отправить человеку сообщение типа location на Yandex или Google карты.
Универсальное правило здесь такое – если для дальнейшего использования информации требуется ее перевод в другой канал восприятия, то этот вариант является неудачным выбором для прямой реализацию в рамках голосового интерфейса. Требуется переформулировать ответ в форму, удобную для восприятия «на слух».
Для ряда сервисов, их реализация в рамках именно голосового ассистента – вообще самое удачное решение. Например, если человек находится в стрессовой ситуации, то ему как правило бывает сложно сконцентрироваться и быстро описать проблему текстом в чате, и он всегда предпочтет все высказать голосом. Это может стать важным критерием при выборе бизнес-кейсов для реализации в рамках виртуального голосового ассистента.
Второй очевидный выбор кейсов на реализацию «голосом» – необходимость их использования в ситуациях, когда есть либо законодательные ограничения на этот счет (например, находясь за рулем автомобиля запрещено вести текстовую переписку), либо просто неудобно использовать другие каналы коммуникации (например, в процессе работы или занятий спортом, когда руки человека попросту заняты).
Совершенству нет предела
Голос удобнее, чем любой другой интерфейс тогда, когда пользователю нужна очень конкретная функция для решения вполне конкретной задачи. Почему так? Очень просто – в такой ситуации необходимость ожидания загрузки сайта, скроллинг по странице, поиск по меню приложения, нажатие кнопок и т.д. всегда неудобнее, чем быстро произнесенная голосовая команда. Сайты и приложения многофункциональны. И в этом их достоинство и недостаток одновременно. Голосовой же навык должен быть заточен под функцию «здесь и сейчас».
Важно помнить, что следует избегать ситуаций, когда голосовые команды требуется сопровождать еще какими-либо дополнительными действиями в других интерфейсах. В противном случае это делает голосовой канал нерабочим т.к. нарушается принцип eyes-free, так как надо читать, и hands-free, если надо еще что-то зажимать.
Еще одна важная рекомендация – не стоит пытаться учить человека говорить. Он это и без нас умеет отлично, т.к. язык – это и так привычный и понятный интерфейс. Наглядный пример плохого стиля: «Чтобы прослушать данное сообщение еще раз, скажите: Прослушать заново». Мы ведь с вами в обычной жизни так не говорим. Разве нет? Лучше просто спросить: «Послушать сообщение ещё раз или перейти к следующему?»
Хорошим стилем реализации голосового виртуального ассистента будет вообще избегать открытых вопросов. Желательно направлять собеседника к конкретным действиям. Особенная ценность появляется там, где ассистент выступает в качестве навигатора или рекомендательной системы. Голосовой ассистент не должен требовать от человека слишком подробной информации. Уточняйте ее по ходу течения разговора.
И на конец, хотелось бы отметить, что персонализация – это, пожалуй, главное, чего не хватает существующим голосовым диалоговым интерфейсам. Без этого невозможно вести более-менее продолжительный диалог. Ассистент должен собирать данные о собеседнике, структурировать и проверять полученную информацию. Важно не терять нить диалога, сохранять и учитывать контекст разговора. Это важно. Иначе ассистент способен будет реализовать только короткие и довольно простые запросы, и, как итог, – это не позволит выйти на по настоящему живой диалог при общении голосового ассистента с пользователем.
Работа в Amazon WorkSpaces: опыт развертывания и настройки
Анатомия современной «удаленки»
Работа удаленно сегодня может ничем не отличаться по эффективности от работы в офисе, но при одном базовом условии. Рабочее пространство, среда, в которой оперирует сотрудник, должна обладать всеми привычными инструментами, используемыми сотрудниками для решения повседневных задач.
Сегодня это в подавляющем большинстве случаев – ИТ-сервисы, приложения, корпоративные системы и базы данных, доступ к которым обеспечивается удаленно по сети Интернет, FTP и другим протоколам. По большому счету весь переход на удаленный режим упирается в способность компании предоставить сотруднику доступ к его привычному рабочему столу в любой точке мира.
При этом, помимо грамотно составленного набора ИТ-инструментов и онлайн-решений, чрезвычайно важны скорость и качество связи, а также защищенность всех операций.
Все существующие сегодня решения по организации удаленной работы делятся на три базовых типа по своей функциональности:
Что такое Amazon WorkSpaces
С учетом всех факторов, а также опыта тестирования различных инструментов из всех трех категорий, мы остановили свой выбор при развертывании ИТ-среды для удаленной офисной работы на решении Amazon WorkSpaces.
Amazon WorkSpaces – это удаленный рабочий стол в облаке Amazon, реализуемый по модели Desktop-as-a-Service – DaaS.
Сервис предоставляет доступ по требованию к рабочим столам в облаке и избавляет от необходимости покупать резервные компьютеры. Объемы вычислительных ресурсов, оперативной памяти и дискового пространства таких рабочих столов настраиваются в зависимости от задач компании и потребностей конкретных пользователей.
Amazon WorkSpaces можно использовать для развертывания рабочих столов на базе Windows или Linux. Сервис позволяет быстро масштабировать ресурсы и создавать буквально тысячи рабочих столов для сотрудников по всему миру.
Биллинг осуществляется за фактически использованные ресурсы, что позволяет оптимизировать расходы по сравнению с традиционными рабочими столами и локальными решениями с использованием инфраструктуры виртуальных рабочих столов (VDI). Конечно, для эффективного управления расходами важно уже на старте работы понимать, какие параметры виртуальных машин необходимы для ваших задач, чтобы не переплачивать за избыточные ресурсы.
Владеть и управлять аппаратным обеспечением, обновлять версии ОС и применять исправления, а также администрировать инфраструктуру виртуальных рабочих столов (VDI) – не нужно.
Как устроен сервис: нюансы и тонкости
Для управления информацией о пользователях, подключающихся к удаленным рабочим столам, WorkSpaces использует инструмент AWS Directory Service, который является службой AWS Managed Microsoft AD.
То есть, Amazon WorkSpaces не может работать без сервиса AWS Directory Service, и, следовательно, требуется оплата их обоих. Однако стоит отметить, что и Amazon WorkSpaces, и AWS Directory Service имеют бесплатные пакеты на срок до 1500 часов. Соответственно, есть возможность протестировать решение.
Кроме стандартных рабочих станций сервис Amazon WorkSpaces доступен с vGPU.
Этот пакет предлагает высокопроизводительный виртуальный рабочий стол. Он отлично подходит для разработчиков 3D-приложений и моделей, инженеров, использующих инструменты CAD, CAM или CAE.
Данный пакет доступен во всех регионах, где в настоящее время предлагается WorkSpaces, и может использоваться с любым устройством. Такое решение может стать альтернативой мощным офисным рабочим станциям в дизайн-студиях, которые в период изоляции оказалось невозможно доставить домой к сотрудникам, из-за чего компаниям пришлось либо организовывать закупку дорогостоящих ноутбуков, либо предлагать сотрудникам работу на личных устройствах.
Также, рабочие столы Amazon WorkSpaces с графическими процессорами можно использовать для анализа и визуализации данных. Так как мощности графического пакета находятся рядом с основными сервисами, такими как EC2, RDS, Amazon Redshift, S3 и Kinesis, можно проанализировать данные на сервере и затем визуально оформить результаты в смежном рабочем пространстве.
Эту комбинацию сервисов AWS можно использовать для создания приложений, разработка которых не была бы экономически эффективна при работе на обычных виртуальных машинах без использования графического процессора.
Как проходило тестирование
Мы протестировали сервис, проверив доступность удаленного рабочего стола из Интернета и с тестовой виртуальной машины в нашем облаке в Санкт-Петербурге.
1. Установили связность между нашей инфраструктурой в ЦОДе и нашим VPC (virtual private cloud) в AWS. Здесь все стандартно — настройка BGP, DCC, Virtual Gateway.
2. Определились с AD (Active Directory).
Согласно документации Amazon, можно использовать AD как управляемый Amazon, так и управляемый локально.
3. Для теста мы выбрали схему с AD, управляемым Amazon.
При такой схеме нужно иметь в виду, что на VPC должно быть, как минимум, две подсети из разных зон доступности. Это требование AWS, оно исходит из необходимости физически изолировать серверы AD друг от друга. Необходимо не меньше двух серверов.
Например, в регионе eu-central-1 (Frankfurt) есть три зоны доступности (Availability Zone) — eu-central-1a, eu-central-1b, eu-central-1c.
4. Для теста делаем один префикс в eu-central-1a, один префикс в eu-central-1b.
При создании подсети указываем AZ:
5. Две созданных нами подсети:
6. Создаем Active Directory и WorkSpace.
7. После настройки на указанную почту приходит письмо, в котором есть ссылка для смены пароля на рабочем столе и для скачивания Amazon WorkSpaces для разных платформ – Windows, Linux, MacOS и т. д.
8. Рабочий стол готов.
Прямое подключение к AWS
Для большинства компаний, имеющих собственные AD, будет интересна схема подключения с собственным AD. Для этого дополнительно необходимо настроить прямое выделенное соединение с AWS, через которое клиент может связать свой AD и ресурсы компании, расположенные локально, с облаком Amazon.
Схематично это выглядит так:
Нужно учитывать, что для стабильной работы сервиса задержка между хостом, с которого происходит подключение к рабочему столу, и локацией AWS, где расположен WorkSpaces, не должна превышать 100мс согласно рекомендации Amazon.
В нашем случае мы предлагаем клиентам соединение через Франкфурт — RTT (round-trip time) от Linxdatacenter в Москве и в Санкт-Петербурге до FR5 (точки присутствия на базе ЦОД Equinix во Франкфурте) составляет менее 40мс, что полностью удовлетворяет рекомендациям AWS.
Установка Amazon WorkSpaces на рабочую станцию
1. Устанавливаем приложение на рабочую станцию, с которой планируем подключаться.
2. Вводим Registration Code, который является идентификатором рабочего стола, и логин/пароль, указанные при создании WorkSpace.
3. Рабочий стол доступен на ноутбуке сотрудника.
Скриншот с окном приложения Amazon WorkSpaces, подключенного к удаленному рабочему столу.
4. Теперь свяжем его с системами в компании. В нашем случае – на примере подключения к ВМ в облаке Linxdatacenter в Санкт-Петербурге.
5. В обратную сторону (ВМ в облаке в Санкт-Петербурге –> удаленный рабочий стол) связность также работает.
Развертывание и настройка пакета с vGPU не отличается от стандартной настройки. В момент, когда система предлагает выбрать вам пакет для развертывания, нужно найти нужный нам с графикой и выбрать его для установки.
Параметры минимального пакета с vGPU:
Развернули: что дальше?
Рабочие столы на Amazon WorkSpaces дают возможность мобильным и работающих удаленно сотрудникам использовать любые нужные для работы приложения через облачный рабочий стол, доступный из любой точки с подключением к сети Интернет.
Работает модель использование собственного устройства (BYOD): сервис поддерживает все стационарные ПК, ноутбуки Mac, iPad, Kindle Fire, планшеты на базе Android, Chromebook, а также браузеры Firefox и Chrome.
Если в компании возникают задачи тестирования софтверных новинок собственной разработки, рабочие столы Amazon WorkSpaces также решают эту задачу без повышения стоимости и необходимости хранить резервное оборудование. Самое главное: исходный код не будет храниться на устройствах разработчиков, а это дополнительная защита.
Еще один актуальный сценарий применения Amazon WorkSpaces – оперативное слияние нескольких ИТ-отделов для совместной работы по проекту, когда требуется оперативно синхронизировать работу большого числа специалистов.
Это все на сегодня — задавайте вопросы в комментариях.