[3] Итак, звалась она Siri

19

[1] Итак, звалась она Siri
[2] Итак, звалась она Siri

Виртуальные помощники давно являлись объектом мечтаний большого количества представителей Кремниевой долины. Однако подавляющее большинство попыток создать более человечную, полезную и умную версию HAL уже давно покоятся на свалке истории.

[3] Итак, звалась она Siri


Почти двадцать лет назад, в 1994 году, компания Wildfire Communications представила нового телефонного ассистента, получившего название «Wildfire». Он мог обрабатывать сообщения, осуществлять звонки и в ответ на обращение передавать сообщения по голосовой почте. Wildfire был встречен тепло, но почему-то не получил развития, хотя пользователи были очарованы его дерзкими фразочками. Несколько лет спустя в Microsoft Office появился ассистент по имени Clippy — навязчивая скрепка, которая энергично прыгала и самовольно давала советы. В тот момент миллионы офисных пользователей по всему миру получили новый объект раздражения. Впоследствии журнал Time включил Clippy в список 50 худших изобретений в мире. В 1998 году продукт Portico от компании General Magic, как обещал производитель, мог подключаться к Интернету и мобильному телефону при содействии голосового помощника, который был способен читать электронные письма и принимать сообщения. Через несколько лет компания закрыла проект и объявила о банкротстве.

Если попытаться представить себе лучшее время для появления виртуальных ассистентов, то осень 2007 года подходила бы для этого идеально. Быстрые беспроводные соединения, улучшенное распознавание речи, зарождение облачных вычислений, дебют на рынке Apple iPhone и возникновение новых веб-сервисов — все это было отличными условиями для появления таких помощников.

Коллектив SRI предчувствовал, что iPhone, который появился почти одновременно с началом реализации их проекта, может породить новое поколение потребителей, постоянно находящихся в Сети и привыкших выполнять свои задачи на ходу. Ассистент, выполненный в форме приложения iPhone c голосовым управлением, казался им идеальным способом помочь пользователям выполнять ряд полезных задач, не касаясь экрана пальцами и не ожидая открытия веб-страниц.

Предприниматели также загорелись идеей о том, что у них появилась возможность заработать на применении технологии CALO. В соответствии с законом, который был принят в Конгрессе США в 1980 году, некоммерческие организации, такие как SRI, получили право получать прибыль с программного обеспечения, разработанного в рамках исследований при государственном финансировании. Этот закон позволял стартапам лицензировать ключевое программное обеспечение проекта CALO, и в обмен на это SRI мог получать долю в компании.

Хотя Чейер сомневался в том, что исследования, связанные с CALO, могли использоваться для создания прибыльного предприятия, и не решался оставить свой пост в лаборатории, Киттлаус оказался решительней своего партнера. В результате появилась компания под названием Siri, в которой Киттлаус стал генеральным директором, Грубер — менеджером по технологиям, а Чейер — вице-президентом по инженерии.

От привлекаемых на работу сотрудников компании основатели Siri требовали прочесть книгу профессора Майкла Дертузоса «Незаконченная революция», в которой воспевалось «вычисление с человеком во главе угла», а также устройства, которые «по-настоящему служат нам, а не наоборот». Если претендент не соглашался с тезисами автора, он не подходил для работы в Siri.

После того как человек получал работу, ему вручали пустую фоторамку для рабочего стола и просили вставить в нее фото человека, который его вдохновил. Чейер выбрал в качестве своего кумира еще одного технологического визионера, который проповедовал подход «человек прежде всего». Конечно же, речь шла о Дуге Энгельбарте.

В начале 2008 года Siri получила от своих инвесторов 8,5 миллиона долларов, и один из инвесторов признался, что работа, которая была проделана в последующие месяцы, «просто захватывала дух». Еще один инвестор рассказывал, что «каждое заседание совета директоров было отмечено очередным прорывом».

Основатели компании начали тестировать прототип Siri в специальном учебном лагере для испытания технологий искусственного интеллекта, где ассистента обучали понимать получаемую информацию, интерпретировать ее и отвечать на запросы. Когда Siri задавали вопрос, технология обрабатывала информацию на удаленном дата-центре, который отсылал аудиофайл с вопросом говорящего на сервер, где программное обеспечение для распознавания речи «транскрибировало» устную речь.

[3] Итак, звалась она Siri

Слева направо, Чейер, Киттлаус и Грубер

После этого Siri должна была понимать значение слов, что ученые называли обработкой естественного языка. Разные люди формулируют свои запросы по-разному, и хотя человек способен правильно понимать такие синонимичные по сути фразы как «Что-то мне захотелось покушать круассаны», «Где ближайшая пекарня?» или «Не отказался бы от французской выпечки», для компьютера их интерпретация является куда более сложной задачей и требует использования сложнейшего алгоритма.

В рамках более традиционного подхода к обработке естественного языка, основанного на методе проб и ошибок, смысл предложения интерпретировался через идентификацию отдельных частей речи. Но в Siri решили отказаться от этого метода в пользу новаторского подхода, разработанного Чейером и его коллегами. Вместо моделирования лингвистических понятий их система могла моделировать объекты из реальной жизни. Например, если человек говорил «Хочу посмотреть триллер», Siri немедленно распознавала «триллер» как жанр фильма и начинала поиск по кинематографическим сайтам, а не просто анализировала то, как подлежащее было связано с определением или сказуемым.

Siri была способна подставлять содержание вопроса в потенциальное действие, а затем выбирать то действие, которое считала наиболее подходящим. Все это было основано на понимании отношений между понятиями из реальной жизни. К примеру, Siri знала, что у определенного ресторана есть рейтинг, адрес, тип предлагаемой кухни и диапазон цен. Siri также могла применять информацию о времени дня, местоположении и предпочтениях пользователя к формируемому ответу или просить его предоставить дополнительную информацию.

На начальном этапе разработчики Siri не видели практически никаких пределов в тех действиях, которые электронный ассистент мог бы автоматизировать. В соответствии с их задумкой, архитектура Siri должна была позволять любому веб-сервису с API (а их могли быть сотни или тысячи) добавлять к ее движку свою базу данных. Но уже тогда создатели Siri знали, что их виртуальный ассистент сможет найти отклик в сердцах пользователей, лишь если он будет не только умным, но и остроумным. А искусственный интеллект они страстно желали дополнить искусственным обаянием.

Киттлаус и Сэддлер активно прорабатывали ответы на любой абстрактный вопрос, который человеку хотелось бы задать ассистенту. Основатели компании также мечтали о том, чтобы создать различные личностные паттерны, которые могли бы сделать ответы Siri более любезными и естественными. А так как Siri была способна распознавать манеры речи, отличающие разных людей, ее создатели надеялись, что однажды она научится даже имитировать стиль общения своего хозяина.

«Слышь, ну кого у нас там сегодня по ящику показывают?», задавал бы вопрос теоретический пользователь.

«Чувак, там новая киноха с Иствудом. Зацени-ка», ответила бы ему своя в доску Siri.

По материалам HuffingtonPost.com

Евгений Мосунов

 
Авторизуйтесь Чтобы оставить комментарий