9to5Mac: Сенсационное интервью с создателем искусственного интеллекта iPhone 5

Ресурс 9to5Mac продолжает радовать интереснейшими материалами, имеющими отношение к технологии Siri, на базе которой, по слухам, будет реализован «голосовой ассистент» пятого iPhone. В статье Сета Вейнтроба (Seth Weintraub) «Co-Founder of Siri: Assistant is a “World-Changing Event” (Interview)» («Сооснователь Siri: Появление Assistant событие, меняющее мир (Интервью)») от 3 октября 2011 года, своми соображеними в отношении грядущего появления Assistant на базе Siri в iPhone 5 делится сооснователь Siri и член правления Норман Винарски (Norman Winarsky). Как уже неоднократно повторялось в различных публикациях, Assistant может стать самым интересным новшеством iPhone, который увидит свет завтра. В нашей статье «В корпус iPhone 5 спрятался общительный личный секретарь» от 26 сентября 2011 года мы уже рассматривали некоторые подробности новой технологии. А завтра посмотрим, что Apple удалось создать на базе Siri Personal Assistant Software. Напомним читателю, что технология Siri была приобретена компанией Apple в апреле 2010 года. Этой теме посвящен опубликованный 28 апреля 2010 года на страницах 9to5Mac видеоматериал «Apple buys Siri AI Personal Assistant software» («Apple приобрела программное обеспечение искусственного интеллекта Siri Personal Assistant»). Материал был размещен персоналом ресурса (9to5 Staff). По слухам это обошлось техногиганту из Купертино в $200 млн. По словам Стива Джобса (Steve Jobs), речь идет об «искусственном интеллекте», а не поисковой методике или простом распознавании речи.

Apple прогнозировала искусственный интеллект еще в 1987 году

Когда Siri еще, по выражению Сета Вейнтроба, «принадлежала самой себе», ее описывали как «виртуального персонального ассистента» («VPA»):

Виртуальные персональные ассистенты («VPA») демонстрируют возможности следующего поколения парадигмы взаимодействия с Интернетом. В нынешней парадигме, мы следуем по ссылкам в результатах поиска. С помощью VPA мы взаимодействуем путем диалога. Мы говорим ассистенту о том, что бы хотели сделать, а он обращается к множеству сервисов и информационных ресурсов, чтобы выполнить нашу задачу. Как и реальный ассистент, «VPA» персонален; он использует информацию об индивидуальных предпочтениях и историю взаимодействия, чтобы помочь в выполнении конкретных задач и по мере приобретения опыта он становится лучше.

Если обратиться к истории техногиганта из Купертино, то можно узнать, что компания давно хотела донести до широких масс преимущества искусственного интеллекта. Еще в 1980-е годы Apple с целью продемострировать свои амбиции создала серию видеоматериалов Knowledge Navigator (Навигатор Знаний). Описание данного концепта содержится в статье англоязычной Википедии «Knowledge Navigator». В Википедии имеются также статьи на эту тему на арабском, немецком и хорватском языках. Многое ли изменилось с той далекой поры, нам предстоит увидеть завтра. Во вторник нам предстоит увидить, насколько точно Apple сумела спрогнозировать будущее в 1987 году. Ведущим ресурса 9to5Mac выпала удивительная возможность побеседовать с Норманом Винарски, сооснователем Siri.

Эволюция устройств ввода происходила не без участия Apple

Если не вспоминать о совсем уж далеком прошлом, то сначала весь ввод осуществлялся только с клавиатуры, затем появилась мышь и совсем уж относительной недавно сенсорный интерфейс. Если говорить о мыши и сенсорном экране, то эти методы хотя и не были изобретены в недрах Apple, но в течение тридцатипятилетней истории были широко популяризированы возглавлявшейся Стивом Джобсом (Steve Jobs) компанией.

Все эти методы ввода прекрасны, но для человека непривычно «общаться» с клавиатурой, мышью или даже сенсорным экраном. Все это требует обучения. Нам приходится напрягать свое тело, чтобы взаимодействовать со средствами компьютерного ввода. Самым привычным для нас способом общения является речь, мы привыкли слушать собеседника и отвечать ему устной речью. Эти навыки свойственны человеку разумному уже многие тысячелетия.

История «умного помощника» Siri

К огромному сожалению, человеческой цивилизации до сих пор не удалось изобрести компьютер, который понимал бы то, что мы говорим и, что более важно, использовал бы эту информацию для поиска ответов и предоставлял найденные ответы нам. Такие функции требуют не только распознавания устной речи, но и искусственного интеллекта. Только искусственный интеллект способен понять человека, использовать предоставленную человеком информацию и ответить человеку человеческим голосом, решив поставленную задачу. Все это пока не стало в полной мере реальностью и относится скорее к области научной фантастики. Тем не менее, человеческая мысль работала в этом направлении. Сет Вейнтроб делает небольшой исторический экскурс:

В 2003 году Правительство Соединенных Штатов начало наиболее амбициозную программу по теме искусственного интеллекта в своей истории под именем «Cognitive Assistant that Learns and Organizes». «Когнитивный Ассистент, который учит и организует», иными словами программу CALO. Ее имя происходит от латинского слова «calonis», означающего «слуга солдата». Основанный DARPA в рамках его проекта Personal Assistant that Learns (Персональный помощник, который учит), программа просуществовала пять лет и к работе над ней привлекались 300 исследователей из 25 ведущих университетов и коммерческих исследовательских институтов, с целью «создания нового поколения когнитивных ассистентов, имеющих разум, извлекающих уроки из опыта, которому можно сказать, что делать, могущих объяснить, что они делают, рефлексирующих над своим опытом и здраво реагирующих на неожиданности».

Программа координировалась SRI International в калифорнийском Menlo Park. Когда программа была завершена в 2007 году, SRI взяла полученные в CALO и некоторые из ее ключевых игроков сформировали Siri. Норман Винарски из SRI, человек, который однозначно позиционировался в качестве координатора проекта CALO и компания повествуют нам о последствиях популяризации «Assistant» компанией Apple.

Норман Винарски рассуждает о прошлом, настоящем и будущем

В дальнейшем вопросы ресурса 9to5Mac будем выделять жирным шрифтом, а ответы Нормана Винарски наклонным курсивом.

9to5Mac: Какова была ваша роль в совместном запуске Siri?

Норман Винарски: Как только [проект] CALO стал приближаться к своему завершению, мы осознали, что здесь кроются немыслимые коммерческие возможности создания умного персонального ассистента на основе того, чтобы узнали за пять лет в проекте CALO. Моя работа получила финансирование (венчурными инвесторами стали Morgenthaler и Menlo Ventures) и была собрана команда, которую возглавил Даг Киттлес (Dag Kittlaus), в прошлом трудившийся в Motorola. С ним пришел гений из Semantic Web Том Грубер (Tom Gruber) и главный архитектор CALO Адам Чейер (Adam Cheyer). На момент перехода к Apple в команде было 19 человек и она росла. Все трое сооснователей и сейчас работают в Apple, как и большая частью изначальной команды. После приобретения я остался в SRI, это очевидно.

9to5Mac: Могли бы вы рассказать нам немного о том, как Apple приобрела [Siri]? Что-либо о финансовой стороне?

Норман Винарски: Я не могу разглашать никакой информации о приобретении, которая не является публичной, в том числе и цену приобретения. Что примечательно, Apple совершила приобретение всего за два месяца после того, как мы представили наше приложение публике. Вероятно из этого вы сможете сделать свои выводы.

9to5Mac: Насколько важен компонент распознавания речи Nuance в технологии Siri?

Норман Винарски: Он значительно менее важен, чем вы вероятно думаете. Когда мы впервые создали Siri, мы использовали для распознавания речи Vlingo, на момент приобретения компонент распознавания речи был модульным. Теоретически, если еще лучшее средство распознавания речи идет в комплекте (или Apple покупает его), они, вероятно, могут заменить [им] Nuance без существенных сложностей. Об этом говорилось, Nuance далеко отстоит от большинства IP в технологиях синтеза речь, которыми располагает индустрия. Нам следует знать, что SRI запустила Nuance в качестве одной из своих компаний-инкубаторов в 1995 году ее IPO состоялось в 2000 году.

Здесь следует сделать комментарий. Согласно словарям, сокращение IPO (Initial Public Offering) может означать первичное открытое акций на фондовом рынке. Скорее всего речь идет именно об этом событии, но, следует предупредить читателя, что из сообщения Нормана Винарски невозможно точно сделать вывод об употреблении термина.

9to5Mac: Насколько много ресурсов отнимает искусственный интеллект Siri? Мог ли он стать причиной задержки очередного iPhone?

Норман Винарски: Я не знаком с эппловским графиком и какими-либо задержками, но могу сказать, что искусственный интеллект требует огромных компьютерных мощностей. Программное обеспечение Siri требует кэширования данных, требует доступа к большому набору данных на широкой полосе пропускания и требует для всего этого большого процессора. Когда мы первоначально выпустили Siri для iPhone 3GS, нам пришлось выполнить все виды оптимизации и сократить [размер], чтобы оно работало рационально. Все, что я могу сказать, оно, вероятно, будет намного лучше запускаться на более быстром телефоне.

9to5Mac: Насколько велика значимость Siri «Assistant»? (Насколько появление Siri «Assistant» станет значительным событием?)

Норман Винарски: Позвольте мне прежде всего сказать, что я не обладаю никакими знаниями относительно того, что Apple планирует делать с приобретенным [ею] Siri. Я читаю слухи, как и любой другой читатель, и представляется, что Apple становится готовой показать, что она сделала с Siri за последние полтора года (мы ожидали, что она покажет это еще на WWDC).

Не допускайте ошибки: «мейнстримный» эппловский искусственный интеллект в форме виртуального персонального ассистента станет новаторским событием. Я близок к тому, чтобы назвать это событием, меняющим мир. Сейчас некоторые люди барахтаются в частичном искусственном интеллекте, реализованном в приложениях, подобных Google Voice Actions, Vlingo и Nuance Go. Siri на много шагов опережала эти технологии, по крайней мере так было два года назад. Это реальный искусственный интеллект для реального позиционирования на рынке. Если слухи верны, Apple включит миллионы и миллионы людей в процесс общения с машинами на человеческом языке. Программируемая матричная логика делает эти вещи и это только вершина айсберга. Мы обсуждаем очередную технологическую революцию. Очередное изменение парадигмы [взаимодействия с] компьютером.

Это напоминает мне другой проект SRI: изобретатель компьютеной мыши Дуг Энгельбарт (Doug Engelbart, Дуглас Энгельбарт) расширил человеческие возможности в далекие 60-е. Стив Джобс взял эту технологию и придал ей спринтерскую скорость, мы уверены, что Apple использует Siri для того, чтобы в начать очередной крутой перелом в науке и технике.

9to5Mac: Премного благодарим вас, Норм, за потраченное вами время. Это напоминает нам сравнение компьютера с велосипедом для разума, сделанное Стивом Джобсом.

Кратко о других сооснователях Siri

Получив информацию о том, что трое из сооснователей Siri сейчас трудятся в Apple, в 9to5Mac решили навести о них некоторые справки и узнали, что Даг Киттлес (Dag Kittlaus) в настоящее время трудится в Apple директором по приложениям для iPhone. Сам он прокомментировал свою деятельность таким образом:

Сейчас создаю очередную большую вещь внутри большой вещи. (рус.)
Now making the next big thing into a really big thing. (англ.)

В русском переводе теряется краткая красота этой английской фразы. «Большой вещью» или же «большим делом» именуется не только то, чем сейчас занимается Даг Киттлес, но и сама компания Apple. Адам Чейер (Adam Cheyer) в 2007 году продемонстрировал приложение CALO Express незадолго до запуска Siri. Приложение работает под Windows CE, поскольку предназначено для использования в правительственных нуждах. Описание «CALO Express: A lightweight, commercial quality, Microsoft-embedded version of CALO» («CALO Express: легкая, коммерческого уровня, Microsoft-совместимая версия CALO») размещена в формате PDF на сайте Адама Чейера (Adam.cheyer.com) в разделе «Demos». Том Грубер появился перед публикой в 2008 году с интересным объявлением в отношении Siri, которое размещено Semantic Web на сервисе видеообмена Vimeo под названием «KEYNOTE: The Game Changer: Siri, a Virtual Personal Assistant» («Суть доклада: Меняющий правила игры виртуальный персональный ассистент Siri»). Этот же видеоматериал с кратким текстовым пояснением размещен непосредственно ресурсом Semanticweb.com 6 июля 2009 года.

Норман Винарски не подтвердил и не опроверг слухи

Несмотря на то, что интервью Нормана Винарски крайне интересно и познавательно, важно заметить, что он не подтверждает и не опровергает слухов о том, что в iPhone 5 будет реализована технология на базе Siri. В конечном счете, из его рассуждений не следует даже то, что завтра будет представлен именно пятый iPhone, а не модификация четвертого поколения или вообще нечто иное и совершенно непредсказуемое. По большому счету, он сам говорит о том, что и сам черпает информацию об околоэппловских слухах из тех же источников, что и другие читатели сетевых ресурсов, то есть из разнообразных публикаций на этих самых ресурсах. Он только предполагает, что плод яблочных трудов над технологией Siri достаточно созрел для того, чтобы его могли попробовать широкие круги пользователей вычислительной техники. В своих предположениях Норман Винарски не ссылается на какие-либо источники, которые позволили бы ему располагать определенной информацией о планах Apple, более того, он прямо заявляет об отсутствии у него таких знаний. Таким образом, интервью никак не проливает свет за таинственный покров, который раскроется лишь завтра.

Источник: 9to5Mac.com, En.wikipedia.org, Adam.cheyer.com, Semanticweb.com, Youtube.com