Apple активно работает над функциями голосового управления и обратной аудиосвязи для будущих iPhone

1
Apple продолжает демонстрировать постоянный интерес к созданию надежного программного обеспечения для осуществления голосовой беспроводной связи в своих мобильных устройствах (таких, как iPhone). Отслеживание деталей поданных патентных заявок дает понять, что компания собирается сделать эту систему более гибкой и эффективной, чем существующие варианты.


На этой неделе AppleInsider.com обнаружил новые патентные заявки, опубликованные Бюро патентов и товарных знаков США – они дают некоторое представление о том, каким образом будет работать функция голосового контроля в устройствах Apple (возможно, эта функция пока является секретом и сюрпризом операционной системы iOS 5, обещающей появиться в конце этого года).

Одна из заявок носит название «Адаптивная система и метод обратной аудиосвязи»; в ней отмечено, что существующие системы обратной голосовой связи неэффективны, особенно когда дело касается аудио элементов, содержащих большой объем информации – пользователь в результате часто оказывается не способен ее нормально понять и воспринять.

Кроме того, опыт показал, что на современные системы нельзя полностью полагаться в том плане, что пользовательский интерфейс часто обрабатывает и передает информацию не совсем так, как ожидает пользователь – в частности, система не в состоянии адекватно отличить важную информацию от менее важной.

Решение Apple заключается в «сокращении многословности» при работе с системами обратной аудиосвязи, что сделает их более эффективными для пользователя. Один из предложенных методов, например, подходит к ситуации, когда система будет работать со списком данных (допустим, подборкой песен, которую пользователь хочет прослушать), в котором есть повторяющиеся элементы (исполнитель или название альбома).

Такая система будет разумно предполагать и учитывать, что пользователь уже предоставил определенную информацию в любом контексте, и ему не нужно больше ее повторять. Этот метод «условно названный «сокращением, понижением») может применяться к меню навигации, предупреждениям, подсказкам и др.

«Если последующее для пользовательского интерфейса событие происходит в относительной близости от предыдущего события, интерфейс аудиопользователя может отреагировать меньшим объемом информации, передаваемой по обратной связи (за счет уменьшения количества слов), чтобы избежать словесного нагромождения с повторениями и очень подробной информацией»

— сказано в патентной заявке. Здесь же приведен один конкретный пример – строка «Genius is not available» (Гений не доступен) может быть заменена более коротким словосочетанием «No Genius» (Нет Гения). Еще более эффективным может быть использование звукового сигнала, означающего отрицание.

Данная система аналогично может работать и в обратном направлении – iPhone может «наращивать» количество слов в элементе по желанию пользователя (например, для передачи важной информации, оповещений или предупреждений для пользователя).

Эта динамическая система освободит пользователя от необходимости выслушивать все повторяющиеся аудио подсказки, особенно если они касаются задач, уже знакомых конкретному iPhone. Короткие подсказки не только станут менее надоедливыми для пользователя, но и добавят скорости голосовой навигации.

В следующей патентной заявке Apple также заводит речь о системе голосового управления. Следующая технология имеет название «Обработка входящих голосовых команд» и направлена на решение некоторых вопросов, часто вызывающих разочарование при пользовании системой голосового управления.

В заявке отмечено, что часто обработка и интерпретация голосовых команд пользователя системой происходит слишком долго. Задержки могут уменьшить не только скорость, но и эффективность пользования системой.

«Из-за времени, необходимого для получения всей входящей голосовой команды и определения содержания этой команды, отдельная команда пользователя – ответ на первую подсказку системы – может обрабатываться и пониматься по окончании обработки первой строки запроса, в то время, как звучит вторая строки запроса. Устройство может испытывать затруднения в определении того, какие именно строки команды связаны с конкретной полученной голосовой командой»

— сказано в заявке.

Решение Apple предполагает наличие динамических временных отметок или диапазонов, соотносимых с системными подсказками, и предложение соответствующего окна для оглашения голосовых пользовательских команд. Подсказки, выдаваемые системой, могут иметь любое сочетание временных отметок и диапазонов. Окна для ввода могут быть динамически увеличены или уменьшены с учетом ряда факторов. В одном из приведенных примеров система дает пользователю больше или меньше времени для ответа на подсказку, опираясь на исторические данные использования системы и даже на индивидуальные речевые особенности пользователя.

Тип подсказки также может повлиять на системное окно ввода — к примеру, если пользователю нужно больше времени на оглашение или обработку команды, система автоматически расширит временной диапазон.

Обе заявки были поданы Apple в январе 2010 года. Авторами предлагаемого изобретения, связанного с обратной аудио связью, являются Бенджамин Эндрю Роттлер (Benjamin Andrew Rottler), Арам Линдал (Aram Lindahl), Аллен Пол Хохэй мл. (Allen Paul Haughay Jr.), Шон Эллис (Shawn A. Ellis) и Поликарпо Вуд (Policarpo Wood). Те же Вуд (Wood) и Линдал (Lindahl) заявлены авторами технологии голосового ввода.

И The Wall Street Journal, и The New York Times в начале этого года писали, что Apple работает над улучшением функций голосовой навигации для следующего крупного обновления iOS – мобильной операционной системы – основы iPhone и iPad. В более поздних публикациях утверждалось, что голосовое управление будет «глубоко интегрировано» в iOS 5.

Повод для многочисленных разговоров о «капитальном ремонте» в области голосовой навигации появился тогда, когда стало известно о том, что Apple прибрела Siri – разработчика персонального мобильного помощника для iPhone, полностью работающего на базе голосового управления. При помощи Siri пользователь может формулировать задачи для своего iPhone, используя полные предложения, к примеру:

«Что будет происходить (в определенном месте) на этих выходных?».

В прошлом месяце было отмечено, что купертиновцы оказались не готовы продемонстрировать новые голосовые функции в рамках WWDC 2011. Тем не менее, прозвучала информация о том, что они (функции) все-таки появятся этой осенью и станут частью iPhone нового поколения.

Источник: appleinsider.com

1 комментарий

  1. 0

    Спасибо!
    Очень интересная статья!

Авторизуйтесь Чтобы оставить комментарий