Будущее - за голосовым интерфейсом
 

Мечты сегодня - это реальность завтра. Еще сотню-другую лет назад кто бы мог подумать, что человек при помощи дополнительных устройств сможет передвигаться с огромной скоростью по земле, летать по воздуху, ступить ногами на Луну и т.д. Писатели-фантасты в своих произведениях только представляли, как будет выглядеть летательный аппарат или водная посудина, способная погружаться в воду на большую глубину. Сегодня мы можем все это лицезреть.

Как себе сегодня представляют недалекое будущее фантасты, фантазеры и просто мечтатели? Исчерпывающую информацию об этом можно получить, просмотрев десяток кинолент последних десятилетий. Это и свободные полеты в космос, и телепортация, и преодоление сил гравитации Земли, и голосовой диалог с компьютерной системой, и т.д - перечислять можно очень долго.

Но можно ли приблизительно предсказать, как будет выглядеть повседневный мир в ближайший десяток лет? Можно, причем многое из того, что еще лет 20 назад было недостижимым, и было лишь очередной фантазией-клоном эпизодов \"Звездных воен\", сегодня вполне реально реализовать. Были бы, как говорится, деньги и желание.

Можно конечно мечтать, что в будущем энергия будет высасываться из пальца и передаваться по радиоволнам, будут преодолены законы гравитации, мир избавится от нефтяной зависимости и т.п. Человека прогресс тоже коснется: в мозг человека будет вживляться идентификационный чип, знания и умения будут вливаться хирургическим путем, и остальные прелести, типа титанового скелета, искусственных глаз с 100-кратным оптическим зумом и т.д.

Но это все необоснованные предположения, которые не имеют под собой научной почвы, и большинству из них в ближайшие 100-200 лет не суждено осуществиться по каким-либо техническим или этическим причинам. Например, работы по клонированию человека скорее всего никогда не примут массовый характер, а останутся уделом кинофильмов и сверхсекретных спецслужб, поскольку мировая гражданская общественность уже против, по этическим причинам.

К тому же, на фоне сторонников техногенного развития будущего зарождается другое направление, сторонники которого считают, что спустя много лет, человек освоит свои незадействованные 98% мозга и вернется к природе. Не в плане, конечно, того, что он возьмет дубинку и будет охотиться на мамонтов. Это будет выражаться в том, что для поднятия тяжестей человек будет использовать не механизмы, а телекинез; для общения на расстоянии будет использоваться не проводная либо радиосвязь, а телепатия; утраченная конечность не будет заменяться протезом, а отрастет самостоятельно за несколько месяцев.

Но это все в далеком и очень далеком будущем. Скорее всего, ввиду перечисленных причин, развитие цифровых технологий в ближайшее время пойдет по бытовой линии, где они наиболее востребованы. Рассмотрим детальнее некоторые конкретные моменты и примеры.

Вставая рано утром, как хочется, чтоб на кухне уже стоял свежесваренный кофе. Мечтать конечно не вредно, но ведь теоретически это можно осуществить и сегодня! Но как?

В принципе любая подобная цепь состоит следующим образом - задающее устройство (датчик), расчетно-вычислительное устройство и исполнительное устройство (в данном случае кофеварка). Первое, что приходит в голову - это установить таймер на включение кофеварки, например 7.00. Но, во первых, тут нет ничего нового. А во вторых, если человек проснулся раньше, чем произошло включение, или проспал? Его будет ждать холодная бодяга.

Решение вроде бы есть. Просто необходимо совместить момент старта кофеварки с моментом, когда человек полностью проснулся. Например, датчик движения сообщает, что человек поднялся с кровати, послал сигнал - и кофеварка включилась. А если человек встал посреди ночи, поскольку вечером было выпито большое количество мочегонного напитка, например? Утром его опять будет ждать еще более остывшая бодяга. Значит, без привязки к временному интервалу не обойтись?!

А если при этом еще усложнить задачу? Если я сегодня хочу кофе не с двумя ложечками сахара, а с тремя? Или вообще не хочу кофе, мне по душе сегодня чай?

Подобная проблема встает на другом примере - автоматическое включение света в неосвещенном помещении. Как хочется иногда не шарить по стенке руками в поисках выключателя, а чтобы свет включился \"по щучьему хотению\"! Какие проблемы, есть же датчики движения - их сигнал можно использовать для включения! А в паре с датчиком освещенности свет не будет включаться в светлое время суток. Но, опять же, \"галюнная\" проблема: человек, поднявшийся ночью, допустим, по нужде, разбудит весь дом. Есть ли выход?

Подобных примеров можно привести массу, даже в пределах собственого жилища: приготовление пищи, автоматическое наполнение водой ванны, открытие перед хозяином входных дверей и ворот гаража?

Чего же не хватает, чтобы осуществить и беспроблемно пользоваться подобными благами прогресса?

Безусловно, все это теоретически можно осуществить, но будет ли удобно этим пользоваться? Вряд ли кому-то понравится большой управляющий пульт посреди квартиры. Либо несколько дней все программировать самостоятельно, используя даже облегченный язык высокого уровня?

А нехватает главного звена - голосового командного интерфейса. Я думаю, ни у кого нет сомнения, что в недалеком будущем компьютеры будут уметь и разговаривать, однако это не делается по взмаху пальца. Компьютер не обладает и не будет обладать в ближайшее время интеллектом, все его действия и решения - ни что иное как движение по алгоритму, написанному ранее программистом. А полноценный алгоритм, способный к самообучению, подобно человеческому, не написал еще никто и нескоро смогут написать (если смогут вообще).

Исходя из вышесказанного, не трудно понять - как собеседник для филосовского обсуждения проблем насущных компьютер не самый лучший выбор, и смысла бытия от него не добиться. Но зато управлять с его помощью домашними бытовыми приборами и событиями - вполне.

Например, рассмотрим обсуждаемую нами выше проблему приготовления утреннего взбодряющего напитка при помощи голосового интерфейса.

Как будет выглядеть обитель? Да точно также, только по помещениям будут установлены скрытые микрофоны, различные датчики движения, тепла, влажности и т.д. Датчики через коммутатор будут соединены с портом домашнего сервера. Сервер будет управлять всеми бытовыми событиями жилища. Также через коммутатор к серверу будут подключены все бытовые устройства и приборы, начиная от лампочки и заканчивая холодильником.

Теперь алгоритм. Раннее воскресное утро. Микрофоны включены и улавливают любой звук - от посапывания спящего человека до шелеста штор. Порты сервера находятся в режиме ожидания. Приборы либо работают в штатном режиме, либо находятся в режиме ожидания.

И вот, глава семейства медленно просыпается. Датчики движения уловили перемещения тела, но ни включение света, ни каких других видимых действий не происходит - чтобы не разбудить вторую половину. Через минуту-другую просыпается жена. Типичный утренний разговор: доброе утро, дорогая? как спалось? нормально? не хочешь ли КОФЕ?

Некоторые могут предположить, что электронный домашний управляющий услышал, что хозяева хотят кофе, и принялся исполнять желание. Ничего подобного! Он действительно слышал, что у людей происходит диалог, но ЕГО это абсолютно не касается - ведь к НЕМУ никто не обращался.

Далее происходит следующее. Определив, кто что будет, муж говорит следующую фразу: КОМПЬЮТЕР, две чашки кофе, первая - две ложки сахара, вторая - три ложки сахара плюс сливки. И через несколько минут кофе готов.

Что это за магическая фраза? Магия тут ни при чем - это обычная структурированная команда. Разложим ее на составляющие.

Структура любой команды будет следующей:
Ключевое слово -> команда -> обязательные параметры -> опциональные параметры.

Ключевое слово в данном случае - это КОМПЬЮТЕР. Они вводят домашний сервер в режим ввода команд. Команда тут - кофе. Компьютер на самом деле понятия не имеет, что такое кофе и как его не хватает утром после бурного вечера. Он просто определяет, что при слове \"кофе\" он должен включить исполнительное устройство (кофеварка, в данном случае), находящееся на 27 порту коммутатора и загрузить в него необходимые параметры. Если с микрофона не поступит специальных параметров, то в устройство будут загружены стандартные параметры, а конкретно: просто слово \"кофе\" - выходным продуктом будет одна полная чашка воды с одной ложкой кофе и одной ложкой сахара. В рассмотренном случае были введены дополнительные параметры: количество чашек - 2; количество ложек сахара - в одной 2, в другой - 3; во вторую чашку добавить еще и сливок. Именно эту информацию на служебном машинном языке и передаст сервер кофеварке. Вот кофе и готов!

Если по каким-либо причинам компьютер не понял человека, например, человек нечетко произнес параметр либо неправильно составил последовательность предложения и при этом произнес много слов, не относящихся к параметрам (т.е. компьютер например не понял, 2 чашки с тремя ложками сахара или 3 чашки с двумя ложками?), из встроенных акустических систем компьютер голосом попросит подтвердить запрос. Например, \"Подтвердите пожалуйста, 2 чашки с тремя ложками сахара?\" Если все правильно, достаточно сказать \"да\". Если человек говорит \"нет\", компьютер вычеркивает этот вариант из списка и слушает инструкции снова.

Абсолютно аналогично происходит любое действие, например, напускание воды в ванну: \"КОМПЬЮТЕР, ванну, температура 50 градусов\". Сервер знает, что при этом нужно запустить исполнительное устройство на 16 порту (электронный смеситель воды), регулируя параметры потока относительно показаний датчика температуры, расположенного в ванной.

Безусловно, это все примитивно описано, и в реалии происходящие процессы будут гораздо сложнее. Но для конечного пользователя использование будет максимально легким и удобным - об этом позаботятся производители. Кто это будет?

Домашний сервер, безусловно, будет на платформе Intel. Intel также будет производить коммуникационные контроллеры для связи бытовой техники с сервером. А кофеварку, как и другие предметы бытовой техники, будет производить Samsung. Силами этих гигантов будут созданы также дополнительные устройства, как например домашний робот-помощник. Он сможет как привезти утренний кофе хозяину в постель, так и пропылесосить и помыть полы.

Ключевое слово не обязательно будет \"КОМПЬЮТЕР\", любое понравившееся, например \"МАША\". При этом при помощи 3-х мерного голографического монитора можно будет еще и вывести объемное изображение виртуальной домработницы.

На подобном небольшом субъективном примере отлично видно, какое будущее нас ждет в ближайшие 10-20 лет. Кто знает, возможно в дальнейшем появятся системы, способные различать импульсы головного мозга и составлять из них связанные предложения - тогда задача еще упростится, про кофе достаточно будет просто подумать :-). Но то, что развитие всех этих технологий будет в наибольшей степени зависеть от Intel и Samsung - это вне сомнения.