Опрос
Вы участвуете в программе Windows Insider?

Microsoft внедрит систему распознавания речи в широкий перечень своих продуктов

Напечатать страницу
17.08.2011 11:20 | VizerEx

Microsoft активно работает над технологией распознавания речи, которая в будущем станет частью Windows 8, Windows Phone, Bing, Kinect, и быть может, Windows Azure.

Windows Phone Mango уже получил набор функционала для обработки голоса, в числе которого наиболее примечательна функция перевода живой речи в текст и наоборот. Уже осенью Kinect обзаведется возможностями распознавания, что позволит производить поиск фильмов, телепередач, музыки и прочего цифрового контента в системе Bing при помощи голоса. А в следующем году подобные возможности получат и другие продукты Microsoft.

Если говорить о Windows 7, то на сегодня эта система способна распознать лишь ограниченное число голосовых команд, но по словам Ильи Букштейна (Ilya Bukshteyn), директора по продажам и маркетингу подразделения Tellme, следующая версия операционной системы (как для платформы ARM, так и для Intel) получит более совершенный механизм распознавания голоса и научится выполнять более обширный перечень действий; что впрочем было ожидаемо, поскольку Windows 8 разрабатывается с большим расчетом на "естественное" взаимодействие, нежели на традиционное управление. Специальный инструментарий поможет разрабатывать приложения, использующие голосовые возможности, заложенные в будущей операционной системе, добавил Букштейн.


Вообще, сфера работ Microsoft Tellme простирается дальше одних технологий распознавания голоса, заметил Букштейн. Когда Стив Баллмер (Steve Ballmer) объявил, что в скором времени Bing сможет обрабатывать голосовые запросы разной сложности, он не упомянул об устройстве этой технологии. На самом деле, это связь из трех компонентов: система распознавания речи, поисковой движок Bing и механизм, извлекающий информацию о ваших социальных связях из Windows Live (Windows Live может выступать в качестве социального графа сетей FaceBook, LinkedIn и Twitter, пояснил Букштейн).

9 августа Microsoft опубликовала небольшой промо-ролик, в котором рассказывается о повседневных сценариях, которые могут кардинально поменяться с приходом технологий Tellme:


Взять обычный пример: нужно пригласить некоего вашего друга на совместный обед. Microsoft обещает, что уже через 3-4 года их технологии будут в состоянии в этом вам помочь. Нужно будет лишь сказать компьютеру: "Во вторник нужно устроить обед с Иваном Ивановичем", и система уже сама распознает запрос, подключится к вашим аккаунтам в соц. сетях, найдет того самого "Ивана Ивановича" с которым вы хотите пообедать, сверит ваши с ним графики и поищет через Bing рестораны, пользуясь списками ваших предпочтений.

В блоге Tellme можно увидеть их собственное видение будущего слияния голосовых сервисов и Bing, Windows, соц. сетей:

"В будущем все сервисы будут понимать ваши потребности, учитывать предпочтения, политику приватности, социальные связи и все другие критерии, которые определяют нужный результат. В то время как вы будете общаться с техникой на удобном и привычном разговорном языке, она будет всячески помогать вам в осуществлении ваших намерений, рутинных действий и прочих задач, благодаря пониманию ваших желаний. Программное обеспечение сможет оперировать большим числом слоев контекста: чем, где и как вы занимаетесь, какими устройствами при этом пользуетесь. И поскольку это ПО будет облачным, вы сможете сохранять сведения о ваших с ним взаимодействиях, и позднее возвращаться к ним с того места, где закончили в последний раз, не зависимо от устройства, которое выберете".

"Понимание потребностей пользователя" имеет большое значение для персонализации Bing, сказал Букштейн. И Tellme здесь отведена далеко не последняя роль, поскольку объемы данных, которые обрабатывает команда для совершенствования обработчика голоса, поистине колоссальны. Tellme анализирует около 11 миллиардов вариантов различных произношений в год.

Подразделение Tellme работает как над долгосрочными перспективными проектами, так и над более краткосрочными задачами. В частности, внутри отделения есть команда, работающая над интерактивными системами телефонных сообщений (IVR - англ. Interactive Voice Response), которые маршрутизируют звонки внутри call-центров; команда, которая занята внедрением API голосовой технологии в Windows Phone, что позволит разрабатывать приложения, пользующиеся возможностью распознавания голоса для Windows Phone, (хотя, когда результаты работы последней станут доступны широкой публике, Букштейн не сообщил) и другие команды.

Ко всему прочему, Tellme планирует добавить поддержку распознавания голоса и в Windows Azure. В результате можно будет ожидать появления IVR-ориентированных сервисов, работающих на Windows Azure. На сегодня о сроках реализации совсем ничего не известно, но даже если Windows Azure никогда не получит такой возможности, сервис Tellme в любом случае появится для сторонних компаний, разрабатывающих свои облачные сервисы.

Итак, действительно ли речевые технологии - недооцененная область NUI? Позволит ли работа Microsoft в этой области обогнать конкурентов, покажет только время.


Источник: http://www.zdnet.com/blog/microsoft
Перевод: VizerEx

Комментарии

Не в сети

Эта страна как всегда в пролёте, да?

17.08.11 11:31
0
Не в сети

Мы не в пролете, мы типа "в планах"... как я понимаю в долгосрочных.

17.08.11 11:45
0
Не в сети

Эта страна будет в пролете до тех пор, покуда тут воруют чаще, чем покупают

17.08.11 12:11
0
Не в сети

Эта страна всегда будет в пролете, пока не сделает свою операционную систему с блекдж.. и шл..

17.08.11 12:39
0
Не в сети

Эта страна уже собирается сделать свою национальную ОС на базе Линукса,но с вероятностью 90% деньги просто разворуют и нихрена не сделают.

17.08.11 12:47
0
Не в сети

Не 90%, а 100% и даже больше. Не в первый раз уже так.
А что насчет распознавания речи русской, то было б здорово конечно.

17.08.11 12:53
0
Не в сети

"Своя ос на базе линупса" это вообще смешно кстати. Мало всяких линупсов чтоли? Надо ещё один сделать?

А насчет воруют/покупают и этой страны, тут как посмотреть. Есть например и за пределами этой страны дофига русскоговорящих, которым бы не помешали функции, поддерживающие их язык.

17.08.11 12:56
0
Не в сети

ProVal, если они живут за пределами этой страны, предполагается, что и говорят они на языке той страны, в которой живут.

17.08.11 13:51
0
Не в сети

ProVal , "живешь в другой стране? пользуйся их языком"

17.08.11 14:00
0
Не в сети

Русский язык просто распознавать сложнее,чем английский.В основном такая беда из-за окончаний слов,которых у нас много.
Так что учим английский,переключаем язык на инглиш и развлекаемся.

17.08.11 14:31
0
Не в сети

ни за что, инглишь выучить и можно, но использовать его в повседневном общении, работе за пк и др. ни за что =)

17.08.11 19:39
0
ad1 +79
Не в сети

http://www.gotdotnet.ru/blogs/channel9/6639/
2:30
Пусть тут полежит, видео годичной давности

17.08.11 20:23
0
Не в сети

Про распознавание голоса пишется в маркетинговых материалах Microsoft с каждой версией Windows, начиная с бета-версий Chicago (Windows 95). Это светлое будущее они обещают уже пятнадцать лет - вот ещё немного, вот ещё чуть-чуть, вот купите ещё более мощный компьютер - а мы когда-нибудь в будущем сотворим распознавание голоса.

Мой телефон прекрасно, чётко и безошибочно распознаёт, кому я хочу позвонить или какой трек прослушать - когда я за рулём и пользуюсь синезубой гарнитурой. То есть там, где это действительно необходимо. А рассказывать конечному потребителю про корпоративные системы для call-центров - несколько нечестно.

Как-то так.

17.08.11 23:16
0
ad1 +79
Не в сети

ну ничего, мультитач тоже почти 30 лет назад появился ;)

Корпаративными системами для колл-центров пользуются тоже конечные потребители. Вопрос был в том, что МС Русский не распознает, там распознает, система появилась позже семерки так что есть все шасы на будущую продукцию.

Кстати есть маркетинговые материалы, а есть исследовательские публикации раскрученные журналистами, как-то так

18.08.11 00:02
0
Не в сети

ad1, если так подумать то и вертолет с танком придумал Леонардо, давайте следовать традициям!

18.08.11 04:23
0
Не в сети

Я правильно понял что работать это будет через интернет? Голос записывается, отправляется на сервера MS, анализируется, результат присылается обратно...
А вообще интересно что такие технологии нам обещают год от года. Появляются сотни видео в которых мы видим красивые компьютеры и интерфейсы неалекого будущего ("через 3 - 4 года"), а в итоге получаем куцый метро либо смесь aero с лентами и разработчиков соревнующихся в "кто сделает программу уродливее".

18.08.11 10:04
0
Не в сети

Вот-вот. Именно, что каждый год такие обещания.
Помню, что самый первый набор команд ММХ Intel именно так и подавала - мол компьютер заговорит и будет понимать человеческую речь. Что-то не заметно, чтобы это стало широко использоваться до сих пор, хотя всяческих "расширений" команд процессора наштамповали уже туеву хучу.

18.08.11 14:29
0
Не в сети

Заскриптовать всё нельзя. Чтобы действительно понимать - нужен искуственный интелект, которого нет и не особо придвидится.

А скрипто-конструкции вида: "Компьютер-найди-интернет-фраза_для_поиска", "Компьютер-настройка-будильник-утро-семь-ноль-ноль" можно нашлёпать и сейчас, только толку от них - так, побаловаться.

Года 4 назад видел в интернетеописание подобного управления. Сскрипты просто писались на баше. Сам же рисовал себе на баше же анализ и чтение почты через фестиваль. Реально? Да - годы уже как. Вот только это всё частный случай и редко когда нужно и не в том виде, который всё время обещают.

Маркетинг одним словом. Если не назвать жёсче и правдивее...

С другой стороны - пользователи хотят "революции" от каждой новой виндоуз. Ждут, жаждут, мечтают. И отдел маркетинга обещает её. Отдел кодинга последовательно меняет квадратное оформление на круглое, круглое на квадратное, цветастое на одноцветное и одноцветное на цветастое.

18.08.11 15:55
0
Не в сети

потому что даже если поменять что-то реально серьёзное, архитектуру, в корне (что не мешало бы), то ПО не будет работать, разве что через виртуальную машину, а это потери производительности - проще будет оставить старую винду и "подождать пока перепишут весь софт под новую". В результате использование такой революционной ОС будет близко к нулю.

Если не менять - покупать не будут. А зачем?

Тогда остаётся менять что-то несерьёзное, но заметное (кнопочки, обои, диалоги настройки, иконки, эффекты перелистывания окошек, звуки, экран загрузки и т.д.) и рекламировать ОС погромче. Пусть и одним и тем же слоганом, не меняющимся с 95-й винды.

Хотя есть и варианты. Выпустить тормозную прослойку между железом и ПО, а потом выпустить следующую версию прослойки (ОС), но уже не такую тормознутую - "шуструю", как любят говорить. И вот - вроде как есть прогресс.

Как уровень жизни в отчётах Росстата - считают как нам стало лучше по сравнению с 2000-м годом, не учитывая, как нам стало хуже жить по сравнению с 80-ми годами.

18.08.11 16:07
0
Не в сети

Местами толсто.
Изменения всегда внутри, а не снаружи. Судить об изменениях по кнопочкам - это толсто и вообще из разряда линуксизма.
Только у линупсят регулярное "система до лохов", "да у вас свистелки и перделки", "да у вас эффектов нет", "обои скучные" и т.д.
Голосовое распознавание для этой страны есть, как и виртуальные дикторы, но их делают не в MS, а в других конторах. И самое печальное то, что их продукты не пользуются большой популярностью - их пиратят, но не покупают, а выйти на мировой рынок такие конторы просто не могут. Результат очевиден.

18.08.11 18:58
0
Не в сети

> Изменения всегда внутри, а не снаружи.
Насчёт "всегда" - вы как минимум сразу перегнули. Не было бы такой суеты с интерфейсами.

Насчёт "внутри". Ну например чем кардинально W7 отличается от Vista? Внутри.
Приведите пример, если не сложно.

Например новые ФС, usb 3, mesh-сети, кластеризация, HA-функции (высокодоступные кластерные решения) и т.п.

Может и есть, скорее всего, но почему в большинстве описаний делается акцент на новые обои, аватарку в панели задач, изменённые диалоги настройки какой-нибудь мелочи и т.п. мелочь?!

Не знаю, может у меня складывается только (описанное выше) впечатление...

> Только у линупсят регулярное "система до лохов", "да у вас свистелки и перделки", "да у вас эффектов нет", "обои скучные" и т.д.
Когда кончаются аргументы - начинаются оскорбления.

19.08.11 02:25
0
Не в сети

_Serega_ писал:Может и есть, скорее всего, но почему в большинстве описаний делается акцент на новые обои, аватарку в панели задач, изменённые диалоги настройки какой-нибудь мелочи и т.п. мелочь?!


Приведите пример такого описания. А пока это лишь Ваше собственное представление о W7

19.08.11 08:33
0
Не в сети

> Приведите пример такого описания. А пока это лишь Ваше собственное представление о W7
Пожалуйста.

Большое описание рыбки, анимаций, диалогов. Частичное упоминание возможности виртуализации и ещё пары "фич".
http://www.thevista.ru/page14537-obzor_windows_8_build_7989_ch_1
http://www.thevista.ru/page14538-obzor_windows_8_build_7989_ch_2

Сравните с обычным очередным обновлением ядра:
http://www.opennet.ru/opennews/art.shtml?num=30603

Каждому своё конечно. И я могу понять это. Если бы не одно "но". Проходя мимо напёрсточника и людей вокруг него - можно спокойно поглядеть и сказать: "Каждому своё". А можно всё таки обратить внимание сомнивающихся, на обман. Вроде как и нет выгоды, не должен был бы - кто-то даже крикнет, что "опять эти искатели правды!".

Ну а что же делать, если не все понимают, что добро и дарение - это хорошо, а эгоизм и обман, навязывание и подсаживание на иглу - это плохо. Что такое хорошо и что такое плохо как выясняется люди могут и до старости не понимать. Но люди учатся - и это хорошо.

А мы тут обсуждаем факты, а не веру. Факты наличия описания фич, как минимум. А не оскорбления и ненависть к странному слову "линупс".

19.08.11 12:11
0
Не в сети

Кстати, в разговоре не прав тот, кто кричит. Если вы нервничаете, значит вы сами сомниваетесь и это хорошо. Человек должен сомниваться - он должен проверять САМ и думать своей головой, сопоставляя факты, даже если это неприятно и вызывает "дискомфорт".

19.08.11 12:14
0
Не в сети

_Serega_ писал:Пожалуйста.


Столько всего написали, а на вопрос так и не ответили Приведите пример описания Windows 7, где упоминаются только обои и анимация.

_Serega_ писал:Кстати, в разговоре не прав тот, кто кричит. Если вы нервничаете, значит вы сами сомниваетесь и это хорошо. Человек должен сомниваться - он должен проверять САМ и думать своей головой, сопоставляя факты, даже если это неприятно и вызывает "дискомфорт".


Это Вы сами с собой разговариваете?

19.08.11 13:23
0
Не в сети

denominator
http://windows.microsoft.com/en-US/windows7/products/features
Чуть больше чем обои и анимация, но опять же после тщательного изучения сайта MS не вижу ни одной причины чтобы обновить Vista до 7.
Сравните с описанием Lion: http://www.apple.com/macosx/whats-new/features.html

20.08.11 12:52
0
Не в сети

SunsetBlvd писал:Чуть больше чем обои и анимация


Чуть больше.... всего раз в 50-100 больше. А так, почти только обои и анимация

SunsetBlvd писал:не вижу ни одной причины чтобы обновить Vista до 7.


Это Ваше личное мнение и не имеет отношения к данному разговору.

SunsetBlvd писал:Сравните с описанием Lion


Сравнил. Примерно одинаковое количество изменений. Надеюсь Вы прошлись по всему трехуровневому описанию возможностей Windows 7, которые для Lion представлены на одной странице...

20.08.11 19:59
0
Не в сети

denominator
Прошёлся по всем. Половина - повторение изменений из Vista. Есть и Windows Speech Recognition now works better—and with more programs. So instead of using the keyboard, you can just tell your computer what to do. Start an e-mail by speaking the recipient's name, surf the web without a keyboard, or dictate your documents.

Более того, открываем страничку Windows Vista и... Speech Recognition in Windows Vista allows you to interact with your computer by voice. With Windows Speech Recognition, you can dictate documents and e-mail in mainstream applications, use voice commands to start and switch between applications, control the operating system, and fill out forms on the web.

Предсказываю описание на страничке Windows 8 We present you new Voice Recognition powered by TellMe. Now you can simplify your daily life by controlling your PC with your voice. Dictate documents, open programs and call your friends without even touching your PC!*
* This feature is avaliable only in U.S. and some European countries. Internet connection required.

21.08.11 02:02
0
Не в сети

_serega_ писал:Насчёт "внутри". Ну например чем кардинально W7 отличается от Vista? Внутри.
Приведите пример, если не сложно



[url]http://technet.microsoft.com/en-us/library/dd349334(WS.10).aspx[/url] Надеюсь, к новому году закончите читать?

21.08.11 05:07
0
Не в сети

sunsetblvd,

Читаю "новые фичи" кошачьего. Вот например: Captive network When connecting to a network that requires authentication, Lion presents a window allowing you to log in to the network. Что может означать это - фиг поймешь. Я не думаю, что раньше в mac osx не было окошка для ввода пароля. Или?

P.s.: кстати, большинство новых фич относятся к обычным сторонним приложениям (по классификации МС. Например Windows Live) Но им (МС) же низзя - набегут очередные обиженные и будут требовать выпустить Windows версии NNN без очередной фичи. А эпплу можно...

21.08.11 05:13
0
Не в сети

> [url]http://technet.microsoft.com/en-us/library/dd349334(WS.10).aspx[/url] Надеюсь, к новому году закончите читать?
Да, вы правы. Безусловно много нужно там читать. Ну, я постораюсь, насколько смогу
Хотя заранее соглашусь, что изменений много и я был не совсем прав. Признаюсь.

Тем не менее, есть некоторые но. Начнём.

1. AppLocker - ну, наверно полезная штука. Но как попытка подставить подставку под неверную архитектуру. Объясню. Проблема в хаосе ПО в виндоуз. И отсутствии централизованного репозитария ПО, определённого хаоса в логике дерева ФС. Например: в gentoo все бинарники игр имеют группу games. Только пользователи, входящие в эту группу могут запускать игры. И т.п. То же касается доступа к usb, cdrom и т.д. - на всё есть своя группа. Всё и гибко и просто.

Но, повторюсь, для Windows - это шаг. Так что вы правы.

2. Биометрия. Большое дело. Серьёзное. И бесполезное. Простите уж. Вся биометрия - это маркетинг большой. Доказано многими людьми. Тум и авторизация по слепку отпечатка пальца и по фотографии вместо лица и т.д. Несерьёзно, но забавно.

3. Сертификаты.
>These changes enable new certificate enrollment scenarios that allow organizations to expand the accessibility of existing public key infrastructure (PKI) deployments and reduce the number of certification authorities (CAs).
>Improvements to the certificate selection user interface and filtering logic provide a simplified user experience when an application presents multiple certificates.
Новые сценарии использования сертификатов и новые диалоги. Ну, наверно... В общем, мелкие правки кода.

4. Deployment Tools. Да, наверно тут мне нечего сказать. Не знаю, чтобы ранее в Windows такое было.

5. New in Networking
Внедрение несовместимостей и велосипедов в виде DirectAccess тоже как-то вызывает вопросы.

Хотя в остальном, да, действительно понаписано много. Вы правы и мой тезис о лишь внешних изменениях был неверен.

23.08.11 14:28
0
Не в сети

Но, опять же повторю свою мысль, что именно на этом сайте, зачастую описания касаются только интерфейса. Градиентов, аватарок, экрана загрузки и т.д. Вы можете сказать, что это субъективное моё мнение и будете правы - оно действительно субъективно - иначе и быть не может в такой ситуации.

23.08.11 14:31
0
Не в сети

Получается windows тоже развивается. Много полезных изменений. И сложно не согласиться, что со времён DOS или Win95 стало хуже (кроме разве что системных требований). Да, windows становится лучше относительно прошлых версий.

Уходят ли архитектурные проблемы и ошибки дизайна? Нет. И причины всё те же - сломается совместимость с ПО. Т.е. изменения есть, но не серьёзные.

Серьёзные - это, к примеру, решить проблему с вирусами (хаос в установке ПО), обновлением ПО (отсутствие репозитария ВСЕГО ПО, невозможность удалять/заменять файл, открытый на запись/исполнение), проблему dll-hell, нормальный удалённый терминал к рабочим машинам и серверам (powershell слишком сложен для скриптового языка, хотя кому-то наверно и подходит. Пусть так - одно сделали, хотя практика покажет), убрать сложность (более 3000 системных вызовов + недокументированные - это слишком. 300 линуксовых и то избыток, порождённый несовершенной архитектурой), ну и ещё момент. Платформа, а ОС - это платформа, должна быть открытой и свободной - ни монополии, ни платы, ни закрытого кода. Основа должна быть открытой, как букварь или таблица умножения.

Вот это серьёзные изменения. А очередные новые VPN, шифрование дисков, рукописный ввод, QOS на основе URL... Ну да, прикольно, но на фоне тех проблем OС Windows, которые я описал выше - мелковато. Хотя кода в количественном выражении может быть много - да.

23.08.11 14:52
0
Не в сети

> И сложно не согласиться, что со времён DOS или Win95 стало хуже
И сложно не согласиться, что со времён DOS или Win95 стало ЛУЧШЕ

23.08.11 14:53
0
Для возможности комментировать войдите в 1 клик через

По теме

Акции MSFT
309.16 0.00
Акции торгуются с 17:30 до 00:00 по Москве
Все права принадлежат © ms insider @thevista.ru, 2020
Сайт является источником уникальной информации о семействе операционных систем Windows и других продуктах Microsoft. Перепечатка материалов возможна только с разрешения редакции.
Работает на WMS 2.34 (Страница создана за 0.075 секунд (Общее время SQL: 0.04 секунд - SQL запросов: 115 - Среднее время SQL: 0.00035 секунд))
Top.Mail.Ru