



Microsoft внедрит систему распознавания речи в широкий перечень своих продуктов
Microsoft активно работает над технологией распознавания речи, которая в будущем станет частью Windows 8, Windows Phone, Bing, Kinect, и быть может, Windows Azure.
Windows Phone Mango уже получил набор функционала для обработки голоса, в числе которого наиболее примечательна функция перевода живой речи в текст и наоборот. Уже осенью Kinect обзаведется возможностями распознавания, что позволит производить поиск фильмов, телепередач, музыки и прочего цифрового контента в системе Bing при помощи голоса. А в следующем году подобные возможности получат и другие продукты Microsoft.
Если говорить о Windows 7, то на сегодня

Вообще, сфера работ Microsoft Tellme простирается дальше одних технологий распознавания голоса, заметил Букштейн. Когда Стив Баллмер (Steve Ballmer) объявил, что в скором времени Bing сможет обрабатывать голосовые запросы разной сложности, он не упомянул об устройстве этой технологии. На самом деле, это связь из трех компонентов: система распознавания речи, поисковой движок Bing и механизм, извлекающий информацию о ваших социальных связях из Windows Live (Windows Live может выступать в качестве социального графа сетей FaceBook, LinkedIn и Twitter, пояснил Букштейн).
9 августа Microsoft опубликовала небольшой промо-ролик, в котором рассказывается о повседневных сценариях, которые могут кардинально поменяться с приходом технологий Tellme:
Взять обычный пример: нужно пригласить некоего вашего друга на совместный обед. Microsoft обещает, что уже через 3-4 года их технологии будут в состоянии в этом вам помочь. Нужно будет лишь сказать компьютеру: "Во вторник нужно устроить обед с Иваном Ивановичем", и система уже сама распознает запрос, подключится к вашим аккаунтам в соц. сетях, найдет того самого "Ивана Ивановича" с которым вы хотите пообедать, сверит ваши с ним графики и поищет через Bing рестораны, пользуясь списками ваших предпочтений.
В блоге Tellme можно увидеть их собственное видение будущего слияния голосовых сервисов и Bing, Windows, соц. сетей:
"В будущем все сервисы будут понимать ваши потребности, учитывать предпочтения, политику приватности, социальные связи и все другие критерии, которые определяют нужный результат. В то время как вы будете общаться с техникой на
"Понимание потребностей пользователя" имеет большое значение для персонализации Bing, сказал Букштейн. И Tellme здесь отведена далеко не последняя роль, поскольку объемы данных, которые обрабатывает команда для совершенствования обработчика голоса, поистине колоссальны. Tellme анализирует около 11 миллиардов вариантов различных произношений в год.
Подразделение Tellme работает как над долгосрочными перспективными проектами, так и над более краткосрочными задачами. В частности, внутри отделения есть команда, работающая над интерактивными системами телефонных сообщений (IVR - англ. Interactive Voice Response), которые маршрутизируют звонки внутри call-центров; команда, которая занята внедрением API голосовой технологии в Windows Phone, что позволит разрабатывать приложения, пользующиеся возможностью распознавания голоса для Windows Phone, (хотя, когда результаты работы последней станут доступны широкой публике, Букштейн не сообщил) и другие команды.
Ко всему прочему, Tellme планирует добавить поддержку распознавания голоса и в Windows Azure. В результате можно будет ожидать появления IVR-ориентированных сервисов, работающих на Windows Azure. На сегодня о сроках реализации совсем ничего не известно, но даже если Windows Azure никогда не получит такой возможности, сервис Tellme в любом случае появится для сторонних компаний, разрабатывающих свои облачные сервисы.
Итак, действительно ли речевые технологии - недооцененная область NUI? Позволит ли работа Microsoft в этой области обогнать конкурентов, покажет только время.
Источник:
Перевод: VizerEx
Комментарии
Мы не в пролете, мы типа "в планах"... как я понимаю в долгосрочных.
Эта страна будет в пролете до тех пор, покуда тут воруют чаще, чем покупают
Эта страна всегда будет в пролете, пока не сделает свою операционную систему с блекдж.. и шл..
Эта страна уже собирается сделать свою национальную ОС на базе Линукса,но с вероятностью 90% деньги просто разворуют и нихрена не сделают.
Не 90%, а 100% и даже больше. Не в первый раз уже так.
А что насчет распознавания речи русской, то было б здорово конечно.
"Своя ос на базе линупса" это вообще смешно кстати. Мало всяких линупсов чтоли? Надо ещё один сделать?
А насчет воруют/покупают и этой страны, тут как посмотреть. Есть например и за пределами этой страны дофига русскоговорящих, которым бы не помешали функции, поддерживающие их язык.
ProVal, если они живут за пределами этой страны, предполагается, что и говорят они на языке той страны, в которой живут.
Русский язык просто распознавать сложнее,чем английский.В основном такая беда из-за окончаний слов,которых у нас много.
Так что учим английский,переключаем язык на инглиш и развлекаемся.
ни за что, инглишь выучить и можно, но использовать его в повседневном общении, работе за пк и др. ни за что =)
2:30
Пусть тут полежит, видео годичной давности
Про распознавание голоса пишется в маркетинговых материалах Microsoft с каждой версией Windows, начиная с бета-версий Chicago (Windows 95). Это светлое будущее они обещают уже пятнадцать лет - вот ещё немного, вот ещё чуть-чуть, вот купите ещё более мощный компьютер - а мы когда-нибудь в будущем сотворим распознавание голоса.
Мой телефон прекрасно, чётко и безошибочно распознаёт, кому я хочу позвонить или какой трек прослушать - когда я за рулём и пользуюсь синезубой гарнитурой. То есть там, где это действительно необходимо. А рассказывать конечному потребителю про корпоративные системы для call-центров - несколько нечестно.
Как-то так.
ну ничего, мультитач тоже почти 30 лет назад появился ;)
Корпаративными системами для колл-центров пользуются тоже конечные потребители. Вопрос был в том, что МС Русский не распознает, там распознает, система появилась позже семерки так что есть все шасы на будущую продукцию.
Кстати есть маркетинговые материалы, а есть исследовательские публикации раскрученные журналистами, как-то так
ad1, если так подумать то и вертолет с танком придумал Леонардо, давайте следовать традициям!
Я правильно понял что работать это будет через интернет? Голос записывается, отправляется на сервера MS, анализируется, результат присылается обратно...
А вообще интересно что такие технологии нам обещают год от года. Появляются сотни видео в которых мы видим красивые компьютеры и интерфейсы неалекого будущего ("через 3 - 4 года"), а в итоге получаем куцый метро либо смесь aero с лентами и разработчиков соревнующихся в "кто сделает программу уродливее".
Вот-вот. Именно, что каждый год такие обещания.
Помню, что самый первый набор команд ММХ Intel именно так и подавала - мол компьютер заговорит и будет понимать человеческую речь. Что-то не заметно, чтобы это стало широко использоваться до сих пор, хотя всяческих "расширений" команд процессора наштамповали уже туеву хучу.
Заскриптовать всё нельзя. Чтобы действительно понимать - нужен искуственный интелект, которого нет и не особо придвидится.
А скрипто-конструкции вида: "Компьютер-найди-интернет-фраза_для_поиска", "Компьютер-настройка-будильник-утро-семь-ноль-ноль" можно нашлёпать и сейчас, только толку от них - так, побаловаться.
Года 4 назад видел в интернетеописание подобного управления. Сскрипты просто писались на баше. Сам же рисовал себе на баше же анализ и чтение почты через фестиваль. Реально? Да - годы уже как. Вот только это всё частный случай и редко когда нужно и не в том виде, который всё время обещают.
Маркетинг одним словом. Если не назвать жёсче и правдивее...
С другой стороны - пользователи хотят "революции" от каждой новой виндоуз. Ждут, жаждут, мечтают. И отдел маркетинга обещает её. Отдел кодинга последовательно меняет квадратное оформление на круглое, круглое на квадратное, цветастое на одноцветное и одноцветное на цветастое.
потому что даже если поменять что-то реально серьёзное, архитектуру, в корне (что не мешало бы), то ПО не будет работать, разве что через виртуальную машину, а это потери производительности - проще будет оставить старую винду и "подождать пока перепишут весь софт под новую". В результате использование такой революционной ОС будет близко к нулю.
Если не менять - покупать не будут. А зачем?
Тогда остаётся менять что-то несерьёзное, но заметное (кнопочки, обои, диалоги настройки, иконки, эффекты перелистывания окошек, звуки, экран загрузки и т.д.) и рекламировать ОС погромче. Пусть и одним и тем же слоганом, не меняющимся с 95-й винды.
Хотя есть и варианты. Выпустить тормозную прослойку между железом и ПО, а потом выпустить следующую версию прослойки (ОС), но уже не такую тормознутую - "шуструю", как любят говорить. И вот - вроде как есть прогресс.
Как уровень жизни в отчётах Росстата - считают как нам стало лучше по сравнению с 2000-м годом, не учитывая, как нам стало хуже жить по сравнению с 80-ми годами.
Местами толсто.
Изменения всегда внутри, а не снаружи. Судить об изменениях по кнопочкам - это толсто и вообще из разряда линуксизма.
Только у линупсят регулярное "система до лохов", "да у вас свистелки и перделки", "да у вас эффектов нет", "обои скучные" и т.д.
Голосовое распознавание для этой страны есть, как и виртуальные дикторы, но их делают не в MS, а в других конторах. И самое печальное то, что их продукты не пользуются большой популярностью - их пиратят, но не покупают, а выйти на мировой рынок такие конторы просто не могут. Результат очевиден.
> Изменения всегда внутри, а не снаружи.
Насчёт "всегда" - вы как минимум сразу перегнули. Не было бы такой суеты с интерфейсами.
Насчёт "внутри". Ну например чем кардинально W7 отличается от Vista? Внутри.
Приведите пример, если не сложно.
Например новые ФС, usb 3, mesh-сети, кластеризация, HA-функции (высокодоступные кластерные решения) и т.п.
Может и есть, скорее всего, но почему в большинстве описаний делается акцент на новые обои, аватарку в панели задач, изменённые диалоги настройки какой-нибудь мелочи и т.п. мелочь?!
Не знаю, может у меня складывается только (описанное выше) впечатление...
> Только у линупсят регулярное "система до лохов", "да у вас свистелки и перделки", "да у вас эффектов нет", "обои скучные" и т.д.
Когда кончаются аргументы - начинаются оскорбления.
_Serega_ писал:Может и есть, скорее всего, но почему в большинстве описаний делается акцент на новые обои, аватарку в панели задач, изменённые диалоги настройки какой-нибудь мелочи и т.п. мелочь?!
Приведите пример такого описания. А пока это лишь Ваше собственное представление о W7
> Приведите пример такого описания. А пока это лишь Ваше собственное представление о W7
Пожалуйста.
Большое описание рыбки, анимаций, диалогов. Частичное упоминание возможности виртуализации и ещё пары "фич".
Сравните с обычным очередным обновлением ядра:
Каждому своё конечно. И я могу понять это. Если бы не одно "но". Проходя мимо напёрсточника и людей вокруг него - можно спокойно поглядеть и сказать: "Каждому своё". А можно всё таки обратить внимание сомнивающихся, на обман. Вроде как и нет выгоды, не должен был бы - кто-то даже крикнет, что "опять эти искатели правды!".
Ну а что же делать, если не все понимают, что добро и дарение - это хорошо, а эгоизм и обман, навязывание и подсаживание на иглу - это плохо. Что такое хорошо и что такое плохо как выясняется люди могут и до старости не понимать. Но люди учатся - и это хорошо.
А мы тут обсуждаем факты, а не веру. Факты наличия описания фич, как минимум. А не оскорбления и ненависть к странному слову "линупс".
Кстати, в разговоре не прав тот, кто кричит. Если вы нервничаете, значит вы сами сомниваетесь и это хорошо. Человек должен сомниваться - он должен проверять САМ и думать своей головой, сопоставляя факты, даже если это неприятно и вызывает "дискомфорт".
_Serega_ писал:Пожалуйста.
Столько всего написали, а на вопрос так и не ответили Приведите пример описания Windows 7, где упоминаются только обои и анимация.
_Serega_ писал:Кстати, в разговоре не прав тот, кто кричит. Если вы нервничаете, значит вы сами сомниваетесь и это хорошо. Человек должен сомниваться - он должен проверять САМ и думать своей головой, сопоставляя факты, даже если это неприятно и вызывает "дискомфорт".
Это Вы сами с собой разговариваете?
denominator
Чуть больше чем обои и анимация, но опять же после тщательного изучения сайта MS не вижу ни одной причины чтобы обновить Vista до 7.
Сравните с описанием Lion:
SunsetBlvd писал:Чуть больше чем обои и анимация
Чуть больше.... всего раз в 50-100 больше. А так, почти только обои и анимация
SunsetBlvd писал:не вижу ни одной причины чтобы обновить Vista до 7.
Это Ваше личное мнение и не имеет отношения к данному разговору.
SunsetBlvd писал:Сравните с описанием Lion
Сравнил. Примерно одинаковое количество изменений. Надеюсь Вы прошлись по всему трехуровневому описанию возможностей Windows 7, которые для Lion представлены на одной странице...
denominator
Прошёлся по всем. Половина - повторение изменений из Vista. Есть и Windows Speech Recognition now works better—and with more programs. So instead of using the keyboard, you can just tell your computer what to do. Start an e-mail by speaking the recipient's name, surf the web without a keyboard, or dictate your documents.
Более того, открываем страничку Windows Vista и... Speech Recognition in Windows Vista allows you to interact with your computer by voice. With Windows Speech Recognition, you can dictate documents and e-mail in mainstream applications, use voice commands to start and switch between applications, control the operating system, and fill out forms on the web.
Предсказываю описание на страничке Windows 8 We present you new Voice Recognition powered by TellMe. Now you can simplify your daily life by controlling your PC with your voice. Dictate documents, open programs and call your friends without even touching your PC!*
* This feature is avaliable only in U.S. and some European countries. Internet connection required.
_serega_ писал:Насчёт "внутри". Ну например чем кардинально W7 отличается от Vista? Внутри.
Приведите пример, если не сложно
[url]http://technet.microsoft.com/en-us/library/dd349334(WS.10).aspx[/url] Надеюсь, к новому году закончите читать?
sunsetblvd,
Читаю "новые фичи" кошачьего. Вот например: Captive network When connecting to a network that requires authentication, Lion presents a window allowing you to log in to the network. Что может означать это - фиг поймешь. Я не думаю, что раньше в mac osx не было окошка для ввода пароля. Или?
P.s.: кстати, большинство новых фич относятся к обычным сторонним приложениям (по классификации МС. Например Windows Live) Но им (МС) же низзя - набегут очередные обиженные и будут требовать выпустить Windows версии NNN без очередной фичи. А эпплу можно...
> [url]http://technet.microsoft.com/en-us/library/dd349334(WS.10).aspx[/url] Надеюсь, к новому году закончите читать?
Да, вы правы. Безусловно много нужно там читать. Ну, я постораюсь, насколько смогу
Хотя заранее соглашусь, что изменений много и я был не совсем прав. Признаюсь.
Тем не менее, есть некоторые но. Начнём.
1. AppLocker - ну, наверно полезная штука. Но как попытка подставить подставку под неверную архитектуру. Объясню. Проблема в хаосе ПО в виндоуз. И отсутствии централизованного репозитария ПО, определённого хаоса в логике дерева ФС. Например: в gentoo все бинарники игр имеют группу games. Только пользователи, входящие в эту группу могут запускать игры. И т.п. То же касается доступа к usb, cdrom и т.д. - на всё есть своя группа. Всё и гибко и просто.
Но, повторюсь, для Windows - это шаг. Так что вы правы.
2. Биометрия. Большое дело. Серьёзное. И бесполезное. Простите уж. Вся биометрия - это маркетинг большой. Доказано многими людьми. Тум и авторизация по слепку отпечатка пальца и по фотографии вместо лица и т.д. Несерьёзно, но забавно.
3. Сертификаты.
>These changes enable new certificate enrollment scenarios that allow organizations to expand the accessibility of existing public key infrastructure (PKI) deployments and reduce the number of certification authorities (CAs).
>Improvements to the certificate selection user interface and filtering logic provide a simplified user experience when an application presents multiple certificates.
Новые сценарии использования сертификатов и новые диалоги. Ну, наверно... В общем, мелкие правки кода.
4. Deployment Tools. Да, наверно тут мне нечего сказать. Не знаю, чтобы ранее в Windows такое было.
5. New in Networking
Внедрение несовместимостей и велосипедов в виде DirectAccess тоже как-то вызывает вопросы.
Хотя в остальном, да, действительно понаписано много. Вы правы и мой тезис о лишь внешних изменениях был неверен.
Но, опять же повторю свою мысль, что именно на этом сайте, зачастую описания касаются только интерфейса. Градиентов, аватарок, экрана загрузки и т.д. Вы можете сказать, что это субъективное моё мнение и будете правы - оно действительно субъективно - иначе и быть не может в такой ситуации.
Получается windows тоже развивается. Много полезных изменений. И сложно не согласиться, что со времён DOS или Win95 стало хуже (кроме разве что системных требований). Да, windows становится лучше относительно прошлых версий.
Уходят ли архитектурные проблемы и ошибки дизайна? Нет. И причины всё те же - сломается совместимость с ПО. Т.е. изменения есть, но не серьёзные.
Серьёзные - это, к примеру, решить проблему с вирусами (хаос в установке ПО), обновлением ПО (отсутствие репозитария ВСЕГО ПО, невозможность удалять/заменять файл, открытый на запись/исполнение), проблему dll-hell, нормальный удалённый терминал к рабочим машинам и серверам (powershell слишком сложен для скриптового языка, хотя кому-то наверно и подходит. Пусть так - одно сделали, хотя практика покажет), убрать сложность (более 3000 системных вызовов + недокументированные - это слишком. 300 линуксовых и то избыток, порождённый несовершенной архитектурой), ну и ещё момент. Платформа, а ОС - это платформа, должна быть открытой и свободной - ни монополии, ни платы, ни закрытого кода. Основа должна быть открытой, как букварь или таблица умножения.
Вот это серьёзные изменения. А очередные новые VPN, шифрование дисков, рукописный ввод, QOS на основе URL... Ну да, прикольно, но на фоне тех проблем OС Windows, которые я описал выше - мелковато. Хотя кода в количественном выражении может быть много - да.
> И сложно не согласиться, что со времён DOS или Win95 стало хуже
И сложно не согласиться, что со времён DOS или Win95 стало ЛУЧШЕ
По теме
- Началось бета-тестирование Google Play Games для Windows
- В Microsoft Store доступна новая версия настольного Telegram
- Соглашение Microsoft и Qualcomm подходит к концу
- Microsoft применит Ethereum для борьбы с пиратством
- Microsoft внедряет естественный английский язык в программировании для Power Apps
- Microsoft присоединяется к Compat2021
- Запуск Windows-приложений в Chrome OS будет доступен без Интернета
- Представлены Microsoft Teams Displays от партнеров компании
- В Chrome OS появится поддержка приложений Windows
- Microsoft: около 150 миллионов пользователей отказались от паролей