Разделы
- Главная страница
- Новости
- Краткий исторический экскурс
- Эра динозавров
- Гигантские растительноядные динозавры
- Устрашающие хищные динозавры
- Удивительные птиценогие динозавры
- Вооруженные рогами, шипами и панцирями
- Характерные признаки динозавров
- Загадка гибели динозавров
- Публикации
- Интересные ссылки
- Статьи
- Архив
IBM создала поисковый движок для неграмотных
Замена текстовой Сети голосовой обрела популярность в развивающихся странах, где население в большинстве своём малограмотное и технически неподкованное.
Ранее компания IBM разработала сеть голосовых сайтов для жителей нескольких штатов Индии, а также для Таиланда и Бразилии. А сейчас этот любопытный проект вошёл в новую стадию: специалисты придумали голосовой поисковик для навигации по разросшейся сети.
Ныне необычным подобием Интернета под названием Spoken Web пользуются около 10 тысяч человек, но в будущем сеть, управляемая голосом и выдающая информацию исключительно в виде звуков, может охватить пятую часть населения планеты. По подсчётам специалистов, именно столько людей в мире не умеет читать.
Жители перечисленных выше стран используют телефонные номера как аналог адресов в Сети. Набирая определённый номер, они попадают на голосовой сайт, на котором могут узнать, к примеру, последние цены на зерно или прослушать объявления о доступных вакансиях.
«По мере роста числа голосовых сайтов и увеличения их содержимого встаёт проблема: людям необходимо быстро сориентироваться и найти то, что им нужно», — объясняет Нитендра Раджпут (Nitendra Rajput), сотрудник IBM Research India, один из родоначальников Spoken Web.
Сейчас любому человеку, желающему создать свой голосовой сайт, предлагается придумать ему название и поделить его на информационные разделы. Чтобы сориентироваться в них, человек использует автоматическую телефонную систему, принимающую голосовые команды.
Но выслушивать массу ненужной информации нудно и к тому же дорого, не говоря уже о том, что сначала необходимо выбрать нужный сайт из десятка (а иногда и больше) похожих.
Голосовой Интернет в пробном режиме работает уже четыре года. В первые же 8 месяцев работы пилотного проекта в сельской местности Индии услугами «устной сети» воспользовались более 6,5 тысяч человек, посетившие соответствующие сайты около 114 тысяч раз (иллюстрация Neeraj Yuvraj/Flickr.com).
Чтобы ускорить процесс, разработчики создали новый движок. Классический вариант голосового поиска здесь не подходит. Человек, который проговорил в телефонную трубку название нужного ему пестицида, не станет выслушивать перечисление 20 результатов поиска. Он их попросту не запомнит.
Значит, нужно максимально сузить параметры запроса и свести выводимую информацию к пяти или менее пунктам, решили авторы системы. Теперь пользователя просят отфильтровать нужное: назвать имя человека, создавшего голосовой сайт, место, где он был создан, а также уточнить рубрику, в которую был помещён сайт (например, выбрать между «новостями» и «вопросами и ответами»). Из пяти результатов выбрать искомый портал гораздо проще.
Сейчас новую технологию опробуют на фермерах индийского штата Гуджарат. Сотрудники IBM уже готовы предложить новый инструмент всем пользователям Spoken Web, но отмечают, что для дальнейшего развития сети необходимы новые решения.
Например, ускорить процесс поиска может «умная» система, которая проматывает звуковую информацию в ускоренном в 10 раз режиме, останавливаясь лишь на ключевых словах запроса. Сейчас человек может воспользоваться подобной перемоткой, но остановки ему приходится делать самостоятельно.
Хорошо бы обучить систему саму определять, какие слова или фразы важны для слушателя. Для этого необходимо набрать статистику и проанализировать поведение пользователей, останавливающих и ускоряющих «чтение» сайтов.
Сейчас Spoken Web, по сути, не имеет никакого отношения к Всемирной паутине. Кроме того, пользователи голосовой сети, как правило, интересуются местными сайтами и новостями. Но разработчики из IBM надеются, что в дальнейшем (по мере совершенствования поисковых механизмов) необходимая информация из «общей» сети всё же начнёт появляться и в голосовой.
«Мы можем перенести данные с помощью API-вызовов и технологий, преобразующих текст в речь, — говорит Раджпут. — Но их также нужно будет перевести на нужный язык, а с этим за пределами англоязычной части Интернета проблемы».