Динозавры и история жизни на Земле

Статистика




Яндекс.Метрика




Проблемы поисковых машин в Сети решат сами пользователи

Психологи помогают людям бороться с их проблемами, принимать правильные решения. Поисковые машины по большому счету делают то же самое - помогают делать правильный выбор

Официальная должность Дугласа Меррилла - вице-президент Google по разработкам. Но по факту он IT-директор этой компании. Интересно, что у этого IT-директора нет технического образования, зато есть докторская степень по психологии. Впрочем, название специализации Меррилла звучит вполне технически - "искусственный интеллект". Самого вице-президента мало смущает противоречие между его работой и научной степенью: "Психологи помогают людям бороться с их проблемами, принимать правильные решения. Поисковые машины по большому счету делают то же самое - помогают делать правильный выбор".

Найдется все

Ближайшие 20 лет будут очень интересными в развитии поисковых технологий, уверяет Меррилл. "Почти 10 лет назад, в 1998 г., когда возникла Google, все решили, что проблема поиска в Сети решена, - вспоминает он. - Дескать, надо просто описывать каждый новый сайт несколькими ключевыми словами, и этого будет достаточно для полноценного интернет-серфинга". Между тем каждый месяц содержание англоязычного Интернета меняется на 10%. "Чтобы индексировать все новые сайты, да еще и на сотне языков, нужно, чтобы ваш штат удваивался каждый год, а население нескольких стран работало только на вас", - говорит Меррилл.

Чтобы выдавать точные результаты, эффективнее и интереснее анализировать то, как пользователи ведут поиск в Сети. Если, забив в поисковик слово "Африка", они остановились на каком-то сайте, значит, тот рассказывает об Африке. Чем больше людей сделают то же самое, тем выше в результатах поиска будет этот сайт. "Может, для кого-то это звучит примитивно, - говорит вице-президент Google, - но будущее поиска связано именно с методичным изучением поведения интернет-пользователей. Не стоит изобретать велосипед и заставлять людей самих описывать все новые сайты, которые они посещают".

А что же распиаренная концепия Web 2.0, которая как раз предполагает максимальное участие самих пользователей? "Web 2.0 - великий феномен, - отвечает Меррилл, - но сообщества пользователей не смогут заменить огромные компьютеры, которые ежесекундно запоминают и анализируют путь пользователя в Интернете".

Благодаря тем огромным массивам информации о посетителях Сети, которые глобальные поисковики ежедневно получают в свое распоряжение, неуклонно будет расти их преимущество перед небольшими интернет-компаниями. С другой стороны, локальные поисковики порой обладают лучшей релевантностью поиска, потому что говорят с пользователями на их языке. Но первоклассное владение морфологией нескольких десятков мировых языков для глобальных поисковиков - это, можно сказать, задача вчерашнего дня. Важно не просто понимать язык пользователя, важно помочь ему найти информацию на языке, которого он не знает. Например, перевести запрос китайского студента о творчестве Ганди на хинди, чтобы он мог получить доступ к индийской части Интернета.

Уже сейчас, забив в строку поиска Pushkin, любой англичанин найдет слова стихотворения "Я помню чудное мгновенье…" на русском. А через несколько лет эти строки будут доступны ему уже на английском. В мире, который все больше похож на глобальную деревню, такой перевод будет все больше востребован, уверяет Меррилл.

Поисковики буквально на глазах будут становиться все умнее и умнее. Они станут не только переводить слова, но и учитывать местную специфику запроса. Американец и русский получат разные результаты, забив в строку поиска слово "футбол", ведь первый, скорее всего, будет иметь в виду национальную игру с продолговатым мячом.

Это вовсе не значит, что поисковик будет обладать искусственным интеллектом, который и подскажет ему такой алгоритм. Как кропотливые муравьи, каждый день миллионы пользователей будут сами находить связи между разными кусками Сети. Поисковику останется лишь фиксировать их.

Самое важное для поисковиков в будущем - научиться интерпретировать запросы пользователей на базе имеющихся данных. Понимать, к примеру, что, когда пользователь ищет "самую большую гору в мире", он имеет в виду не ее вес, а высоту.

Понять клиента

Чтобы быть успешным в будущем, Google надо собирать все больше информации о своих пользователях, лучше понимать их запросы. У наблюдателей это вызывает множество опасений: компания сама может злоупотреблять подобными сведениями и продавать их на рынке, а может стать жертвой хакеров.

Меррилл указывает, что хакеры угрожают любой IT-компании. А Google особенно тщательно заботится о защите своих данных. Компания даже не сообщает о количестве и точном местоположении серверов, на которых хранится такая информация. Также, по словам Меррилла, речи не идет о том, чтобы в будущем торговать данными о своих пользователях: "Иначе кто станет искать через нас информацию?"

В ближайшие годы, уверяет он, утихнут и споры вокруг вторжения поисковиков в область чужой интеллектуальной собственности. За последние два года Google много раз обвиняли в нарушении авторских прав. Сначала это были американские литературные ассоциации, протестовавшие против проекта Google Book Search, который позволяет вести поиск по книжным текстам. Потом протестовали издатели газет, журналов и новостных агентств. Последние обвиняли компанию в том, что она лишает их части прибыли, собирая в своем разделе "Новости" самые свежие и интересные тексты. Скоро и те и другие осознают, надеется Меррилл, что поисковики не размещают на этих страницах рекламы и скорее приводят к ним читателей, а не отбирают.