Google внедряет механизм ранжирования на основе peer-to-peer

Author:

Вячеслав Ансимов

Компания i5 Digital LLC собирается внедрить в популярную поисковую систему Google новый механизм ранжирования результатов поиска, базирующийся на peer-to-peer (P2P) технологии, позаимствованной у Gnutella, — сообщает ZDNet News.

I5 Digital из города Сиэтл (штат Вашингтон) анонсировала свой проект под названием Pandango в начале декабря прошлого года. Компания ставила задачу разработать высокоэффективный способ определения релевантности результатов поиска на основе стремительно набирающей популярность технологии распределенных одноранговых сетей (P2P) и методов коллаборационной фильтрации. Как выяснилось, данные методы очень хорошо подходят для определения индекса цитирования веб-страниц. По этому показателю осуществляется ранжирование, то есть распределение по релевантности, результатов поиска в веб-каталогах Google и «Яндекс».

Общий интерес к потенциалу Pandango руководством Google был проявлен. Система, действительно, обеспечивает более высокую релевантность. Однако в декабре Google все же скептически отнеслась к участию в проекте, полагая, что разработанный механизм не защищен от искусственных накруток индекса цитирования владельцами ресурсов. Кроме того, имелись сомнения в скорости P2P-системы, которая, согласно предложенному алгоритму, по каждому запросу должна просканировать 1 миллион компьютеров.

Как сообщила I5 Digital, поисковый протокол совершенствовался. Используя язык XML, удалось добиться высокой компактности запросов, что увеличило скорость поиска при той же глубине. Тем не менее, не все сомнения Google отпали. Остается спорным вопрос о готовности людей предоставлять доступ к своим компьютерам.

Применение коллаборационной фильтрации для уточнения релевантности предполагает использование результатов поиска других пользователей, делавших аналогичный запрос. Этот метод широко используется в настоящее время, например, такими компаниями, как Amazon, для предоставления клиенту рекомендаций при выборе покупки. Человеку, остановившему свое внимание на конкретной книге, сообщается, какие еще книги читают другие покупатели этой книжки.

I5 Digital запатентовала свою технологию. Помимо Google компания собирается продавать Pandango всем заинтересованным компаниям. P2P-алгоритм Pandango позаимствован у системы обмена файлами Gnutella. В отличие от Napster, она не имеет центрального сервера, отключение которого привело бы к потере контроля над системой. С другой стороны, помимо живучести, особенность децентрализованных Gnutellla-подобных систем состоит в их самостоятельности. После запуска их создатели в значительной мере теряют контроль на системой. Поэтому вопрос извлечения прибыли является для разработчиков непростым.

Pandango — не первая попытка создать поисковую систему на P2P-технологии. Сама Gnutella, а именно «Группа разработчиков Gnutella Next Generation» в сентябре обнародовала свои планы по созданию новой поисковой системы gPulp.

ССЫЛКИ ПО ТЕМЕ


P2P search engine sets sites on Google — ZDNet News, 26.02.01

Project Pandango Peer Web Search Announced — Peertal, 05.12.00

Start-Up Hatches Peer-To-Peer System To Query The Web — ZDNet News, 18.12.00

МАТЕРИАЛЫ ПО ТЕМЕ


«Яндекс» выдает результаты поиска по-новому16.10.00


Новая поисковая система gPulp (ранее Gnutella Next Generation) перевернет Интернет19.09.00