«Рамблер» рассказывает о своем новом поисковом ядре

Author:

В секции «Интернет-порталы и технологии поиска» на РИФе-2001 исполнительный директор компании «Рамблер» Игорь Ашманов рассказал об особенностях нового поискового ядра компании — Rambler.2.0.

Новое ядро было написано командой разработчиков «Рамблера» в декабре 2000 года, а в январе 2001 началось его бета-тестирование, которое продолжается и сейчас. Весь 2000 год, по признанию Игоря Ашманова, поиск был в «Рамблере» больным местом. Старое ядро было написано еще в 1996 году. До конца 1999 года над ним работал всего один человек — один из создателей «Рамблера» Дмитрий Крюков. И к началу 2000 года «рамблеровский» поиск существенно отставал от конкурентов — «Яндекса» и «Апорта«.

К разработке нового ядра команда из 10 разработчиков приступила летом 2000 года. Старое ядро не обеспечивало хорошую релевантность поиска по нескольким причинам:

  • Отсутствие координат слов (поисковику было все равно, насколько далеко друг от друга в тексте расположены слова, заданные в запросе).
  • Отсутствие морфологии (поиска по словоформам).
  • Отсутствие связи с каталогом (что автоматически обеспечивает более высокую релевантность, так как каталог обладает релевантные аннотациями).
  • Выдача реультатов поска «по документам», а не по сайтам.
  • Отсутствие поиска по числам.

В новом ядре все эти недостатки были исправлены. Rambler.2.0. учитывает координаты слов, обучен русской и английской морфологии, связывает поиск с каталогом Top100, распознает темы, чтобы связывать результаты поиска с другими разделами портала, группирует результаты поиска по сайтам, ищет по числам. Составлен тезаурус запросов, с помощью которого выделяются темы запросов. В тезаурусе сейчас — 1600 рубрик. Внедрение тезауруса позволило «Рамблеру» поднять посещаемость портала. «Перевязки» на дргуие разделы портала, которые выдаются вместе с результатами поиска, обеспечивают примерно 20 процентов общей посещаемости разделов Rambler.ru. Их средний CTR 4 процента. Надо отметить, что «Яндекс» уже давно связывает результаты поиска со своим каталогам, и делает также поиск по новостям и по товарам. Кроме того, в «Яндексе» функционирует синтаксический анализ запросов.

Итог своей работы «Рамблер» оценивает как удовлетворительный. О чем говорят и цифры. За последние 2 месяца количество уникальных пользователей «Рамблера» увеличилось на 30 процентов (январь 2001 — 105-110 тысяч пользователей в сутки, март — 140-150 тысяч пользователей в сутки).

«Рамблер» предоставил и результаты внутреннего сравнения релевантности различных поисковиков. Исследование проводилось лингвистами по итогам результатов поиска различных поисковиков по одним и тем же запросам. Результаты представлены в следующей таблице.

«Апорт» «Рамблер» «Яндекс»
февраль 2000 0,959 0,643 0,845
24.11.2000 0,992 0,903 0,960
29.12.2000 0,992 0,922 0,960
28.02.2001 0,992 0,956 0,960

Цифры свидетельствуют о том, что за последний год не произошло никаких изменений у опережавшего всех в начале прошлого года «Апорта». «Яндекс» и «Рамблер» развивали свой поиск, и релевантность обоих движков сейчас сравнима. Скачок, произошедший в «Рамблере» в ноябре, связан с тем, что некоторые из нововведений в это время уже внедрялись в старый движок.

Количество поисковых запросов на «Рамблере» и «Яндексе» в сутки представители компаний оценивали примерно одинаково — в 800 тысяч. Из игры за звание лучшего российского поисковика сейчас постепенно выбывает «Апорт». Этот год, наверняка, продемонстрирует пользователям Рунета активную конкурентную борьбу на поисковом поле «Рамблера» и «Яндекса».