“Рамблер” рассказывает о своем новом поисковом ядре

Author:

В секции “Интернет-порталы и технологии поиска” на РИФе-2001 исполнительный директор компании “Рамблер” Игорь Ашманов рассказал об особенностях нового поискового ядра компании – Rambler.2.0.

Новое ядро было написано командой разработчиков “Рамблера” в декабре 2000 года, а в январе 2001 началось его бета-тестирование, которое продолжается и сейчас. Весь 2000 год, по признанию Игоря Ашманова, поиск был в “Рамблере” больным местом. Старое ядро было написано еще в 1996 году. До конца 1999 года над ним работал всего один человек – один из создателей “Рамблера” Дмитрий Крюков. И к началу 2000 года “рамблеровский” поиск существенно отставал от конкурентов – “Яндекса” и “Апорта“.

К разработке нового ядра команда из 10 разработчиков приступила летом 2000 года. Старое ядро не обеспечивало хорошую релевантность поиска по нескольким причинам:

  • Отсутствие координат слов (поисковику было все равно, насколько далеко друг от друга в тексте расположены слова, заданные в запросе).
  • Отсутствие морфологии (поиска по словоформам).
  • Отсутствие связи с каталогом (что автоматически обеспечивает более высокую релевантность, так как каталог обладает релевантные аннотациями).
  • Выдача реультатов поска “по документам”, а не по сайтам.
  • Отсутствие поиска по числам.

В новом ядре все эти недостатки были исправлены. Rambler.2.0. учитывает координаты слов, обучен русской и английской морфологии, связывает поиск с каталогом Top100, распознает темы, чтобы связывать результаты поиска с другими разделами портала, группирует результаты поиска по сайтам, ищет по числам. Составлен тезаурус запросов, с помощью которого выделяются темы запросов. В тезаурусе сейчас – 1600 рубрик. Внедрение тезауруса позволило “Рамблеру” поднять посещаемость портала. “Перевязки” на дргуие разделы портала, которые выдаются вместе с результатами поиска, обеспечивают примерно 20 процентов общей посещаемости разделов Rambler.ru. Их средний CTR 4 процента. Надо отметить, что “Яндекс” уже давно связывает результаты поиска со своим каталогам, и делает также поиск по новостям и по товарам. Кроме того, в “Яндексе” функционирует синтаксический анализ запросов.

Итог своей работы “Рамблер” оценивает как удовлетворительный. О чем говорят и цифры. За последние 2 месяца количество уникальных пользователей “Рамблера” увеличилось на 30 процентов (январь 2001 – 105-110 тысяч пользователей в сутки, март – 140-150 тысяч пользователей в сутки).

“Рамблер” предоставил и результаты внутреннего сравнения релевантности различных поисковиков. Исследование проводилось лингвистами по итогам результатов поиска различных поисковиков по одним и тем же запросам. Результаты представлены в следующей таблице.

“Апорт” “Рамблер” “Яндекс”
февраль 2000 0,959 0,643 0,845
24.11.2000 0,992 0,903 0,960
29.12.2000 0,992 0,922 0,960
28.02.2001 0,992 0,956 0,960

Цифры свидетельствуют о том, что за последний год не произошло никаких изменений у опережавшего всех в начале прошлого года “Апорта”. “Яндекс” и “Рамблер” развивали свой поиск, и релевантность обоих движков сейчас сравнима. Скачок, произошедший в “Рамблере” в ноябре, связан с тем, что некоторые из нововведений в это время уже внедрялись в старый движок.

Количество поисковых запросов на “Рамблере” и “Яндексе” в сутки представители компаний оценивали примерно одинаково – в 800 тысяч. Из игры за звание лучшего российского поисковика сейчас постепенно выбывает “Апорт”. Этот год, наверняка, продемонстрирует пользователям Рунета активную конкурентную борьбу на поисковом поле “Рамблера” и “Яндекса”.