В секции «Интернет-порталы и технологии поиска» на РИФе-2001 исполнительный директор компании «Рамблер» Игорь Ашманов рассказал об особенностях нового поискового ядра компании — Rambler.2.0.
Новое ядро было написано командой разработчиков «Рамблера» в декабре 2000 года, а в январе 2001 началось его бета-тестирование, которое продолжается и сейчас. Весь 2000 год, по признанию Игоря Ашманова, поиск был в «Рамблере» больным местом. Старое ядро было написано еще в 1996 году. До конца 1999 года над ним работал всего один человек — один из создателей «Рамблера» Дмитрий Крюков. И к началу 2000 года «рамблеровский» поиск существенно отставал от конкурентов — «Яндекса» и «Апорта«.
К разработке нового ядра команда из 10 разработчиков приступила летом 2000 года. Старое ядро не обеспечивало хорошую релевантность поиска по нескольким причинам:
- Отсутствие координат слов (поисковику было все равно, насколько далеко друг от друга в тексте расположены слова, заданные в запросе).
- Отсутствие морфологии (поиска по словоформам).
- Отсутствие связи с каталогом (что автоматически обеспечивает более высокую релевантность, так как каталог обладает релевантные аннотациями).
- Выдача реультатов поска «по документам», а не по сайтам.
- Отсутствие поиска по числам.
В новом ядре все эти недостатки были исправлены. Rambler.2.0. учитывает координаты слов, обучен русской и английской морфологии, связывает поиск с каталогом Top100, распознает темы, чтобы связывать результаты поиска с другими разделами портала, группирует результаты поиска по сайтам, ищет по числам. Составлен тезаурус запросов, с помощью которого выделяются темы запросов. В тезаурусе сейчас — 1600 рубрик. Внедрение тезауруса позволило «Рамблеру» поднять посещаемость портала. «Перевязки» на дргуие разделы портала, которые выдаются вместе с результатами поиска, обеспечивают примерно 20 процентов общей посещаемости разделов Rambler.ru. Их средний CTR 4 процента. Надо отметить, что «Яндекс» уже давно связывает результаты поиска со своим каталогам, и делает также поиск по новостям и по товарам. Кроме того, в «Яндексе» функционирует синтаксический анализ запросов.
Итог своей работы «Рамблер» оценивает как удовлетворительный. О чем говорят и цифры. За последние 2 месяца количество уникальных пользователей «Рамблера» увеличилось на 30 процентов (январь 2001 — 105-110 тысяч пользователей в сутки, март — 140-150 тысяч пользователей в сутки).
«Рамблер» предоставил и результаты внутреннего сравнения релевантности различных поисковиков. Исследование проводилось лингвистами по итогам результатов поиска различных поисковиков по одним и тем же запросам. Результаты представлены в следующей таблице.
«Апорт» | «Рамблер» | «Яндекс» | |
февраль 2000 | 0,959 | 0,643 | 0,845 |
24.11.2000 | 0,992 | 0,903 | 0,960 |
29.12.2000 | 0,992 | 0,922 | 0,960 |
28.02.2001 | 0,992 | 0,956 | 0,960 |
Цифры свидетельствуют о том, что за последний год не произошло никаких изменений у опережавшего всех в начале прошлого года «Апорта». «Яндекс» и «Рамблер» развивали свой поиск, и релевантность обоих движков сейчас сравнима. Скачок, произошедший в «Рамблере» в ноябре, связан с тем, что некоторые из нововведений в это время уже внедрялись в старый движок.
Количество поисковых запросов на «Рамблере» и «Яндексе» в сутки представители компаний оценивали примерно одинаково — в 800 тысяч. Из игры за звание лучшего российского поисковика сейчас постепенно выбывает «Апорт». Этот год, наверняка, продемонстрирует пользователям Рунета активную конкурентную борьбу на поисковом поле «Рамблера» и «Яндекса».