Wayback Machine находит сайты, которых уже нет

Author:

Алексей Андреев

На прошлой неделе общественная организация Internet Archive и компания Alexa Internet презентовали интернет-сообществу поисковую машину Wayback Machine, которая позволяет путешествовать в прошлое Интернета и отыскивать сайты, которых уже не существует.

В качестве базы для поиска Wayback Machine использует не сам Интернет, а Архив Интернета, основанный в 1996 году Брюстером Кейлом в сотрудничестве с Библиотекой Конгресса США. Архив обновляется каждые два месяца (это чуть меньше, чем средний срок жизни страницы). Сейчас объем архива — более 100 терабайт, и каждое обновление приносит по 12 терабайт. В архиве уже собрано более 10 миллиардов сайтов, созданных с 1996 по 2001 год.

Архив Интернета и его поисковая машина Wayback Machine уже используются специалистами самых разных профессий. Например, исследователи из Xerox PARC используют его для изучения истории развития пользовательских интерфейсов.

В рамках проекта можно также посмотреть некоторые специальные коллекции — например, архив сетевых материалов о трагедии 11 сентября.

«В этом архиве собраны записи того, что в противном случае просто исчезает, — говорит Поль Грабович из Университета Калифорнии в Беркли. — Подобные исчезновения — одна из проблем Интернета».

По его словам, Wayback Machine очень полезна для журналистов, поскольку сохраняет «снимки» электронных газет так же, как микрофильмы сохраняют старые бумажные издания. Особенно это актуально в случае электронных изданий, которые не имеют собственного архива, как, например, знаменитый Drudge Report.

Правда, на момент написания данной заметки система Wayback Machine почему-то отказывалась демонстрировать сайты, заархивированные ранее сентября 2001 года. Да и российские ресурсы представлены в архиве очень выборочно.

ССЫЛКИ ПО ТЕМЕ


Wayback Machine

Wayback Goes Way Back on Web — Wired, 29.10.01

МАТЕРИАЛЫ ПО ТЕМЕ


Один день Интернета: все про 11 сентября23.10.01



Архив Интернета: 40 терабайт за 5 лет11.07.01