[проверка актуальности гиперссылок на сайте]материал подготовил: Александр Якутский 27.08.2004
В интернете все происходит стремительно, ежедневно рождаются, умирают и переводятся на новые технологии отдельные страницы, целые сайты и даже огромные порталы. В связи с этим множество гиперссылок ежедневно становятся неактуальными. Это доставляет серьезное неудобство сайтостроителям: создал месяц назад страничку, а уже сегодня половина ссылок с нее ведет «в никуда». Естественно, посетители такой странички раздражены и начинают поминать недобрым словом ее создателя, который, в общем-то, не сильно виноват. Ведь не проверять же ему ежедневно вручную работоспособность сотен ссылок на всех страницах своего сайта!
Впрочем, некоторая доля его вины есть: владелец сайта не озаботился установкой одной из множества программ, которые автоматически проверяют гиперссылки на живучесть. Одна из популярных программ этого класса — Xenu’s Link Sleuth, ее мы и рассмотрим в этой статье. Популярность этого валидатора объясняется тремя причинами. Во-первых, работать с Xenu на удивление просто, а в результате получается очень подробный и обстоятельный отчет обо всех имеющихся на сайте ссылках. Во-вторых, Xenu работает довольно быстро, что немаловажно. В-третьих, программа абсолютно бесплатна — скачивай с сайта дистрибутив и работай в свое удовольствие.
Программы этого типа часто называют «линк-валидаторами» от английских слов link — ссылка и valid — действительный
Запустив программу, выбираем в меню File пункт Check URL (Проверить URL). В результате откроется диалоговое окно Xenu’s starting point (смотрите иллюстрацию). Первым делом укажем страницу, с которой Xenu начнет исследование гиперссылок. Это может быть адрес (URL) стартовой страницы нашего сайта — например, http://www.oursite.ru/. Точно так же можно указать отдельную страницу сайта — например, http://www.oursite.ru/page.html/. Наконец, это может быть HTML-документ, сохраненный на жестком диске локального компьютера — например, file:///D:\probe.html.
Теперь зададим область исследования. Должен ли Xenu проверять работоспособность ссылок, которые уводят за пределы нашего сайта? Если должен, то поставим отметку в поле Check External Links. Затем перечислим адреса, которые имеют прямое отношение к нашему сайту, хотя и не соответствуют URL главной страницы. Например, к внутренним страницам отнесем все те, адреса которых начинаются с http://forum.oursite.ru, то есть главные страницы разделов нашего сайта. Наконец, перечислим начала адресов, которые совсем не нужно проверять. Это могут быть адреса счетчиков (например, http://top100.rambler.ru) или баннерных сетей (например, http://www.linkexchange.ru).
Обратите внимание: адрес в интернете (URL) должен заканчиваться символом «слеша» /
В принципе, все готово, можно начинать анализ гиперссылок. Однако стоит сразу же выполнить некоторые дополнительные настройки, воспользовавшись кнопкой More options. Здесь пользователь указывает, какие данные должны быть включены в результирующий отчет, о котором я расскажу чуть ниже. Однако сразу же обратите внимание на последнюю строчку в этом окне: Orphan files. В Xenu есть функция обнаружения файлов-сирот (orphan). Прежде чем запускать ее, программа спросит логин и пароль доступа к вашему веб-серверу или к вашей папке на се