Проверка «битых» ссылок на сайте
Материал из Практическое руководство по продвижению сайта в интернете
«Битые» ссылки — это ссылки с вашего сайта, которые ведут на несуществующие страницы (либо вашего, либо других сайтов). С точки зрения поисковых машин эти ссылки некритичны, а вот с точки зрения пользователей — очень даже. Легко представить реакцию посетителя вашего сайта, если при выборе интересующей его ссылки он увидит, что такой страницы нет. Зачем лишний раз раздражать пользователя?
К счастью, процедура проверки «битых» ссылок легко поддается автоматизации. Например, программный продукт SeMonitor (www.semonitor.ru) позволяет проверить наличие «битых» ссылок на сайте. Существует и специализированный софт, например представленный на сайте http://www.lithopssoft.com/
Проверить «битые» ссылки можно и через сервис «Яндекс. Вебмастер» (http://webmaster.yandex.ru). Пройдя нехитрую процедуру добавления сайта, через этот сервис можно посмотреть отчет об ошибках 404 на сайте, тем самым обнаружив «битые» ссылки.
Для удобства восприятия сведем все значимые технические параметры и рекомендации по их использованию в таблицу (табл. 1.10).
| № | Технический параметр | Рекомендации |
| 1 | Код ответа сервера 200
Все страницы на сайте, содержащие интересную для пользователя информацию, должны иметь код ответа 200 | |
| 2 | Код ответа сервера 404. Обработка ошибки 404 | Рекомендуется настроить правильную обработку ошибки 404 на сервере, чтобы пользователю не выдавалось стандартное сообщение об ошибке |
| 3 | Выдача при наборе несуществующего адреса на сайте | Должен выдаваться код 404 с соответствующей страницей обработки |
| 4 | Наличие в URL сайта идентификаторов сессий | Недопустимо, так как затрудняет индексацию сайта поисковыми системами |
| 5 | Выдача сервером даты изменения документа | Желательно, чтобы сервер выдавал дату изменения документа |
| 6 | Зеркала сайта (с www и без www) | В файле robots.txt должно быть прописано основное зеркало |
| 7 | Среднее время отклика сервера | Менее 0,5 секунды |
| 8 | Наличие дублей страниц на сайте | Недопустимо, так как затрудняет индексацию и может навлечь «гнев» поисковых машин. Дубли необходимо закрывать через файл robots.txt либо не допускать в принципе |
| 9 | Технический параметр | Рекомендации |
| 10 | Доступность хостинга | Ваш сайт должен быть доступен всегда |
| 11 | Кодировка документов на сервере | Должна быть установлена кодировка Windows-1251 |
| 12 | Наличие бэкапов вашего сайта | Должны выполняться ежедневно |
| 13 | Политика бэкапов (резервный бэкап) | Должен быть резервный бэкап, желательно на вашей машине |
| 14 | «Битые» ссылки на сайте | Не должно быть ссылок, ведущих в никуда |
ПОЛЕЗНО ПРОЧИТАТЬ
http://help.yandex.ru/webmaster/?id=996567 — подробнее о файле robots.txt.
http://help.yandex.ru/webmaster/?id=995296 — информация о том, что такое робот поисковой системы и как он работает.
http://hostinfo.ru/articles/442 — обзор софта по тестированию сайтов.
http://www.ptsecurity.ru/xs7download.asp — программа для тестирования уязвимостей сайтов.
http://hostinfo.ru/articles/439 — тестирование нагрузки сайта.
http://www.loadtestingtool.com/ — программа для тестирования нагрузки сайтов.