Рейтинг@Mail.ru

Поиск битых ссылок на сайте

Приветствую Вас, гости и подписчики блога 4remind.ru. Эта заметка скорее всего в большей степени коснется начинающих вебмастеров, сайтостроителей с малым опытом. Многие наверно не раз сталкивались с тем, что время от времени поисковые системы информируют Вас о том, что на вашем сайте, блоге или другом ресурсе обнаружены битые ссылки, то есть ссылки, возвращающие в ответе HTTP-код 404. Например в панели управления сайтами Яндекса это отмечается в таблице раздела "Исключенные страницы > Страницы запрещены к индексированию вебмастером или не существуют".
Поиск битых ссылок на своем сайте

Там же, в колонке таблицы "Ссылки на страницу" указаны URL-ы на страницы, где были обнаружены некорректные ссылки. Конечно же хорошо, если Вы действительно быстро нашли источник и место проблемы и устранили ее. Но что делать, если на указанной поисковой системой странице сайта так и не нашлось ничего подозрительного?

Можно конечно воспользоваться онлайн-сервисами для поиска битых ссылок, их в интернете можно найти превеликое множество, например по запросу «битые ссылки онлайн сервис». Но нередко случается, что и они не могут помочь найти ошибки.

Причин этому может быть несколько. Например, на вашем сайте установлен какой-то плагин или расширение, тема или шаблон, другие скрипты в которых есть код, который выводит часть контента, содержащего потенциально возможные неправильные ссылки, или скрипт, который выбирает их из базы данных случайным образом.

В таком случае, чтобы обнаружить битые ссылки, нужно просканировать своими силами полностью все файлы сайта и все таблицы из базы данных, относящиеся конкретно к нему. Сделать это в принципе не так уж и сложно, но все же это потребует усилий. Итак, всего лишь пара рекомендаций к действию:

  1. Создайте полный бэкап файловой структуры сайта и скачайте его на локальный компьютер. Затем произведите поиск по содержимому всех файлов (за исключением разве что файлов изображений, видео и аудио) на предмет наличия в них ссылки (или ее части), указанной поисковой системой как «несуществующая» или помеченная как ошибка 404. Для текстового поиска можно, и даже очень удобно, воспользоваться файловым менеджером «Total Commander» (выбрать каталог с файлами сайта, войти в него, нажать комбинацию клавиш [Alt]+[F7], в открывшемся окне отметить чекбокс «С текстом», ввести искомое в поле справа от него и нажать кнопку [Начать поиск]). Кстати, некоторые хостинги предоставляют в услугах встроенный файловый менеджер, который может производить поиск по содержимому файлов и тогда можно будет обойтись без копирования бэкапа всей файловой структуры себе на комп.

  2. Произведите «Экспорт» всей базы данных сайта, скопируйте файл экспорта себе на компьютер, разархивируйте (если при экспорте таблицы базы данных были упакованы в архив) и произведите поиск «плохой» ссылки тем же методом, как и для файлов сайта. Еще, как вариант, можно избежать экспорта/импорта базы данных и искать по таблицам непосредственно из панели управления БД, например используя PhpMyAdmin.

В большинстве случаев Вы без особых проблем найдете то, что искали (ну или убедитесь в том, что на самом-то деле «плохой» ссылки нигде нет, что тоже неплохо). После устранения ошибок закачайте исправленный файл(ы), импортируйте исправления в таблицах базы данных на сайт.

Только НЕ забывайте, что исправляя ошибки в файлах и таблицах базы данных на локальном компьютере, нужно обязательно сохранять их с той же кодировкой символов, в которой они были изначально на самом сайте!

Иногда трудностей с поиском могут прибавить файлы или поля таблиц БД, в которых есть строки, содержащие искомые битые ссылки, закодированные в Base64 (на моей практике лишь пару раз такое случалось). В таком случае придется декодировать base64-тексты и искать в уже раскодированных.

Желаю удачи и как можно реже сталкиваться с появлением ошибок 404 на ваших сайтах!

P.S.
Если у кого есть наиболее продвинутые методы поиска битых ссылок или даже свои собственные скрипты, приложения или плагины, то поделитесь ими (если они не коммерческие) или своим опытом. Наиболее интересное и полезное для вебмастеров разного уровня можно будет опубликовать на этом блоге и получить обратную ссылку.

Метки: битые ссылки, ошибка 404

Поделитесь материалом с другими, воспользуйтесь этими кнопками:
Получать обновления и новые материалы блога по E-mail

Оставить комментарий

Подписаться на обновления блога 4remind.ru по RSS
Новости блога в социальных сетях

Новости блога 4remind.ru в Твиттере Персональная страница блога 4remind.ru в Facebook Персональная страница блога 4remind.ru в Google+ Новостная лента блога 4remind.ru в FriendFeed

4remind.ru - персональный блог вебмастера

Rambler's Top100
Рейтинг@Mail.ru


Яндекс.Метрика