Приветствую Вас, гости и подписчики блога 4remind.ru. Эта заметка скорее всего в большей степени коснется начинающих вебмастеров, сайтостроителей с малым опытом. Многие наверно не раз сталкивались с тем, что время от времени поисковые системы информируют Вас о том, что на вашем сайте, блоге или другом ресурсе обнаружены битые ссылки, то есть ссылки, возвращающие в ответе HTTP-код 404. Например в панели управления сайтами Яндекса это отмечается в таблице раздела "Исключенные страницы > Страницы запрещены к индексированию вебмастером или не существуют".
Там же, в колонке таблицы "Ссылки на страницу" указаны URL-ы на страницы, где были обнаружены некорректные ссылки. Конечно же хорошо, если Вы действительно быстро нашли источник и место проблемы и устранили ее. Но что делать, если на указанной поисковой системой странице сайта так и не нашлось ничего подозрительного?
Можно конечно воспользоваться онлайн-сервисами для поиска битых ссылок, их в интернете можно найти превеликое множество, например по запросу «битые ссылки онлайн сервис». Но нередко случается, что и они не могут помочь найти ошибки.
Причин этому может быть несколько. Например, на вашем сайте установлен какой-то плагин или расширение, тема или шаблон, другие скрипты в которых есть код, который выводит часть контента, содержащего потенциально возможные неправильные ссылки, или скрипт, который выбирает их из базы данных случайным образом.
В таком случае, чтобы обнаружить битые ссылки, нужно просканировать своими силами полностью все файлы сайта и все таблицы из базы данных, относящиеся конкретно к нему. Сделать это в принципе не так уж и сложно, но все же это потребует усилий. Итак, всего лишь пара рекомендаций к действию:
- Создайте полный бэкап файловой структуры сайта и скачайте его на локальный компьютер. Затем произведите поиск по содержимому всех файлов (за исключением разве что файлов изображений, видео и аудио) на предмет наличия в них ссылки (или ее части), указанной поисковой системой как «несуществующая» или помеченная как ошибка 404. Для текстового поиска можно, и даже очень удобно, воспользоваться файловым менеджером «Total Commander» (выбрать каталог с файлами сайта, войти в него, нажать комбинацию клавиш
[Alt]+[F7]
, в открывшемся окне отметить чекбокс «С текстом», ввести искомое в поле справа от него и нажать кнопку[Начать поиск]
). Кстати, некоторые хостинги предоставляют в услугах встроенный файловый менеджер, который может производить поиск по содержимому файлов и тогда можно будет обойтись без копирования бэкапа всей файловой структуры себе на комп. - Произведите «Экспорт» всей базы данных сайта, скопируйте файл экспорта себе на компьютер, разархивируйте (если при экспорте таблицы базы данных были упакованы в архив) и произведите поиск «плохой» ссылки тем же методом, как и для файлов сайта. Еще, как вариант, можно избежать экспорта/импорта базы данных и искать по таблицам непосредственно из панели управления БД, например используя PhpMyAdmin.
В большинстве случаев Вы без особых проблем найдете то, что искали (ну или убедитесь в том, что на самом-то деле «плохой» ссылки нигде нет, что тоже неплохо). После устранения ошибок закачайте исправленный файл(ы), импортируйте исправления в таблицах базы данных на сайт.
Только НЕ забывайте, что исправляя ошибки в файлах и таблицах базы данных на локальном компьютере, нужно обязательно сохранять их с той же кодировкой символов, в которой они были изначально на самом сайте!
Иногда трудностей с поиском могут прибавить файлы или поля таблиц БД, в которых есть строки, содержащие искомые битые ссылки, закодированные в Base64 (на моей практике лишь пару раз такое случалось). В таком случае придется декодировать base64-тексты и искать в уже раскодированных.
Желаю удачи и как можно реже сталкиваться с появлением ошибок 404 на ваших сайтах!
P.S.
Если у кого есть наиболее продвинутые методы поиска битых ссылок или даже свои собственные скрипты, приложения или плагины, то поделитесь ими (если они не коммерческие) или своим опытом. Наиболее интересное и полезное для вебмастеров разного уровня можно будет опубликовать на этом блоге и получить обратную ссылку.