Błąd miękki 404 występuje, gdy użytkownik żąda za pomocą przeglądarki nieistniejącej lub nieprawidłowej strony internetowej, a serwer błędnie wysyła do klienta (przeglądarki) kod statusu HTTP „200 OK” lub „302 Found”. Użytkownik otrzymuje na ekranie kod błędu 404, ale serwer wysyła inny kod odpowiedzi podczas komunikacji między klientem a serwerem WWW. Zawartość witryny nie jest związana z odpowiedzią HTTP serwera.
To może mieć wpływ na indeksowanie i indeksowanie żądanej witryny. Ponadto, czasami jest to frustrujące dla użytkowników, ponieważ odpowiedź serwera nie pasuje do ich zapytania wyszukiwania. Miękkie błędy 404 są również nazywane fałszywymi 404 lub miękkimi kodami błędów 404.
Ogólne informacje na temat tematu
Typowo, serwer wysyła kod błędu „404 Not Found” za każdym razem, gdy żądana witryna nie istnieje lub nie jest już obecna na serwerze lub adres URL jest uszkodzony. Dzieje się tak często, gdy zasób jest przechowywany w innym miejscu na serwerze, innymi słowy, zawartość została przeniesiona, a linki wewnętrzne, które wskazują na zasób, nie zostały poprawione. Kod błędu 404 może być również wyświetlany, gdy linki zewnętrzne wskazują na zasób, który już nie istnieje. Są to tzw. martwe linki. Serwer wysyła również kod błędu 404, jeśli poprawny adres URL został zmodyfikowany przez użytkownika.
Miękkie 404 różni się od tych przypadków tym, że serwer odpowiada kodem statusu HTTP, takim jak 200 lub 302, mimo że strona już nie istnieje i odpowiednio 404 byłoby poprawną odpowiedzią. Serwer interpretuje niepoprawny lub nieprawidłowy adres URL jako poprawny adres i przekierowuje na stronę startową, na przykład.
Problemy mogą się pojawić, ponieważ serwer nie tylko wysyła kody statusu do przeglądarek, ale także do robotów indeksujących wyszukiwarek. Crawler będzie stopniowo przechodził przez dostępne mu linki. Jeśli trafi na stronę, która już nie istnieje i nadal ma kod odpowiedzi 200 lub 302, traktuje ten zasób jak zwykłą stronę z zawartością. Może to oznaczać, że nie będzie już odwiedzać i indeksować innych stron w tej samej domenie, ponieważ spędza tylko ograniczony czas na każdej stronie w sieci World Wide Web. W ten sposób indeksuje zasoby, które nie dostarczają znaczącej treści, a użytkownicy otrzymują treści, o które nie prosili.
Jak naprawić miękki błąd 404
Błędy indeksowania są wymienione w pozycji menu Diagnostyka w Google Search Console (wcześniej nazywanym Google Webmaster Tools). Jeśli zauważone zostaną tam miękkie błędy 404, można podjąć następujące kroki.
- Jeśli wymienione są miękkie błędy 404, należy sprawdzić odpowiedni adres URL.
- Jeśli zawiera on poprawną treść, witryna powinna wyprowadzić kod 200 OK.
- Jeśli odpowiedzią jest kod 301-error, przekieruj na bardziej odpowiednią witrynę.
- Jeśli pod adresem URL nie istnieje żadna witryna, w nagłówku strony powinien pojawić się kod 404 lub 410.
Bardzo ważne jest, aby serwer wydał poprawny kod HTTP w odpowiedzi na żądanie. Witryna może zostać usunięta z indeksu, jeśli nie.
Dodatki takie jak Firebug lub narzędzie Fetch as Google są również bardzo przydatne. Dzięki nim webmasterzy mogą sprawdzić, czy komunikacja HTTP między klientem a serwerem działa i jak Googlebot odczytuje stronę. Obie wersje wyświetlają kody statusu HTTP. Porównanie z witryną, która jest wywoływana przez przeglądarkę, ujawnia ewentualne konieczne zmiany. W Narzędziach dla Webmasterów Bing operację tę można wykonać w Eksploratorze indeksów pod pozycją menu 404 error.
Typowo kod błędu 404 jest wydawany tylko dla złych adresów URL lub nieistniejących witryn. Zalecamy również spersonalizowane strony błędu 404, aby zapewnić użytkownikom alternatywę dla żądanej zawartości i w ten sposób utrzymać ich jako odwiedzających witrynę. Dobra strona błędu 404:
- podaje prawidłowy kod statusu,
- zawiera zwięzłe informacje dla użytkownika,
- zapewnia użytkownikowi sposób poruszania się po witrynie,
- sugeruje strony o podobnej zawartości,
- i zawiera funkcję wyszukiwania, aby użytkownik mógł wyszukiwać słowa kluczowe.
Znaczenie dla optymalizacji pod kątem wyszukiwarek
Różne kody błędów mogą wystąpić, gdy witryna jest przeprojektowywana, zawartość migrowana lub podejmowane są sezonowe działania promocyjne. W szczególności duże projekty mogą generować tysiące kodów błędów. Jednak produkty, które nie są już dostępne, a nawet strony z bardzo małą ilością treści (thin content) mogą powodować miękkie kody błędów 404. Skutki tego są ogromne. Wyszukiwarki mogą usunąć dotknięte nimi strony z indeksu, co w przypadku stron komercyjnych może prowadzić do spadku sprzedaży. Użytkownicy mogą być czasem sfrustrowani, a koszty rozwiązywania problemów rosną proporcjonalnie do liczby wydanych kodów błędów.
Zaleca się regularne sprawdzanie ewentualnych komunikatów o błędach. Nie da się ich całkowicie uniknąć, ale przynajmniej ograniczyć do niewielkiej liczby. Jak tylko komunikaty o błędach zostaną poprawione, należy poinformować o tym daną wyszukiwarkę w Narzędziach dla Webmasterów, tak aby crawler mógł jak najszybciej odczytać stronę z poprawionym kodem błędu. Rezultaty takich zmian mogą mieć pośredni wpływ na ruch na stronie, jeśli Google zdeindeksuje lub obniży ocenę niektórych stron z miękkimi błędami 404. Może się to zdarzyć, gdy stosunek liczby błędów Soft 404 do liczby zaindeksowanych stron jest wyjątkowo wysoki. Budżet czasowy crawlera jest wtedy w dużej mierze zużywany przez strony z miękkimi błędami 404.