Un soft 404 error si verifica quando un utente richiede un sito web inesistente o sbagliato con il suo browser e il server invia erroneamente un codice di stato HTTP “200 OK” o “302 Found” al client (browser). L’utente riceve un codice di errore 404 sullo schermo, ma il server invia un codice di risposta diverso durante la comunicazione tra il client e il server web. Il contenuto del sito web non è correlato alla risposta HTTP del server.
Questo può influenzare il crawling e l’indicizzazione del sito richiesto. Inoltre, a volte è frustrante per gli utenti perché la risposta del server non corrisponde alla loro query di ricerca. Gli errori soft 404 sono anche chiamati falsi 404 o codici di errore soft 404.
Informazioni generali sull’argomento
In genere, un server invia un codice di errore “404 Not Found” quando un sito web richiesto non esiste o non è più presente sul server o l’URL è corrotto. Questo è spesso il caso quando una risorsa è memorizzata in una posizione diversa sul server, in altre parole, il contenuto è stato spostato, e i collegamenti interni che puntano alla risorsa non sono stati corretti. Un codice di errore 404 può anche essere visualizzato se i link esterni puntano a una risorsa che non esiste più. Questi sono chiamati link morti. Il server invia anche un codice di errore 404 se un URL corretto è stato modificato dall’utente.
Il soft 404 differisce da questi casi in quanto il server risponde con un codice di stato HTTP come 200 o 302, anche se il sito non esiste più e quindi un 404 sarebbe la risposta corretta. Il server interpreta un URL errato o non valido come l’indirizzo corretto e reindirizza alla pagina iniziale, per esempio.
I problemi possono sorgere poiché il server non invia solo codici di stato ai browser, ma anche ai crawler dei motori di ricerca. Il crawler lavorerà gradualmente attraverso i link che sono a sua disposizione. Se colpisce un sito web che non esiste più e ha ancora un codice di risposta 200 o 302, tratta questa risorsa come un normale sito web con contenuto. Questo può significare che non visiterà più e scansionerà altre pagine dello stesso dominio, perché trascorre solo un tempo limitato su ogni sito web del World Wide Web. Così, scansiona risorse che non forniscono contenuti significativi e gli utenti vengono presentati con contenuti che non hanno richiesto.
Come risolvere un errore soft 404
Gli errori di scansione sono elencati sotto la voce di menu Diagnostica in Google Search Console (precedentemente chiamato Google Webmaster Tools). Se vi si notano errori soft 404, si può procedere come segue.
- Se sono elencati errori soft 404, si dovrebbe controllare l’URL corrispondente.
- Se contiene il contenuto corretto, il sito dovrebbe emettere un codice 200 OK.
- Se la risposta è un codice di errore 301, reindirizzare a un sito più appropriato.
- Se non esiste alcun sito web sotto l’URL, un codice 404 o 410 dovrebbe essere emesso nell’intestazione della pagina.
È molto importante che il server emetta il codice HTTP corretto in risposta a una richiesta. Un sito web potrebbe essere rimosso dall’indice, se non lo fa.
Anche componenti aggiuntivi come Firebug o lo strumento Fetch as Google sono molto utili. Permette ai webmaster di vedere se la comunicazione HTTP tra il client e il server funziona e come il Googlebot legge il sito web. Entrambe le versioni mostrano i codici di stato HTTP. Un confronto con il sito web, che viene chiamato dal browser, rivela eventuali modifiche necessarie. Nel Bing Webmaster Tools, questa operazione può essere eseguita nell’Index Explorer sotto la voce di menu 404 error.
In genere, un codice di errore 404 viene emesso solo per URL cattivi o siti web inesistenti. Consigliamo anche pagine di errore 404 personalizzate per fornire agli utenti un’alternativa al contenuto richiesto e in questo modo mantenerli come visitatori del sito. Una buona pagina di errore 404:
- emette il codice di stato corretto,
- include informazioni concise per l’utente,
- fornisce all’utente un modo per navigare nel sito,
- suggerisce pagine con contenuti simili,
- e contiene una funzione di ricerca in modo che l’utente possa cercare parole chiave.
Importanza per l’ottimizzazione dei motori di ricerca
Codici di errore diversi possono verificarsi quando un sito web viene riprogettato, il contenuto viene migrato o vengono intraprese azioni promozionali stagionali. In particolare, i progetti su larga scala possono creare migliaia di codici di errore. Tuttavia, i prodotti che non sono più disponibili e anche i siti web con pochissimo contenuto (thin content) possono generare codici di errore soft 404. L’impatto è enorme. I motori di ricerca possono togliere i siti colpiti dall’indice, il che può portare a un calo delle vendite nel caso di siti commerciali. Gli utenti possono a volte sentirsi frustrati e il costo della risoluzione dei problemi aumenta proporzionalmente al numero di codici di errore emessi.
Si raccomanda un controllo regolare dei possibili messaggi di errore. Non possono essere completamente evitati, ma almeno ridotti al minimo. Non appena i messaggi di errore sono stati corretti, questo dovrebbe essere comunicato al rispettivo motore di ricerca nel Webmaster Tools in modo che il crawler possa leggere il sito web con il codice di errore corretto il più presto possibile. I risultati di tali modifiche possono avere un impatto indiretto sul traffico se Google deindicizza o declassa alcuni siti web con errori Soft 404. Questo può accadere quando il rapporto tra gli errori Soft 404 e le pagine indicizzate è eccezionalmente alto. Il budget di tempo del crawler è quindi ampiamente utilizzato dalle pagine con errori Soft 404.