Um erro soft 404 ocorre quando um usuário solicita um site inexistente ou incorreto com seu navegador e o servidor envia incorretamente um código de status HTTP “200 OK” ou “302 Encontrado” para o cliente (navegador). O usuário recebe um código de erro 404 na tela, mas o servidor envia um código de resposta diferente quando a comunicação entre o cliente e o servidor web é feita. O conteúdo do site não está relacionado com a resposta HTTP do servidor.
Isso pode afetar o rastreamento e a indexação do site solicitado. Além disso, às vezes é frustrante para os usuários porque a resposta do servidor não corresponde à sua consulta de pesquisa. Erros Soft 404 também são chamados de códigos de erro falsos 404 ou soft 404.
Informações gerais sobre o tópico
Tipicamente, um servidor envia um código de erro “404 Not Found” sempre que um site solicitado não existe ou não está mais presente no servidor ou a URL está corrompida. Este é frequentemente o caso quando um recurso é armazenado em um local diferente no servidor, em outras palavras, o conteúdo foi movido e os links internos que apontam para o recurso não foram corrigidos. Um código de erro 404 também pode ser exibido se links externos apontarem para um recurso que não existe mais. Estes são chamados links mortos. O servidor também envia um código de erro 404 se um URL correto tiver sido modificado pelo usuário.
O soft 404 difere desses casos na medida em que o servidor responde com um código de status HTTP como 200 ou 302, mesmo que o site não exista mais e, portanto, um 404 seria a resposta correta. O servidor interpreta uma URL incorreta ou inválida como o endereço correto e redireciona para a página inicial, por exemplo.
Problemas podem aparecer uma vez que o servidor não só envia códigos de status para os navegadores, mas também para os rastreadores dos mecanismos de busca. O crawler irá gradualmente trabalhar através dos links que estão disponíveis para ele. Se ele acessa um site que não existe mais e ainda tem um código de resposta de 200 ou 302, ele trata este recurso como um site regular com conteúdo. Isso pode significar que ele não mais visitará e rastreará outras páginas no mesmo domínio porque ele passa apenas um tempo limitado em cada website da World Wide Web. Assim, ele rastreia recursos que não fornecem conteúdo significativo e os usuários são apresentados com conteúdo que eles não solicitaram.
Como corrigir um erro soft 404
Erros de rastreamento são listados no item de menu Diagnóstico no Console de Pesquisa do Google (anteriormente chamado de Ferramentas do Google para webmasters). Se os erros do soft 404 forem anotados lá, os seguintes passos podem ser dados.
- Se forem listados erros do soft 404, o URL correspondente deve ser verificado.
- Se ele contiver o conteúdo correto, o site deve emitir um código 200 OK.
- Se a resposta for um código 301-error, redirecione para um site mais apropriado.
- Se não houver um site sob a URL, um código 404 ou 410 deve ser emitido no cabeçalho da página.
É muito importante que o servidor emita o código HTTP correto em resposta a uma solicitação. Um site pode ser removido do índice, se não o fizer.
Add-ons como o Firebug ou o Fetch como ferramenta do Google também são muito úteis. Ele permite aos webmasters ver se a comunicação HTTP entre o cliente e o servidor está funcionando e como o Googlebot lê o site. Ambas as versões exibem os códigos de status HTTP. Uma comparação com o site, que é chamada pelo navegador, revela quaisquer alterações necessárias. No Bing Webmaster Tools, esta operação pode ser realizada no Index Explorer no item de menu 404 error.
Tipicamente, um código de erro 404 é emitido apenas para URLs ruins ou sites inexistentes. Também recomendamos páginas de erro 404 personalizadas para fornecer aos usuários uma alternativa ao conteúdo solicitado e assim mantê-los como visitantes do site. Uma boa página de erro 404:
- produz o código de status correto,
- inclui informações concisas para o usuário,
- fornece ao usuário uma forma de navegar no site,
- sugere páginas com conteúdo similar,
- e contém uma função de busca para que o usuário possa procurar por palavras-chave.
Importância para a optimização de motores de busca,
Diferentes códigos de erro podem ocorrer quando um site é redesenhado, conteúdo migrado, ou acções promocionais sazonais realizadas. Em particular, projetos de grande escala podem criar milhares de códigos de erro. Entretanto, produtos que não estão mais disponíveis e mesmo websites com muito pouco conteúdo (thin content) podem resultar em soft 404 códigos de erro. O impacto é enorme. Os motores de busca podem retirar os sites afetados do índice, o que pode levar a quedas nas vendas no caso de sites comerciais. Os utilizadores podem por vezes ficar frustrados e o custo da resolução de problemas aumenta proporcionalmente ao número de códigos de erro emitidos.
A verificação regular de possíveis mensagens de erro é recomendada. Elas não podem ser completamente evitadas, mas pelo menos mantidas em um número pequeno. Assim que as mensagens de erro tiverem sido corrigidas, isto deve ser comunicado ao respectivo motor de busca nas Ferramentas do Webmaster para que o rastreador possa ler o site com o código de erro corrigido o mais rápido possível. Os resultados de tais alterações podem ter um impacto indirecto no tráfego se o Google des-indexar ou desclassificar certos Web sites com erros Soft 404. Isto pode acontecer quando a relação entre os erros do Soft 404 e as páginas indexadas é excepcionalmente elevada. O orçamento de tempo do crawler é então largamente utilizado pelo soft 404 páginas de erro.