Un error soft 404 ocurre cuando un usuario solicita un sitio web inexistente o incorrecto con su navegador y el servidor envía incorrectamente un código de estado HTTP «200 OK» o «302 Found» al cliente (navegador). El usuario recibe un código de error 404 en la pantalla, pero el servidor envía un código de respuesta diferente cuando se comunica entre el cliente y el servidor web. El contenido del sitio web no está relacionado con la respuesta HTTP del servidor.
Esto puede afectar al rastreo e indexación del sitio solicitado. Además, a veces es frustrante para los usuarios porque la respuesta del servidor no coincide con su consulta de búsqueda. Los errores soft 404 también se denominan códigos de error 404 falsos o soft 404.
Información general sobre el tema
Típicamente, un servidor envía un código de error «404 Not Found» cuando un sitio web solicitado no existe o ya no está presente en el servidor o la URL está corrupta. Esto suele ocurrir cuando un recurso se almacena en una ubicación diferente en el servidor, es decir, el contenido se ha movido, y los enlaces internos que apuntan al recurso no se han corregido. También puede aparecer un código de error 404 si los enlaces externos apuntan a un recurso que ya no existe. Estos se denominan enlaces muertos. El servidor también envía un código de error 404 si una URL correcta ha sido modificada por el usuario.
El soft 404 difiere de estos casos en que el servidor responde con un código de estado HTTP como 200 o 302, aunque el sitio ya no exista y por tanto un 404 sería la respuesta correcta. El servidor interpreta una URL incorrecta o no válida como la dirección correcta y redirige a la página de inicio, por ejemplo.
Los problemas pueden surgir porque el servidor no sólo envía códigos de estado a los navegadores, sino también a los rastreadores de los motores de búsqueda. El rastreador trabajará gradualmente a través de los enlaces que están disponibles para él. Si llega a un sitio web que ya no existe y sigue teniendo un código de respuesta 200 o 302, tratará este recurso como un sitio web normal con contenido. Esto puede significar que ya no visitará y rastreará otras páginas del mismo dominio porque sólo pasa un tiempo limitado en cada sitio de la World Wide Web. Por lo tanto, rastrea recursos que no proporcionan contenido significativo y los usuarios reciben contenido que no han solicitado.
Cómo solucionar un error 404 blando
Los errores de rastreo aparecen en la opción de menú Diagnóstico de Google Search Console (antes llamada Google Webmaster Tools). Si se observan errores 404 suaves allí, se pueden seguir los siguientes pasos.
- Si se enumeran errores 404 suaves, se debe comprobar la URL correspondiente.
- Si contiene el contenido correcto, el sitio debería emitir un código 200 OK.
- Si la respuesta es un código de error 301, se debe redirigir a un sitio más apropiado.
- Si no existe ningún sitio web bajo la URL, se debe emitir un código 404 o 410 en la cabecera de la página.
Es muy importante que el servidor emita el código HTTP correcto en respuesta a una solicitud. Un sitio web podría ser eliminado del índice, si no lo hace.
También son muy útiles los complementos como Firebug o la herramienta Fetch as Google. Permiten a los webmasters ver si la comunicación HTTP entre el cliente y el servidor funciona y cómo el Googlebot lee el sitio web. Ambas versiones muestran los códigos de estado HTTP. Una comparación con el sitio web, que es llamado por el navegador, revela cualquier cambio necesario. En las Herramientas para webmasters de Bing, esta operación se puede realizar en el Explorador de índices en el elemento de menú Error 404.
Típicamente, un código de error 404 se emite sólo para URLs malas o sitios web inexistentes. También se recomiendan las páginas de error 404 personalizadas para ofrecer a los usuarios una alternativa al contenido solicitado y así mantenerlos como visitantes del sitio. Una buena página de error 404:
- emite el código de estado correcto,
- incluye información concisa para el usuario,
- proporciona al usuario una forma de navegar por el sitio,
- sugiere páginas con contenido similar,
- y contiene una función de búsqueda para que el usuario pueda buscar palabras clave.
Importancia para la optimización de los motores de búsqueda
Pueden producirse diferentes códigos de error cuando se rediseña un sitio web, se migra el contenido o se realizan acciones promocionales de temporada. En particular, los proyectos a gran escala pueden crear miles de códigos de error. Sin embargo, los productos que ya no están disponibles e incluso los sitios web con muy poco contenido (thin content) pueden dar lugar a códigos de error 404 blandos. El impacto es enorme. Los motores de búsqueda pueden retirar los sitios web afectados del índice, lo que puede provocar una disminución de las ventas en el caso de los sitios web comerciales. En ocasiones, los usuarios pueden sentirse frustrados y el coste de la resolución de los problemas aumenta proporcionalmente al número de códigos de error emitidos.
Se recomienda comprobar regularmente los posibles mensajes de error. No se pueden evitar por completo, pero al menos hay que mantener un número reducido. Tan pronto como se hayan corregido los mensajes de error, esto debería comunicarse al motor de búsqueda respectivo en las Herramientas para webmasters de Internet para que el rastreador pueda leer el sitio web con el código de error corregido lo antes posible. Los resultados de estos cambios pueden tener un impacto indirecto en el tráfico si Google desindexa o desclasifica ciertos sitios web con errores Soft 404. Esto puede ocurrir cuando la proporción entre los errores Soft 404 y las páginas indexadas es excepcionalmente alta. En ese caso, el presupuesto de tiempo del rastreador es utilizado en gran medida por las páginas con errores Soft 404.