Cómo agregar un sitio web a Google

Esta entrada es la parte 2 de 2 de la serie SEO Básico.

Para que una página pueda aparecer en los resultados de Google debe estar incluido en su base de datos que se llama índex. Cuando una persona realiza una búsqueda en Google, los resultados llegan de índex.
Si una página está en el índex, se dice que está indexada.
Si una página no está en el índex, se dice que no está indexada.

Verificar si las páginas son indexables

Se dice que una página es indexable cuando es apta para ser incluida en el índex. Para agregar una página a Google el primer paso es analizar si es indexable.

Para ello, podemos utilizar herramientas gratuitas proporcionadas por Google, como Search Console, Lighthouse y PageSpeed Insights.

  • Google Search Console: Permite monitorear y optimizar la presencia de tu sitio web en los resultados de búsqueda de Google. Proporciona información valiosa sobre cómo Google indexa y muestra tu sitio web.
  • Google Lighthouse: Una extensión de Chrome y Firefox que evalúa la calidad y el rendimiento de un sitio web. Proporciona informes detallados sobre el rendimiento, la accesibilidad y las mejores prácticas de desarrollo web.
  • PageSpeed Insights: Realiza análisis similares a Lighthouse, pero se accede a través de la web en lugar de ser una extensión.

Verificar si una página ya está indexada

Antes de agregar una página o un sitio a Google, hay que verifican si ya está en el índex y existen varias formas de hacerlo:

  • Comando «site» en Google: Busca «site:tudominio» y obtendrás una lista de todas las páginas indexadas de tu sitio web. Por ejemplo con site:vivabeta.com podemos verificar cuáles páginas de este sitio están indexadas.
  • Comando «cache» en Google: Busca «cache:URL» y verás la versión de la página que Google tiene indexada. Por ejemplo con cache:https://vivabeta.com/cursos/ podemos verificar si la págona de los cursos de Viva Beta está indexada.
  • Google Search Console: Muestra las URL individuales indexadas y proporciona datos sobre la fecha de la última indexación.

Actualización de una página ya indexada

Si actualiza una página que ya está indexada, los bots de Google la visitarán periódicamente y analizarán su contenido. No es necesario realizar ninguna acción adicional.

Páginas de un sitio web nuevo

Si tu sitio web es completamente nuevo y ninguna de sus páginas está indexada, siga estos pasos:

  1. Abra una cuenta en Google Search Console.
  2. Agregue su sitio web.
  3. Google rastreará periódicamente su sitio y agregará las páginas que encuentre al índice.

Páginas nuevas de un sitio web ya indexado

Si tu sitio web ya tiene algunas páginas indexadas, Google visitará periódicamente tu sitio y agregará las páginas nuevas.

  • Si encuentra enlaces desde las páginas ya indexadas hacia las nuevas páginas los sigue, encuentra las páginas nuevas y las indexa.
  • Si encuentra enlaces a las páginas nuevas en el sitemap. Un sitemap es un archivo XML o una página web que enumera todas las páginas de un sitio web y proporciona información sobre su estructura y relación.

Cómo evitar la indexación de una página

En ocasiones, puede que no desees que Google indexe una o varias páginas de tu sitio web. Aquí hay algunas razones comunes para evitar la indexación:

  • Contenido privado: Si tiene páginas con información confidencial, es posible que desees evitar que aparezcan en los resultados de búsqueda públicos.
  • Contenido duplicado: Si hay contenido duplicado o de baja calidad en tu sitio web, puedes optar por no indexarlo para evitar penalizaciones.
  • Páginas en desarrollo o de prueba: Durante el desarrollo de un sitio web, puede ser útil evitar que las páginas de prueba o en construcción se indexen hasta que estén completas.
  • Páginas obsoletas o desactualizadas: Si tienes contenido que ya no es relevante, puedes optar por no indexar esas páginas.

Existen métodos para indicar a Google que no indexe una página específica. Algunos de los métodos más comunes son:

  • Etiqueta meta «noindex»: Agrega la etiqueta meta «noindex» en la sección del encabezado HTML de la página que deseas excluir de la indexación. Esta etiqueta indica a los motores de búsqueda, incluido Google, que no deben indexar esa página. El código HTML sería: <meta name=»robots» content=»noindex»>.
  • Archivo robots.txt: Puedes bloquear la indexación de una página o de todo un directorio utilizando el archivo robots.txt. Este archivo se encuentra en la raíz del sitio web y especifica qué páginas o directorios deben ser rastreados o excluidos. Para evitar que una página se indexe, puedes agregar la línea «Disallow» seguida de la URL de la página en el archivo robots.txt. Por ejemplo: Disallow: /ruta-de-la-pagina.
  • Autenticación de usuarios: Si deseas restringir completamente el acceso y la indexación de contenido, puedes utilizar sistemas de autenticación de usuarios, como el inicio de sesión, para proteger ese contenido. Los motores de búsqueda generalmente no pueden acceder al contenido que requiere autenticación, por lo que no lo indexarán.
Navegación de la serie SEO BásicoAnterior: << Cómo funciona GoogleSiguiente: