Local Max
Volver al blog
SEO Técnico12 min de lectura· 2021-07-29

Cómo indexar tu web en Google 2026: guía técnica completa

Guía técnica 2026 para indexar tu web en Google: sitemap, robots.txt, Search Console, IndexNow, crawl budget, problemas de indexación y soluciones.

Cómo indexar tu web en Google
EL

Eduardo López Parada

Fundador · Local Max

Indexar tu web en Google es el prerrequisito absoluto para SEO. Sin indexación, tu contenido no existe para Google ni para buscadores. En 2026, el proceso ha evolucionado: además de sitemap.xml + robots.txt tradicionales, IndexNow (Microsoft + Yandex + otros) acelera indexación, Search Console permite request manual, y el crawl budget de Google se ha vuelto más estricto. Esta guía técnica explica cómo asegurar que tu contenido se indexa correctamente, cómo diagnosticar problemas y cómo acelerar el proceso.

Cómo funciona la indexación en Google 2026

  1. 1Discovery: Google descubre URLs via sitemap.xml, internal links, backlinks externos, IndexNow ping, request manual en Search Console.
  2. 2Crawling: Googlebot visita la URL, descarga HTML + CSS + JS, renderiza la página.
  3. 3Indexing: Google evalúa contenido, decide si vale indexar, almacena en su índice.
  4. 4Ranking: cuando alguien busca, Google ordena resultados indexados según relevancia + autoridad.

Tasa típica de indexación: páginas de calidad bien linkeadas indexan en 1-7 días. Páginas mediocres pueden tardar 30-90 días o nunca indexarse (Google decide no incluirlas).

Setup técnico imprescindible para indexación

1. Sitemap.xml

  • Generar sitemap.xml: con plugin SEO (Yoast, RankMath, AIOSEO en WordPress), módulo Next.js, o manualmente.
  • Estructura: una URL por línea con , , , opcionales.
  • Submit a Google Search Console: Sitemaps section.
  • Sitemap index si > 50.000 URLs: múltiples sitemaps referenciados.
  • Sitemaps específicos: products, posts, categorías, images separados pueden mejorar gestión.
  • Actualización automática: cuando publicas/editas/eliminas contenido, sitemap debe regenerarse.

2. Robots.txt

  • Ubicación: tudominio.com/robots.txt (root).
  • User-agent rules: especificar qué crawlers permitir.
  • Disallow para áreas privadas: /admin/, /private/, /tmp/, /api/.
  • Allow específico: si necesitas permitir excepciones dentro de Disallow.
  • Sitemap declaration: línea Sitemap: https://tudominio.com/sitemap.xml al final.
  • NO usar Disallow para evitar indexar: usar meta robots noindex en su lugar.

3. Google Search Console

  1. 1Verificar propiedad del dominio: con DNS TXT record (prefiere Domain property).
  2. 2Submit sitemap.xml: en sección Sitemaps.
  3. 3Index Coverage report: ver qué URLs están indexadas/excluidas/con error.
  4. 4URL Inspection tool: verificar URL específica + request indexing si necesario.
  5. 5Performance report: queries, CTR, posiciones, impresiones.
  6. 6Core Web Vitals report: field data CrUX.
  7. 7Manual Actions report: alertas si tu site recibe penalty manual.
  8. 8Security Issues report: malware, hacked content.

4. IndexNow (Microsoft + Yandex + más)

  • Qué es: protocolo de notificación rápida a buscadores. Cuando publicas/actualizas, envías ping a IndexNow API.
  • Compatibilidad: Bing, Yandex, Seznam, Naver, otros. Google NO soporta IndexNow oficialmente pero algunos plugins lo integran con request automático.
  • Plugins: en WordPress con RankMath, Yoast SEO, AIOSEO con integración nativa.
  • Beneficio: indexación en Bing/Yandex 1-2 días vs 2-4 semanas normal.

Diagnóstico de problemas de indexación

Síntomas comunes

  • "Indexado, pero no envió a sitemap": URL indexada pero no en sitemap. Verifica sitemap regeneración.
  • "Detectada, sin indexar": Google conoce URL pero no la indexa. Suele indicar calidad insuficiente.
  • "Rastreada, sin indexar": Google visitó URL pero decidió no indexar. Calidad o duplicate content.
  • "Excluida por etiqueta noindex": meta robots noindex bloquea. Revisar HTML head.
  • "Bloqueada por robots.txt": revisar robots.txt rules.
  • "Error 4xx" o "5xx": problemas server. Revisar logs hosting.
  • "Soft 404": página parece 404 sin serlo. Revisar contenido.
  • "Duplicate, alternate": Google considera duplicate de otra URL. Revisar canonical.

Cómo acelerar indexación 2026

  1. 1Request manual en Search Console: URL Inspection > "Request Indexing". Útil para 1-10 URLs urgentes.
  2. 2Internal linking estratégico: enlazar URLs nuevas desde páginas con autoridad ya indexadas.
  3. 3Backlinks externos: backlinks acelerañ discovery + indexación dramáticamente.
  4. 4Compartir en redes: especialmente Twitter/X (Google rastrea).
  5. 5Pinging via IndexNow: aunque Google no soporta oficialmente, integraciones aceleran.
  6. 6Sitemap actualizado al instante: con timestamp actual cuando publicas.
  7. 7Calidad del contenido: páginas con > 800 palabras únicas indexan más rápido que thin content.
  8. 8Mobile-friendly + velocidad: Google rastrea más eficientemente sites bien optimizados.

Crawl budget en 2026

Crawl budget es cuántas URLs Googlebot rastrea de tu site por día. Importante para sites con > 1.000 URLs. Cómo optimizar:

  • Bloquear URLs sin valor: facetas filtros, parámetros, paginations infinitas en robots.txt.
  • Canonical tags correctos: evitar duplicate content que desperdicia budget.
  • Velocidad de carga rápida: Google rastrea más en sites rápidos.
  • Sitemap solo con URLs canónicas indexables: no incluir URLs noindex o canonicalizadas.
  • Eliminar 404 y 5xx errors: cada error consume budget.
  • Reducir redirect chains: cada redirect cuesta budget.
  • Internal linking jerárquico: páginas importantes deben estar a < 3 clicks del home.

Errores frecuentes con indexación

  1. 1Disallow en robots.txt cuando quieres noindex: Disallow impide rastreo pero página puede aparecer en SERPs sin contenido. Usar meta noindex.
  2. 2Sitemap no actualizado: contenido nuevo no en sitemap = descubrimiento lento.
  3. 3Mal canonical: canonical apuntando a otra URL hace que Google no indexe la original.
  4. 4Hreflang mal configurado: multi-idioma con hreflang erróneo confunde.
  5. 5JavaScript-heavy sin SSR: Google renderiza JS pero más lento + a veces falla. SSR mejora.
  6. 6Sin Search Console configurado: estás ciego sobre estado de indexación.
  7. 7Demasiadas URLs noindex: > 30 % de URLs noindex confunde a Google.
  8. 8Subdominios sin Search Console: cada subdomain requiere su propia propiedad.

¿Tu web no se indexa correctamente?

60 minutos gratis con un consultor SEO técnico. Auditamos sitemap, robots.txt, Search Console, problemas indexación. Plan accionable con prioridades para indexar correctamente en 2-4 semanas.

Reservar auditoría indexación

Preguntas frecuentes

¿Cuánto tiempo tarda Google en indexar una web?

Plazos típicos 2026 según factores: 1) Dominio establecido con autoridad alta (DR > 40): páginas nuevas indexan en 1-24 horas con sitemap + request manual. 2) Dominio establecido medio (DR 20-40): 1-7 días para indexación normal. 3) Dominio nuevo (< 3 meses): sandbox period extiende a 2-6 semanas para primera indexación. 4) Dominio nuevo sin backlinks: hasta 4-8 semanas para descubrimiento inicial. Factores que aceleran: a) Sitemap.xml submitted + actualizado al publicar. b) Internal linking desde páginas con autoridad. c) Backlinks externos de calidad. d) Compartir en Twitter/X (Google rastrea). e) Request manual en Search Console URL Inspection. f) Calidad del contenido > 800 palabras únicas. g) Mobile-friendly + velocidad de carga rápida. Factores que retrasan: a) Sandbox dominio nuevo (sin remedy hasta tiempo). b) Calidad de contenido baja (thin content, AI sin valor). c) Crawl budget agotado en sites grandes con poca autoridad. d) Errores técnicos (5xx, 4xx, redirect chains). e) Penalty manual o algorítmica. f) JavaScript-heavy sin SSR. Workflow recomendado tras publicar contenido nuevo: 1) Verificar sitemap.xml incluye la URL. 2) Search Console URL Inspection > Request Indexing (límite 10/día). 3) Compartir URL en redes (Twitter/X, LinkedIn). 4) Linkar desde 2-3 posts existentes con autoridad. 5) Esperar 24-72h antes de checkear estado en Search Console. NUNCA promete instant indexing — servicios que ofrecen 'indexación en 24h garantizada' suelen ser scam o usan métodos Black Hat que dañan dominio a largo plazo.

¿Por qué Google no indexa mi página?

Razones más comunes 2026 + solución: 1) 'Detectada, sin indexar' (calidad insuficiente): Google decidió que no merece indexar. Solución: mejorar calidad contenido (> 800 palabras únicas, EEAT, original), añadir internal links desde páginas con autoridad, conseguir backlinks externos. 2) 'Rastreada, sin indexar' (decisión post-crawl): similar al anterior pero Google sí visitó. Misma solución. 3) 'Excluida por noindex': meta robots noindex en HTML head bloquea. Solución: eliminar tag o cambiar a 'index, follow'. 4) 'Bloqueada por robots.txt': robots.txt impide rastreo. Solución: revisar reglas, eliminar Disallow para esa URL. 5) Errores 4xx/5xx: página devuelve error. Solución: arreglar problema server o 404 incorrectos. 6) Soft 404: contenido parece 404 (vacío, error message implícito). Solución: añadir contenido sustancial o configurar 404 real. 7) Duplicate canonical: tu canonical apunta a otra URL. Solución: verificar canonical tag, debe apuntar a sí misma si es la URL preferida. 8) Calidad URL: caracteres extraños, parámetros confusos. Solución: URLs amigables descriptivas. 9) Sandbox dominio nuevo: dominio < 3 meses tarda. Solución: paciencia + construcción autoridad. 10) Crawl budget agotado: site con > 10.000 URLs sin autoridad alta. Solución: bloquear URLs sin valor en robots.txt, optimizar internal linking. 11) Penalty manual: Search Console > Manual Actions. Solución: corregir + reconsideration request. 12) Sin links internos: página huérfana. Solución: añadir 3-5 internal links desde páginas indexadas. Workflow de diagnóstico: 1) Search Console > URL Inspection con la URL específica. 2) Ver 'Coverage' y razón específica. 3) Aplicar solución según diagnóstico. 4) Request indexing tras corregir. 5) Esperar 1-14 días para resolverse.

¿Es obligatorio el sitemap.xml para indexar?

No obligatorio, pero muy recomendado en 2026. Google puede descubrir URLs sin sitemap a través de: 1) Backlinks externos. 2) Internal links desde páginas indexadas. 3) Submit manual en Search Console (URL por URL). 4) Mention en Twitter/X (Google rastrea). 5) IndexNow ping (Bing, Yandex; Google no oficial). PERO sitemap.xml acelera dramáticamente el proceso: 1) Lista completa de URLs que quieres indexar. 2) <lastmod> indica cuándo se actualizó cada URL (Google prioriza recientes). 3) <priority> sugiere importancia relativa (Google la considera de forma orientativa). 4) <changefreq> indica frecuencia esperada de cambios. 5) Sitemap index permite múltiples sitemaps para sites grandes (> 50.000 URLs). Especialmente importante para: 1) Sites nuevos: ayuda discovery inicial cuando autoridad y backlinks son bajos. 2) Sites grandes: > 1.000 URLs imposible descubrir sin sitemap eficientemente. 3) Sites con contenido dinámico: ecommerce, foros, marketplaces con miles de URLs cambiantes. 4) Sites con poca internal linking: páginas huérfanas se descubren via sitemap. 5) Multi-idioma: hreflang funciona mejor con sitemap. Cómo generar sitemap 2026: 1) WordPress: Yoast SEO, RankMath, AIOSEO generan automáticamente. URL típica: /sitemap_index.xml o /sitemap.xml. 2) Next.js, Astro, Gatsby: generan automáticamente vía plugins o configuración. 3) Sitio custom: scripts generadores como sitemap-generator-cli, simple-sitemap (Node.js), sitemaper.com (online free). 4) Manual XML: para sitios estáticos pequeños. Validación: 1) Verificar XML válido con Google's Sitemap Validator. 2) Submit en Search Console > Sitemaps. 3) Monitorizar 'Success' status + 'Discovered URLs' count. Ubicación estándar: tudominio.com/sitemap.xml (también en robots.txt como referencia).

¿Qué es el crawl budget y cómo afecta a mi web?

Crawl budget es la cantidad de URLs que Googlebot decide rastrear de tu site en un período (día/semana). Tiene 2 componentes: 1) Crawl rate limit: cuán rápido puede Googlebot rastrear sin sobrecargar tu server. Google ajusta dinámicamente. 2) Crawl demand: cuántas URLs Google quiere rastrear según interés/freshness. Importancia 2026 según tamaño site: 1) Site pequeño (< 1.000 URLs): NO te preocupes por crawl budget. Google rastrea todo. 2) Site mediano (1.000-10.000 URLs): empezar a optimizar pero rara vez problema. 3) Site grande (10.000-1M URLs): crítico. 4) Site enterprise (> 1M URLs): foco prioritario. Cómo Google decide tu crawl budget: 1) Autoridad de dominio (DR/DA): sites con más autoridad reciben más budget. 2) Velocidad del server: si tu site responde rápido (< 200ms TTFB), Google rastrea más. 3) Errores: si Google encuentra muchos 5xx, baja tu budget. 4) URLs valiosas: si Google encuentra contenido valioso, asigna más budget al site. Cómo optimizar crawl budget 2026: 1) Bloquear URLs sin valor en robots.txt: facetas filtros (?color=red), parámetros tracking (?utm_*), paginaciones infinitas. 2) Canonical tags correctos: evitar duplicates que desperdician budget. 3) Sitemap solo con URLs canónicas indexables: no incluir noindex, redirects, duplicates. 4) Eliminar 404 y 5xx errors: cada error desperdicia budget. 5) Reducir redirect chains: cada redirect cuesta una request. Máximo 1 hop. 6) Velocidad de carga rápida: server response < 200ms, page load < 3s. 7) Internal linking jerárquico: páginas importantes a < 3 clicks desde home. 8) Pagination con rel='next/prev' correcto. 9) Schema markup para ayudar entender contenido. 10) HTTPS + HTTP/2 para eficiencia. Monitorización en Search Console: Settings > Crawl Stats > muestra requests/día, response time, file size, status codes. Sites con crawl budget problems pierden indexación de páginas valiosas mientras Google malgasta rastreando URLs duplicate o sin valor. Optimización paga: 2-4x páginas indexadas con mismo presupuesto crawl.

¿Cómo verifico si mi web está indexada en Google?

Métodos 2026 por orden de fiabilidad: 1) Google Search Console (más completo): a) Verificar propiedad del dominio si no lo has hecho. b) Sección 'Coverage' o 'Indexing' > 'Pages' (UI 2024): muestra todas las URLs y status (Indexed / Not Indexed con razón). c) URL Inspection tool: introducir URL específica, muestra exactly su estado. Método más preciso. 2) Site search en Google: a) Buscar 'site:tudominio.com' en Google. Muestra aproximadamente cuántas URLs tienes indexadas. b) 'site:tudominio.com/pagina-especifica' para verificar URL exacta. Limitación: cifras no son exactas (Google muestra estimación). 3) Google Search Performance report: a) En Search Console > Performance. Muestra impresiones, clicks, CTR, posiciones de TODAS tus páginas indexadas que reciben impressions. b) Si una URL aparece aquí = está indexada. 4) Comprobar cache de Google: 'cache:tudominio.com/pagina' en navegador. Muestra última versión cacheada por Google. Si no muestra cache = NO está indexada. 5) Herramientas SEO third-party: a) Ahrefs Site Audit: muestra estado indexación detallado. b) Screaming Frog: crawler local que cruza con Search Console data. c) Semrush Site Audit: similar. Workflow de auditoría completa: 1) Search Console > Pages report: cuenta total indexadas vs total URLs descubiertas. Ratio saludable: 80-95 % indexación de URLs canónicas. 2) Site:tudominio.com en Google: aproximación rápida del number. 3) URL Inspection en URLs clave (homepage + 5-10 páginas importantes): verificar individualmente. 4) Sitemap.xml submitted: comparar URLs en sitemap vs indexadas. Si ratio < 50 %, problema de calidad o técnico. 5) Coverage > 'Not indexed' report: identificar razones específicas de no-indexación + corregir. Frecuencia recomendada: 1) Semanal: check rápido Search Console por nuevos errores. 2) Mensual: auditoría completa de páginas críticas. 3) Trimestral: análisis profundo de patterns + optimización crawl budget.

¿Qué es IndexNow y vale la pena implementarlo?

IndexNow es un protocolo open-source de notificación a buscadores lanzado en 2021 por Microsoft Bing + Yandex. Permite a sites notificar instantáneamente a buscadores cuando se publica/actualiza/elimina contenido, en vez de esperar a que el crawler descubra cambios. Buscadores compatibles 2026: 1) Bing (Microsoft): integración nativa, muy efectiva. 2) Yandex (Rusia): similar. 3) Seznam (República Checa). 4) Naver (Corea). 5) IndexNow Singapore. 6) GoogleBot: NO soporta oficialmente IndexNow. PERO algunas integraciones notifican a Google via otros canales en paralelo. ¿Vale la pena? Análisis: 1) PARA Bing/Yandex/Seznam/Naver: SÍ, muy efectivo. Indexación 1-2 días vs 2-4 semanas normal. 2) PARA Google: indirectamente útil. Muchos plugins (RankMath, Yoast, AIOSEO) integran IndexNow + también request indexing manual a Google Search Console API. 3) PARA SEO Local España: Bing tiene 5-10 % de búsquedas. Yandex es casi inexistente en España. Beneficio neto medio para mercado español. 4) PARA SEO internacional: si trabajas mercados como Rusia, Asia, Europa Este, IndexNow es crítico. Cómo implementar 2026: 1) WordPress: a) Yoast SEO Premium: integración nativa. b) RankMath: incluido en free version. c) AIOSEO: integración disponible. 2) Custom site: a) Generar API key (string aleatorio mínimo 8 caracteres). b) Hospedar archivo APIKEY.txt en root del dominio (verificación ownership). c) Hacer POST request a https://api.indexnow.org/indexnow con JSON {host: 'tudominio.com', key: 'APIKEY', urlList: ['url1', 'url2']}. d) Plugin/integración para automatizar al publish. 3) Verificación: dashboard de Bing Webmaster Tools muestra IndexNow submissions + status. Coste: 0 € (free protocolo open-source). Tiempo setup: 1-2 horas para custom integration; 5 minutos para plugin WordPress. Recomendación: implementar SIEMPRE — coste/beneficio claramente positivo aunque Google no lo soporte oficialmente.

¿Qué errores técnicos impiden la indexación más frecuentemente?

Errores técnicos más graves 2026 que impiden indexación: 1) Disallow en robots.txt incorrecto: bloqueas URL que querías indexar. Verificar robots.txt no tiene 'Disallow: /' o paths críticos bloqueados. 2) Meta robots noindex inesperado: theme/plugin añade noindex sin tu permiso. Inspeccionar HTML head con 'view-source:url' o Chrome DevTools. 3) Canonical apuntando a URL incorrecta: tu canonical dice 'soy duplicate de otra URL', Google no indexa la original. Verificar tag canonical en HTML head. 4) Errores 5xx server: site cae intermitentemente. Google reintenta pero si falla mucho, baja crawl budget + no indexa. Monitorización con UptimeRobot, Pingdom. 5) Soft 404: página devuelve HTTP 200 pero contenido es 'page not found' o vacío. Google detecta y trata como 404. Configurar páginas verdaderamente 404 o añadir contenido. 6) JavaScript heavy sin SSR: Google renderiza JS pero proceso es más lento + a veces falla parsing. SPAs sin pre-rendering tardan más. Solución: SSR con Next.js, SSG con Gatsby/Astro, o dynamic rendering. 7) Redirect chains > 5: cada redirect cuesta crawl budget. Limpiar chains a máximo 1 hop. 8) Hreflang incorrecto en multi-idioma: idiomas mal configurados confunden Google + canibalizan. Verificar con Search Console > International Targeting. 9) URLs con caracteres especiales: espacios, acentos, símbolos. URLs amigables ASCII lowercase. 10) HTTPS mixed content: site HTTPS con recursos HTTP. Daña indexación + security warning. 11) Sitemap.xml con URLs noindex o canonicalizadas: confunde Google. Solo URLs canónicas indexables. 12) robots.txt con sitemap declaration incorrecta: 'Sitemap: https://...' line mal formateada. 13) Subdominios sin verificar en Search Console: cada subdomain (blog.dominio.com, shop.dominio.com) requiere propia property. 14) HTTPS certificate inválido o expirado: Google deprioriza + browsers warning. 15) Site moved sin 301 redirects: changing dominio sin redirects causa loss masivo de indexación. Diagnóstico: Search Console > Pages report identifica la mayoría. Para diagnóstico profundo: Screaming Frog SEO Spider crawl + Sitebulb + análisis logs server.

▸ ARTÍCULOS RELACIONADOS

Sigue profundizando.

Cluster temático: SEO Técnico

GARANTÍA Y COMPROMISO

Cómo nos jugamos la piel contigo.

La mayoría de agencias de SEO Local te venden esperanza con frases ambiguas y contratos blindados. Local Max funciona al revés: las garantías están por escrito, los objetivos se firman al inicio y el coste de equivocarnos lo asumimos nosotros.

Plan firmado

Antes de empezar firmamos un plan trimestral con objetivos verificables: keyword principal, posición de partida medida con Local Falcon, métrica de éxito y deadline. Sin objetivos genéricos como 'mejorar SEO'.

3 meses sin top 10 = mes gratis

Si tras 90 días de trabajo continuo con presupuesto completo no estás en el top 10 del Map Pack para tu keyword principal acordada, el cuarto mes lo trabajamos sin facturar. No es marketing: está escrito en el contrato.

Cancelas con 30 días

Sin permanencia anual. Sin cláusulas de salida con coste. Si decides parar, avisas con 30 días y te entregamos todo: accesos, credenciales, schema, contenido. Nada se queda atrapado en infraestructura nuestra.

Acceso directo a Eduardo

Tu interlocutor es Eduardo López Parada, fundador. No hay capa de account managers ni juniors. Si tienes una duda urgente vas directamente a quien está tomando decisiones técnicas en tu cuenta.

¿Hablamos de tu ciudad?

Auditoría gratis. Sin compromiso. Respondemos en 24 horas hábiles.

Reservar llamada