Verificador y probador gratuito de Robots.txt

Probador y validador gratuito de robots.txt. Comprueba si alguna URL está bloqueada por tu robots.txt, prueba directivas para Googlebot, Bingbot y rastreadores de IA (GPTBot, ClaudeBot, Perplexity) y detecta errores de sintaxis antes de que afecten tu indexación. Impulsado por el analizador de código abierto de Google. Sin necesidad de registro.

Ingresa una URL
 
Probador de robots.txt gratuito

¿Qué es un verificador de robots.txt?

Un verificador de robots.txt es una herramienta gratuita que obtiene el archivo robots.txt de su sitio y le indica exactamente a qué páginas tiene permitido o bloqueado el acceso cada rastreador web (Googlebot, Bingbot, GPTBot, ClaudeBot, Perplexity). Utiliza la misma lógica de análisis que los rastreadores en vivo, por lo que el veredicto coincide con el de producción.
A diferencia del probado obsoleto de Google Search Console, nuestro probador de robots.txt está desarrollado sobre la biblioteca de análisis oficial de código abierto de Google (compatible con RFC 9309). Pegue una URL específica para ver si está bloqueada y por qué regla, o pegue un robots.txt personalizado para previsualizar los cambios antes de publicarlos.

Cómo probar tu archivo robots.txt

Ingrese su dominio (o una URL específica) en el comprobador de arriba y haga clic en Verificar Robots.txt. En menos de un segundo, la herramienta (1) obtiene su archivo robots.txt en vivo desde /robots.txt, (2) analiza cada bloque de User-agent a través de la biblioteca de código abierto robots.txt de Google y (3) devuelve un veredicto claro para cada rastreador: permitido, bloqueado o afectado por una regla en conflicto. Los errores de sintaxis, los caracteres comodín no válidos, las directivas desconocidas y la falta de declaraciones de Sitemap: se marcan directamente en la línea correspondiente. En 2026, esto importa más allá de Google: Amazon, el New York Times y Reddit ahora bloquean explícitamente a GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot. Si no tiene una opinión sobre el acceso de la IA, su robots.txt está tomando esa decisión por usted de forma predeterminada, así que pruébelo.

¿Qué es un verificador de robots.txt?

Un verificador de robots.txt es una herramienta gratuita que obtiene el archivo robots.txt de su sitio y le indica exactamente a qué páginas tiene permitido o bloqueado el acceso cada rastreador web (Googlebot, Bingbot, GPTBot, ClaudeBot, Perplexity). Utiliza la misma lógica de análisis que los rastreadores en vivo, por lo que el veredicto coincide con el de producción.
A diferencia del probado obsoleto de Google Search Console, nuestro probador de robots.txt está desarrollado sobre la biblioteca de análisis oficial de código abierto de Google (compatible con RFC 9309). Pegue una URL específica para ver si está bloqueada y por qué regla, o pegue un robots.txt personalizado para previsualizar los cambios antes de publicarlos.

Cómo probar tu archivo robots.txt

Ingrese su dominio (o una URL específica) en el comprobador de arriba y haga clic en Verificar Robots.txt. En menos de un segundo, la herramienta (1) obtiene su archivo robots.txt en vivo desde /robots.txt, (2) analiza cada bloque de User-agent a través de la biblioteca de código abierto robots.txt de Google y (3) devuelve un veredicto claro para cada rastreador: permitido, bloqueado o afectado por una regla en conflicto. Los errores de sintaxis, los caracteres comodín no válidos, las directivas desconocidas y la falta de declaraciones de Sitemap: se marcan directamente en la línea correspondiente. En 2026, esto importa más allá de Google: Amazon, el New York Times y Reddit ahora bloquean explícitamente a GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot. Si no tiene una opinión sobre el acceso de la IA, su robots.txt está tomando esa decisión por usted de forma predeterminada, así que pruébelo.

Casos de uso para el comprobador de robots.txt

Seis formas en que los equipos técnicos y de SEO utilizan nuestro probador gratuito de robots.txt, desde detectar bloqueos de indexación accidentales hasta decidir quién puede entrenar modelos con su contenido.

Casos de uso para el comprobador de robots.txt

Seis formas en que los equipos técnicos y de SEO utilizan nuestro probador gratuito de robots.txt, desde detectar bloqueos de indexación accidentales hasta decidir quién puede entrenar modelos con su contenido.

Detecta bloqueos de indexación involuntarios

Una sola directiva Disallow suelta puede borrar categorías enteras de productos, páginas de categorías o publicaciones de blog de Google de la noche a la mañana. El verificador señala las reglas que bloquean rutas críticas para el negocio para que las encuentres antes de que las caídas de indexación aparezcan en GSC.

Detecta bloqueos de indexación involuntarios

Una sola directiva Disallow suelta puede borrar categorías enteras de productos, páginas de categorías o publicaciones de blog de Google de la noche a la mañana. El verificador señala las reglas que bloquean rutas críticas para el negocio para que las encuentres antes de que las caídas de indexación aparezcan en GSC.

Auditar el acceso de los rastreadores de IA

Decide si permites que GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot se entrenen con tu contenido y lo citen. Mira exactamente qué bots de IA deja entrar o deja fuera tu robots.txt actual, una decisión para 2026 que Amazon, NYT y Reddit ya han tomado.

Auditar el acceso de los rastreadores de IA

Decide si permites que GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot se entrenen con tu contenido y lo citen. Mira exactamente qué bots de IA deja entrar o deja fuera tu robots.txt actual, una decisión para 2026 que Amazon, NYT y Reddit ya han tomado.

Valida antes de publicar

Prueba los cambios en tu archivo robots.txt con el mismo analizador de código abierto de Google que utiliza Googlebot. Detecta comodines no válidos, reglas Allow/Disallow conflictivas y directivas desconocidas antes de publicarlo y afectar el acceso de rastreo.

Valida antes de publicar

Prueba los cambios en tu archivo robots.txt con el mismo analizador de código abierto de Google que utiliza Googlebot. Detecta comodines no válidos, reglas Allow/Disallow conflictivas y directivas desconocidas antes de publicarlo y afectar el acceso de rastreo.

Probar reglas por bot

Compruebe exactamente cómo Googlebot, Googlebot-Image, Bingbot o cualquier rastreador de IA interpreta su archivo, incluido el comportamiento alternativo cuando no coincide ningún bloque de User-agent específico. La misma lógica de análisis que Google utiliza internamente, expuesta para que usted la inspeccione.

Probar reglas por bot

Compruebe exactamente cómo Googlebot, Googlebot-Image, Bingbot o cualquier rastreador de IA interpreta su archivo, incluido el comportamiento alternativo cuando no coincide ningún bloque de User-agent específico. La misma lógica de análisis que Google utiliza internamente, expuesta para que usted la inspeccione.

Verificar la declaración del mapa del sitio

Confirma que tu directiva Sitemap: apunte a la URL absoluta correcta, no esté bloqueada por otra regla y sea realmente accesible. Una línea de sitemap faltante o rota es el error de robots.txt más común que vemos en las auditorías técnicas.

Verificar la declaración del mapa del sitio

Confirma que tu directiva Sitemap: apunte a la URL absoluta correcta, no esté bloqueada por otra regla y sea realmente accesible. Una línea de sitemap faltante o rota es el error de robots.txt más común que vemos en las auditorías técnicas.

Probar si una URL específica está bloqueada

Pega cualquier URL de tu sitio y mira inmediatamente si Googlebot (o cualquier otro rastreador) tiene permitido acceder a ella — y si está bloqueada, qué regla exacta es la responsable. Perfecto para depurar errores de "bloqueado por robots.txt" en Search Console sin recurrir a la prueba y error.

Probar si una URL específica está bloqueada

Pega cualquier URL de tu sitio y mira inmediatamente si Googlebot (o cualquier otro rastreador) tiene permitido acceder a ella — y si está bloqueada, qué regla exacta es la responsable. Perfecto para depurar errores de "bloqueado por robots.txt" en Search Console sin recurrir a la prueba y error.

Prueba nuestras otras herramientas de SEO gratuitas

Sin necesidad de registrarse: use cualquier herramienta al instante

Prueba nuestras otras herramientas de SEO gratuitas

Sin necesidad de registrarse: use cualquier herramienta al instante

Cómo funciona AIclicks

Cómo funciona AIclicks

01

Auditoría de marca

Comenzamos mapeando su visibilidad actual de IA, analizando qué tan seguido aparece en las respuestas de los LLM. Esto nos brinda una hoja de ruta precisa de lo que necesita ser corregido, mejorado o creado.

01

Auditoría de marca

Comenzamos mapeando su visibilidad actual de IA, analizando qué tan seguido aparece en las respuestas de los LLM. Esto nos brinda una hoja de ruta precisa de lo que necesita ser corregido, mejorado o creado.

02

Contenido optimizado para IA

Producimos contenido diseñado específicamente para modelos de IA. Reforzamos esto con fuentes dignas de ser citadas y menciones de alta autoridad que ayudan a los sistemas de IA a confiar en tu marca y a referenciarla.

02

Contenido optimizado para IA

Producimos contenido diseñado específicamente para modelos de IA. Reforzamos esto con fuentes dignas de ser citadas y menciones de alta autoridad que ayudan a los sistemas de IA a confiar en tu marca y a referenciarla.

03

Optimización, seguimiento e información de valor

Obtienes acceso a un panel personalizado de visibilidad de IA, actualizaciones semanales de progreso y ciclos de optimización continua. Monitoreamos cambios en las clasificaciones, variaciones en las menciones, competidores y nuevas oportunidades de IA.

03

Optimización, seguimiento e información de valor

Obtienes acceso a un panel personalizado de visibilidad de IA, actualizaciones semanales de progreso y ciclos de optimización continua. Monitoreamos cambios en las clasificaciones, variaciones en las menciones, competidores y nuevas oportunidades de IA.

Explora nuestro blog

Explora nuestro blog

Sigue de cerca cada uno de los principales LLM

AIclicks cubre todos los principales LLM existentes

Sigue de cerca cada uno de los principales LLM

AIclicks cubre todos los principales LLM existentes

Preguntas frecuentes

¿Cómo puedo verificar si mi archivo robots.txt funciona correctamente?

Pegue su dominio en el comprobador de arriba y ejecútelo. La herramienta obtiene su robots.txt en vivo, valida cada bloque de User-agent utilizando el analizador de código abierto oficial de Google (compatible con RFC 9309) y le dice exactamente qué rutas están permitidas o bloqueadas para Googlebot, Bingbot y rastreadores de IA como GPTBot. Detecta errores de sintaxis, comodines no válidos y declaraciones de mapa del sitio que faltan antes de que afecten la indexación.

¿Cuál es la diferencia entre robots.txt y noindex?

Robots.txt controla el rastreo: si un bot puede acceder a una URL o no. Noindex controla la indexación, es decir, si una página rastreada aparece en los resultados de búsqueda. Ambos resuelven problemas diferentes: si bloqueas una página en robots.txt, Google no podrá rastrearla, lo que significa que tampoco podrá ver la etiqueta noindex. Las páginas bloqueadas por robots.txt aún pueden indexarse si otros sitios las enlazan. Para las páginas que deseas ocultar de las búsquedas, utiliza noindex; para el control del presupuesto de rastreo, utiliza robots.txt.

¿Debería bloquear los rastreadores de IA como GPTBot y ClaudeBot?

Depende de su estrategia de contenido. Amazon, el New York Times y Reddit bloquean explícitamente a GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot para mantener su contenido fuera de los datos de entrenamiento y de las respuestas de IA. Sin embargo, bloquear a los bots de IA también reduce la posibilidad de que su marca sea citada en las respuestas generadas por IA, un canal de tráfico en crecimiento. Para la mayoría de las marcas B2B y SaaS, permitir estos bots ayuda con la visibilidad de la IA; para los editores y sitios de contenido premium, bloquearlos protege los ingresos por licencias.

¿Dónde encuentro mi archivo robots.txt?

Su archivo robots.txt se encuentra en el directorio raíz de su dominio, siempre en https://yourdomain.com/robots.txt. Escriba esa URL en cualquier navegador para verlo. Si no carga nada (error 404), su sitio aún no tiene uno, lo que significa que todos los rastreadores están permitidos en todas partes de forma predeterminada. Para WordPress, robots.txt se suele autogenerar de forma virtual; para Shopify, se puede editar a través de robots.txt.liquid; para sitios estáticos, coloque un archivo robots.txt de texto sin formato en su carpeta pública.

¿Cómo soluciono una página bloqueada por robots.txt?

Tres pasos: (1) Ejecute su URL en el verificador de arriba para identificar la regla Disallow exacta que la está bloqueando. (2) Edite su archivo robots.txt para eliminar esa regla, delimitarla de manera más estrecha (por ejemplo, Disallow: /private/ en lugar de Disallow: /) o agregar una directiva Allow: que la anule para la ruta específica. (3) Guarde y vuelva a cargar el archivo, luego use la herramienta de inspección de URL de Google Search Console para solicitar la indexación. Los errores más comunes que vemos en las auditorías: reglas Disallow: / residuales de entornos de prueba, bloqueo de archivos JavaScript o CSS que impiden la renderización de la página y declaraciones de Sitemap: faltantes. El verificador de arriba detecta todo esto automáticamente.

¿Qué significa 'Disallow: /' y cuándo debería usarlo?

Disallow: / bajo User-agent: * bloquea que cualquier rastreador acceda a cualquier ruta de su sitio. Esta es la directiva más destructiva en robots.txt — utilícela solo en entornos de pruebas (staging), servidores de desarrollo privados, o cuando realmente desee desaparecer de los motores de búsqueda. El error de producción más común que vemos: alguien copia el archivo de pruebas a producción y se olvida de eliminar la línea Disallow: /. Para bloquear solo secciones específicas, acote la regla de forma estrecha, por ejemplo, Disallow: /admin/ o Disallow: /cart. Ejecute el verificador de arriba en su sitio en vivo para confirmar que no está bloqueando todo accidentalmente.

Preguntas frecuentes

¿Cómo puedo verificar si mi archivo robots.txt funciona correctamente?

Pegue su dominio en el comprobador de arriba y ejecútelo. La herramienta obtiene su robots.txt en vivo, valida cada bloque de User-agent utilizando el analizador de código abierto oficial de Google (compatible con RFC 9309) y le dice exactamente qué rutas están permitidas o bloqueadas para Googlebot, Bingbot y rastreadores de IA como GPTBot. Detecta errores de sintaxis, comodines no válidos y declaraciones de mapa del sitio que faltan antes de que afecten la indexación.

¿Cuál es la diferencia entre robots.txt y noindex?

Robots.txt controla el rastreo: si un bot puede acceder a una URL o no. Noindex controla la indexación, es decir, si una página rastreada aparece en los resultados de búsqueda. Ambos resuelven problemas diferentes: si bloqueas una página en robots.txt, Google no podrá rastrearla, lo que significa que tampoco podrá ver la etiqueta noindex. Las páginas bloqueadas por robots.txt aún pueden indexarse si otros sitios las enlazan. Para las páginas que deseas ocultar de las búsquedas, utiliza noindex; para el control del presupuesto de rastreo, utiliza robots.txt.

¿Debería bloquear los rastreadores de IA como GPTBot y ClaudeBot?

Depende de su estrategia de contenido. Amazon, el New York Times y Reddit bloquean explícitamente a GPTBot, ClaudeBot, Perplexity-User y OAI-SearchBot para mantener su contenido fuera de los datos de entrenamiento y de las respuestas de IA. Sin embargo, bloquear a los bots de IA también reduce la posibilidad de que su marca sea citada en las respuestas generadas por IA, un canal de tráfico en crecimiento. Para la mayoría de las marcas B2B y SaaS, permitir estos bots ayuda con la visibilidad de la IA; para los editores y sitios de contenido premium, bloquearlos protege los ingresos por licencias.

¿Dónde encuentro mi archivo robots.txt?

Su archivo robots.txt se encuentra en el directorio raíz de su dominio, siempre en https://yourdomain.com/robots.txt. Escriba esa URL en cualquier navegador para verlo. Si no carga nada (error 404), su sitio aún no tiene uno, lo que significa que todos los rastreadores están permitidos en todas partes de forma predeterminada. Para WordPress, robots.txt se suele autogenerar de forma virtual; para Shopify, se puede editar a través de robots.txt.liquid; para sitios estáticos, coloque un archivo robots.txt de texto sin formato en su carpeta pública.

¿Cómo soluciono una página bloqueada por robots.txt?

Tres pasos: (1) Ejecute su URL en el verificador de arriba para identificar la regla Disallow exacta que la está bloqueando. (2) Edite su archivo robots.txt para eliminar esa regla, delimitarla de manera más estrecha (por ejemplo, Disallow: /private/ en lugar de Disallow: /) o agregar una directiva Allow: que la anule para la ruta específica. (3) Guarde y vuelva a cargar el archivo, luego use la herramienta de inspección de URL de Google Search Console para solicitar la indexación. Los errores más comunes que vemos en las auditorías: reglas Disallow: / residuales de entornos de prueba, bloqueo de archivos JavaScript o CSS que impiden la renderización de la página y declaraciones de Sitemap: faltantes. El verificador de arriba detecta todo esto automáticamente.

¿Qué significa 'Disallow: /' y cuándo debería usarlo?

Disallow: / bajo User-agent: * bloquea que cualquier rastreador acceda a cualquier ruta de su sitio. Esta es la directiva más destructiva en robots.txt — utilícela solo en entornos de pruebas (staging), servidores de desarrollo privados, o cuando realmente desee desaparecer de los motores de búsqueda. El error de producción más común que vemos: alguien copia el archivo de pruebas a producción y se olvida de eliminar la línea Disallow: /. Para bloquear solo secciones específicas, acote la regla de forma estrecha, por ejemplo, Disallow: /admin/ o Disallow: /cart. Ejecute el verificador de arriba en su sitio en vivo para confirmar que no está bloqueando todo accidentalmente.

Sé la respuesta #1 en IA

Llegue a millones de consumidores que están usando IA para descubrir nuevos productos y marcas

Sé la respuesta #1 en IA

Llegue a millones de consumidores que están usando IA para descubrir nuevos productos y marcas

Sé la respuesta #1 en IA

Llegue a millones de consumidores que están usando IA para descubrir nuevos productos y marcas