Génesis
Los grandes modelos lingüísticos se enfrentan a una limitación arquitectónica crítica: sus ventanas contextuales son demasiado pequeñas para procesar sitios web enteros. Convertir sitios web complejos con navegación, anuncios, JavaScript y CSS en texto limpio compatible con LLM es difícil e impreciso.
Jeremy Howard, cofundador Fast.ai y profesor en las Universidades de Queensland y Stanford, observó que gran parte del HTML de los sitios consistía en menús, scripts de seguimiento, secciones repetitivas y anuncios, elementos que consumen valiosos tokens en la ventana contextual del LLM sin aportar un valor sustantivo. Inspirándose en la sencillez de robots.txt, Howard creó una norma que permite a los propietarios de sitios web proporcionar a los LLM conocimientos estructurados y especializados en una única ubicación accesible.
Especificaciones técnicas
El estándar llms.txt define una estructura precisa basada en Markdown, que combina la legibilidad humana con la capacidad de análisis sintáctico programático. El archivo debe estar en la ruta principal /llms.txt e incluir las siguientes secciones en un orden específico:
Elementos necesarios:
- Encabezamiento H1 - nombre del proyecto o emplazamiento (única sección obligatoria)
Elementos opcionales pero recomendables:
- Cita en bloque - un resumen conciso del proyecto que contenga la información clave necesaria para comprender el resto del expediente
- Secciones descriptivas - cero o más secciones markdown (párrafos, listas) sin encabezados, que contengan información detallada sobre el proyecto y sobre cómo interpretar los archivos suministrados
- Secciones H2 con listas de archivos - cero o más secciones separadas por títulos H2, que contienen listas de URL con información adicional
- Sección "Opcional - sección de especial interés. Las URL que contiene pueden omitirse cuando se requiera un contexto más breve
Especificación del enlace:
Cada lista de archivos debe contener el nombre de hipervínculo markdown requerido(url) seguido opcionalmente de : y archivar las notas.
La extensión .md
La propuesta también implica que las páginas que contengan información útil para el LLM deben proporcionar una versión limpia de markdown bajo la misma URL con el añadido .md (o index.html.md para las URL sin nombre de archivo).
Ejemplo de aplicación
A continuación encontrará una plantilla llms.txt profesional lista para su personalización e implementación:
Información contextual clave:
- Primera nota importante sobre la naturaleza del negocio o tecnología
- Segunda nota especificando el alcance o las limitaciones
- Tercera nota aclarando el público objetivo
## Recursos principales
- [Página de inicio](https://example.com): Introducción y últimos anuncios
- [Documentación de la API](https://example.com/api): Documentación técnica completa con ejemplos
- [Guía de inicio rápido](https://example.com/quickstart): Incorporación paso a paso para nuevos usuarios
- [Mejores prácticas](https://example.com/best-practices): Patrones probados y recomendaciones
## Preguntas frecuentes y soporte
- [Preguntas frecuentes](https://example.com/faq): Respuestas a las preguntas más comunes de los usuarios
- [Solución de problemas](https://example.com/troubleshooting): Guía de diagnóstico para problemas comunes
- [Contacto](https://example.com/contact): Formulario de contacto y datos de la empresa
## Recursos para desarrolladores
- [Referencia de la API](https://example.com/api-reference): Documentación completa de los endpoints
- [Ejemplos de código](https://example.com/code-examples): Implementaciones prácticas y casos de estudio
- [Registro de cambios](https://example.com/changelog): Historial de cambios y actualizaciones
## Opcional
- [Historia de la empresa](https://example.com/history): Evolución del proyecto e hitos
- [Archivo del blog](https://example.com/blog-archive): Entradas de blog antiguas
- [Política de privacidad](https://example.com/privacy): Información detallada sobre la protección de datosEn el sitio web encontrará directrices detalladas: https://llmstxt.org
Directrices importantes:
- El tamaño del archivo debe limitarse a ~100 KB para un rendimiento óptimo
- Codificación: UTF-8
- Formato: Markdown puro sin HTML
- Todas las URL deben ser absolutas (por ejemplo, https://example.com/url), no relativas
- Los enlaces deben conducir a recursos activos (evitar errores 404)
Opcional llms-full.txt
La norma también prevé un fichero opcional llms-full.txt que contiene la documentación completa y desarrollada en un único archivo. Mientras que llms.txt actúa como índice, llms-full.txt proporciona el contenido completo de todos los documentos enlazados, lo que permite a los sistemas de IA acceder a toda la base de conocimientos con una sola solicitud.
Para consultar una lista de inspiraciones y mapas de llms.txt y llms-full.txt, véase: https://llmstxt.site
Validación y pruebas
Compruébalo:
- Localización y accesibilidad (HTTP 200, sin bucles de reenvío)
- Cabeceras HTTP (Content-Type: text/plain or text/markdown; charset UTF-8)
- Longitud del contenido y compresión GZIP/Brotli
- Frescura del contenido y URL canónicas
- Licencias y atributos de las relaciones con la IA: cómo pueden utilizar sus contenidos los modelos de IA
- Corrección de la sintaxis Markdown, estructura (H1, H2, corrección de los enlaces), por ejemplo, en la página: https://markdownlivepreview.com
Pruebas manuales de accesibilidad:
# Content-Type: text/plain; charset=utf-8
# Content-Length: [tamaño]
curl https://tu-sitio-web.com/llms.txt
# Verificar contenido y formatoPruebas con el LLM
- Pasar la URL a llms.txt a los modelos ChatGPT, Claude, Gemini
- Haga preguntas sobre la información clave de su sitio web
- Comprobar que AI utiliza correctamente los recursos y enlaces indicados
Monitorización de logs y análisis de tráfico en GA4:
Vigilar el tráfico de usuarios-agentes:
- GPTBot (OpenAI)
- Claude-Web (Antrópica)
- GoogleOther (Google AI)
- PerplexityBot (Perplejidad)
- Otros robots de IA
El aumento de visitas a estos bots tras la implantación de llms.txt es un indicador de eficacia. Investigación Insightland demostrado aumento del 600% de las visitas a GPTBot siguiendo la implementación de llms.txt.
los 10 errores más comunes
Error 1: Ubicación incorrecta del archivo
Asunto: Archivo colocado en un subdirectorio en lugar del directorio raíz
Solución: Coloque siempre el archivo exactamente debajo de https://twojastrona.pl/llms.txt no en /seo/llms.txt ni /ai/llms.txt .
Error 2: Falta el encabezado H1 requerido
Asunto: Iniciar un fichero sin una cabecera de nivel 1
Solución: La primera línea debe incluir # Project Name.
Error 3: Codificación incorrecta
Asunto: Archivo guardado en una codificación distinta de UTF-8.
solución: Guarde el archivo con codificación UTF-8 explícita. En la mayoría de los editores: Archivo → Guardar con codificación → UTF-8.
Error 4: Se ha superado el límite de tamaño
Asunto: Archivo superior a 100 KB
Solución: Limite el contenido a los recursos más importantes. Utilice llms-full.txt para consultar la documentación completa.
Error 5: Sintaxis incorrecta de los enlaces Markdown
Asunto: Título (https://url) en lugar de Título(https://url) (espacio antes de los paréntesis)
Solución: Asegúrese de que no haya espacios entre ] a ( .
Error 6: No hay comillas con descripción
Asunto: Omisión de una descripción contextual del proyecto.
solución: Añadir > Breve descripción después de la rúbrica H1 para una mejor comprensión por parte de LLM.
Error 7: Enlaces muertos y errores 404
Asunto: Enlaces a recursos inexistentes.
Solución: Compruebe regularmente todas las URL con herramientas como el comprobador de enlaces rotos.
Error 8: Exceso de contenido irrelevante
Asunto: Lista de todas las subpáginas sin priorización.
solución: Seleccione los 5-15 recursos más importantes. Calidad > cantidad.
Error 9: No se utiliza la sección "Opcional
Asunto: Todos los recursos tienen el mismo nivel de importancia
Solución: Colocar los recursos secundarios en el ## Opcional para que puedan pasarse por alto con un contexto limitado.
Error 10: Fallo de verificación tras la aplicación y fallo de actualización
Asunto: Asunción de que el archivo funciona sin pruebas, sin actualización de contenidos.
Solución: Realice pruebas de validación y accesibilidad después de cada cambio. Añadir información sobre la actualización al mapa -> Última actualización
¿Funciona?
Según los datos Construido con octubre de 2025, 844.473 sitios ha implantado la norma llms.txt. Un análisis de 300.000 dominios realizado por SE Ranking mostró una tasa de adopción de 10.13%la mayoría de las implantaciones proceden del sector de las herramientas para desarrolladores, las plataformas de documentación técnica y las empresas tecnológicas, donde los asistentes de codificación de IA son fundamentales para el negocio.
El estándar llms.txt ha sido adoptado por las principales empresas tecnológicas Anthropic (documentación de Claude), Cloudflare, Stripe, Perplexity, Cursor, Solana, ElevenLabs, Hugging Face, Raycast, Yoast, DataForSEO, Zapier, Mintlify.
Estudio de caso 1: Insightland
Resultados:
- Aumento de las visitas a GPTBot en 600% (de unos cientos a casi 2.000 visitas)
- Apareció Perplexity-User 7 veces en 3 días
- Los bots de TikTok, Moz, Amazon, Petalbot, Bytedance y Bing visitaron el archivo llms.txt
- Aumento del tráfico general del sitio
- Sin impacto negativo en las clasificaciones SEO tradicionales
Estudio de caso 2: WordLift
Resultados:
- Aumento del tráfico orgánico en ~25% después de la implementación de llms.txt
- Mejor indexación por IA, mayor visibilidad en paneles de conocimiento y fragmentos
Estudio de caso 3: Mintlify
Resultados:
- Reducción del tiempo que tarda LLM en procesar la documentación en 40%
- Mejorar la precisión de las respuestas de la IA 30%
- Miles de sitios de documentación técnica recibieron automáticamente archivos llms.txt
Caso práctico 4: Cloudsential
Resultados:
- Aumento significativo de la visibilidad de la IA
- Cloudsential aparece como fuente principal de consultas relacionadas con SEO ChatGPT
Pruebas de la eficacia del OGE
Estudio de optimización generativa de motores (GEO) realizado por el equipo científico demostró que el uso de estrategias de optimización de contenidos para motores generativos puede aumentar la visibilidad de una fuente en un hasta el 40 en las respuestas generadas por la IA.
Los métodos GEO más eficaces:
- Añadir citas - aumento de la visibilidad de más del 40
- Añadir estadísticas - aumento de la visibilidad de más del 30%
- Optimización de la fluidez de los contenidos - aumento significativo
- Cita de fuentes - mejora significativa
- Terminología técnica - mejora moderada
El estudio llevó a cabo una evaluación sistemática sobre una referencia GEO-BENCH consistente en 10.000 consultas diversas de múltiples dominios.
Integración en el ecosistema GEO/AEO
La norma llms.txt es un elemento fundamental de la estrategia más amplia de Optimización Generativa de Motores (GEO) y Optimización de Respuestas de Motores (AEO). He aquí los elementos clave del enfoque completo e integral:
1. El SEO ya no es un "must have", apuesta por GEO/AEO
El SEO tradicional sigue siendo clave, pero no garantiza por sí mismo la visibilidad en los modelos LLM. Cada vez más análisis muestran que incluso las marcas con un SEO bien desarrollado no siempre aparecen en las respuestas de los modelos. Al mismo tiempo, hay ejemplos de marcas que prácticamente no realizan actividades de SEO y, sin embargo, son citadas por LLM, lo que indica que la visibilidad en la IA depende de factores distintos a la autoridad estándar de los motores de búsqueda.
Las investigaciones disponibles sobre la visibilidad de las marcas en las respuestas de los grandes modelos lingüísticos demuestran que incluso las marcas globales pueden permanecer invisibles a pesar de clasificarse bien en el SEO tradicional. Nuestras propias pruebas de visibilidad en Google y en los LLM indican que algunas marcas apenas aparecen en los resultados de frases de categorías clave en Google, mientras que los modelos LLM siguen citándolas. Esto sugiere que estas marcas no tienen actividades de SEO consistentes, lo que limita su visibilidad en los motores de búsqueda, pero no afecta en la misma medida a su presencia en las respuestas de los LLM.
Tomasz Cincio - Director General de Semly.ai
2. Datos estructurales (Esquema.org)
Implantación del esquema de marcado para PREGUNTAS FRECUENTES, Artículo, Producto y otros tipos de contenido aumenta la probabilidad de citación. Las páginas con datos estructurados completos tienen muchas más probabilidades de ser citadas por la IA
3. Arquitectura de contenidos adaptada a la IA
- Carga frontal: Información clave al principio del contenido
- Estructura jerárquica: Títulos H1-H6 claros
- Cartas y viñetas: Aumentar la extractabilidad mediante la IA, es decir, la capacidad de un modelo lingüístico para extraer, recordar o reproducir datos
- Párrafos cortos<25 palabras por frase, <100 palabras por párrafo
Vea cómo los robots modelo de IA ven su sitio, en lugar de https://semly.ai introduzca su dirección: https://r.jina.ai/https://semly.ai
4. Autoridad y contenido
- Citas externas: Menciones de terceros acreditados
- Autoridad de dominio: Visibilidad global del sector
- Frescura del contenido: Las páginas actualizadas en los últimos 12 meses tienen el doble de probabilidades de recibir citas
5. Puntuación de visibilidad de marca
Diseño: (Respuestas que mencionan su marca ÷ Número total de respuestas) × 100
Métricas de apoyo:
- Tasa de citas: % de respuestas LLM que mencionan o enlazan con su marca
- Puntuación del sentimiento: (Menciones positivas + 0,5 × menciones neutras) ÷ Todas las menciones
- Reparto de la voz: % del total de citas en comparación con los competidores
Herramientas de supervisión de la visibilidad de la IA
El mercado de las herramientas de supervisión de la visibilidad de la IA está creciendo rápidamente y las empresas buscan formas de comprender cómo ChatGPT, Gemini, Perplexity u otros modelos presentan su marca o sus productos. El siguiente resumen compara Semly, Profound y Searchable. A diferencia de sus competidores, Semly no sólo mide la visibilidad en IA, sino que es la única herramienta de esta comparativa crea proactivamente datos correctos sobre los productos bajo LLM y agregadores de datos, lo que aumenta de forma realista la posibilidad de que las marcas aparezcan en las recomendaciones de la IA.
| Criterio | Semly (semly.ai) | Profundo (tryprofound.com) | Searchable (searchable.com) |
|---|---|---|---|
| Objetivo general de la herramienta | GEO para el comercio electrónico, los servicios y las marcas: mayor visibilidad en las respuestas LLM y abriendo un nuevo canal de ventas en la búsqueda de IA. | Visibilidad de la IA empresarial: control de la apariencia de las marcas en respuesta a motores generativos y motores de respuesta, informes para grandes equipos. | Conjunto de herramientas avanzadas para la búsqueda de IA: análisis de visibilidad, contenidos, auditorías técnicos y AEO, combinados con datos de GA4 y GSC. |
| Papel frente al LLM y los datos | Crea y normaliza activamente datos en el marco del LLM: construye feeds de productos estructurados para tiendas preparadas para indexación por agregadores de datos utilizados por LLM (ChatGPT, Gemini y otros). Semly no solo mide la visibilidad, sino que proporciona los mismos datos que los modelos deben leer. | Principalmente analítica de seguimiento y visibilidad: Profound Analytics, cómo la IA cita los contenidos de las marcas existentes y de dónde obtienen los datos y cómo está cambiando el share of voice. No crea nuevas fuentes de productos en LLM, sólo funciona con datos existentes. | Principalmente seguimiento y optimización de la visibilidad: Datos de enlaces buscables sobre visibilidad en IA con análisis de tráfico, auditoría de contenidos y on-page. No actúa como gestor de alimentación del LLM, sino como herramienta de análisis y optimización. |
| Centrarse en el comercio electrónico | Sí, comercio electrónico en primer lugar: producto diseñado para tiendas, servicios, marcas y fabricantes que quieran vender a través de la IA. | Más bien, una herramienta empresarial horizontal para marcas de múltiples sectores (SaaS, comercio minorista, finanzas, etc.). | Kit horizontal de OEA: apoya el comercio electrónico pero no es exclusivo para tiendas, se dirige al amplio mercado del marketing-SEO. |
| Tipo de función Visibilidad AI | Visibilidad y ventas: comprueba si los productos y ofertas de la tienda pueden ser recomendados por el LLM y cómo mejorar los datos para aumentar las posibilidades de en las respuestas de compra. | Perspectivas de los motores de respuesta: seguimiento de citas de marcas, fuentes en las que AI encuentra información y comparte en IA los resultados de la búsqueda de las indicaciones seleccionadas. | Dashboard AI search: visibilidad en ChatGPT, Claude, Perplexity etc..., combinado con análisis de tráfico de GA4 y GSC, auditorías OEA y SEO on-page. |
| Introducción de datos | Alimentación de productos (por ejemplo, Google Shopping XML) y raspado de datos para marcas. Semly mapea y procesa los datos en un formulario, que los agregadores de datos y los LLM pueden aprovechar eficazmente. | Grupos de preguntas, palabras clave, dominio, mercados y competidores. Las entradas son principalmente consultas sobre IA y direcciones de servicios. | Dominios, palabras clave, campañas, integraciones con GA4, GSC y CMS (por ejemplo, Webflow, Shopify, WordPress) para combinar visibilidad y tráfico. |
| Motores de IA compatibles (alto nivel) | ChatGPT, Gemini y otros LLM populares y superficies AI utilizadas para buscar servicios y productos (AI shopping, recomendaciones). | ChatGPT, Perplexity, Google AI Overviews / AI Mode, Grok, Meta AI y otros motores de respuesta, especialmente a gran escala empresarial. | ChatGPT, Claude, Perplexity, Google AI, Copilot y classic motores de búsqueda, agrupados en una única vista de visibilidad. |
| Precio de entrada | Desde unos 24 euros al mes para el plan Mini para pequeñas marcas y tiendas (un sencillo servicio de suscripción para marcas). | Precios personalizados para empresas: sin tarifas específicas en el sitio web, presupuesto previo contacto comercial. Reseñas externas indican planes típicos de aproximadamente 399 USD al mes con un plan inicial limitado de unos 99 USD al mes. | Planes de pago sin tarifas abiertas en el sitio web: comienzan con un periodo de prueba gratuito de 7 días Pro, más precios visible sólo cuando vaya a "Ver todos los planes" o contacto con el departamento de ventas. Posicionado como solución tipo premium para equipos de marketing. |
| Nivel de costes frente a Semly | Nivel de entrada para las marcas: coste comparable al de una simple suscripción SaaS o una ida al cine al mes. | Significativamente superior: normalmente un múltiplo del coste de Semly en una escala de mes, diseñado para presupuestos empresariales (marketing, relaciones públicas, SEO). | Entre Semly y Profound, más cerca del segmento de herramientas servicios analíticos y de marketing de primera calidad dirigidos a equipos y agencias, en lugar de marcas individuales. |
| Mejor caso de uso | Una tienda o marca en línea quiere que sus productos o servicios sean realistas y recomendados por ChatGPT, Gemini y otros LLM, y que los agregadores de datos faciliten los datos correctamente. | Una marca empresarial global quiere medir cómo la IA representa a su marca, de dónde obtiene la IA sus datos, cómo es la cuota de voz y la reputación en la IA. | El equipo de marketing o la agencia quieren combinar visibilidad en la búsqueda de IA con análisis de tráfico, auditorías de contenidos y el proceso de creación de contenidos en una sola herramienta. |
Ambos Profundoasí como Búsqueda en son herramientas analíticas avanzadas, pero se centran en el seguimiento de la visibilidad y la reputación de la marca. Semly funciona de forma diferente: combina la supervisión de la visibilidad con la función de creación de datos de LLM, influyendo así en lo que los modelos pueden ver y utilizar. Al mismo tiempo, el coste de entrada de Semly es muchas veces inferior al de las plataformas de empresas extranjeras. Como resultado, Semly actúa como la primera herramienta GEO real diseñada para el comercio electrónico y las marcas que no sólo informa, sino que aumenta activamente la posibilidad de ventas en nuevos canales de IA.
El futuro de la norma
El estándar llms.txt, aunque experimental, evoluciona hacia una adopción más amplia. Google ha incluido llms.txt en su protocolo Agents to Agents (A2A), lo que indica un interés al menos experimental. Mintlify, en noviembre de 2024, habilitó la generación automática de llms.txt para cada sitio de documentación que aloja, añadiendo instantáneamente miles de sitios de documentación técnica al ecosistema.
Jeremy Howard en marzo de 2025, declaró que la visión se extiende más allá de la realidad actual: un estándar web con inteligencia artificial en el que los modelos lingüísticos ya no desperdicien tokens en HTML redundante, sino que puedan centrarse en el conocimiento relevante.
Resumen
El archivo llms.txt representa un cambio fundamental en la forma en que los contenidos web se ponen a disposición de los sistemas de IA. La norma, aunque experimental, ha logrado una adopción masiva (más de 844.000 sitios) y está ofreciendo resultados cuantificables: un aumento del 20 al 40% de la visibilidad en las respuestas de IA, un incremento del 600% en las visitas de bots de IA y una mejora del 30% en la precisión de las respuestas.
Principales resultados:
La aplicación es sencilla, pero requiere precisión: La estructura Markdown, la codificación UTF-8, la ubicación en el directorio raíz y la correcta jerarquía de secciones son claves para la eficacia.
La validación es obligatoria: Utilice, por ejemplo, ChatGPT para validar el mapa antes de su publicación.
Evite los 10 errores más comunescolocación incorrecta, falta de H1, mala codificación, superación del límite de tamaño, sintaxis de enlace incorrecta, falta de blockquote, enlaces muertos, exceso de contenido, ignorar secciones opcionales y falta de pruebas.
Integración con GEO/AEO: llms.txt forma parte de una estrategia más amplia que incluye SEO, datos estructurados, arquitectura de contenidos compatible con IA y creación de autoridad de marca.
Controlar la eficacia: Utilice herramientas como Semly.ai para realizar un seguimiento de la puntuación de visibilidad de la marca, el índice de citas y el share of voice.
Actualizar regularmente: La frescura del contenido es fundamental: las páginas actualizadas en los últimos 12 meses tienen el doble de probabilidades de ser citadas.
En una era en la que la IA se está convirtiendo en la interfaz dominante de descubrimiento de información, el control sobre cómo los modelos lingüísticos interpretan y presentan su marca se está convirtiendo en un imperativo estratégico. La norma llms.txt, respaldada por pruebas empíricas y una adopción cada vez mayor, representa un paso fundamental hacia una web que da prioridad a la IA.
FAQ - Preguntas más frecuentes
¿Es llms.txt una norma oficial?
No, llms.txt es un estándar propuesto creado por Jeremy Howard. Ningún proveedor importante de LLM ha confirmado oficialmente que lea estos archivos, pero las pruebas empíricas (aumento de visitas de bots de IA, estudios de casos) sugieren que el estándar se utiliza en la práctica.
¿Garantiza la aplicación de llms.txt la citación por parte de la IA?
No, llms.txt no garantiza las citas. Sin embargo, aumenta la probabilidad y relevancia de las citas al facilitar a la IA el acceso a contenidos clave. Los estudios muestran un aumento del 20-40% en la visibilidad después de la implementación.
¿llms.txt sustituye a robots.txt o sitemap.xml?
No. Cada uno de estos archivos tiene una finalidad distinta:
- robots.txt - control de acceso a los robots de indexación
- mapa del sitio.xml - lista de todas las páginas indexables para los motores de búsqueda
- llms.txt - mapa curatorial de recursos clave para la IA
¿Con qué frecuencia debo actualizar llms.txt?
Al menos trimestralmente o después de cualquier cambio significativo en la estructura del sitio, adición de contenido clave o cambio de marca. Los contenidos que llevan más de 12 meses sin actualizarse tienen el doble de probabilidades de ser citados por AI.
¿Puedo tener varios archivos llms.txt para diferentes secciones del sitio?
Sí, la especificación permite ficheros en sub-rutas, por ejemplo https://docs.example.com/llms.txt para la sección de documentación. Mantenga siempre el archivo principal en el directorio raíz del dominio.
¿Cuál es el tamaño óptimo de archivo para llms.txt?
El límite recomendado es de ~100 KB. Los archivos más grandes pueden sobrecargar las ventanas contextuales de LLM. Para documentación extensa, utilice llms-full.txt como suplemento.
¿Afecta llms.txt al SEO tradicional?
Los estudios no han demostrado ningún impacto negativo en las clasificaciones SEO. El archivo es neutral para los motores de búsqueda tradicionales y puede apoyar indirectamente el SEO al mejorar la visibilidad de la marca en la IA, lo que genera tráfico al sitio.
¿Cómo medir la eficacia de llms.txt?
Monitor:
- Registros y tráfico de bots en GA4 (aumento de visitas de bots de IA)
- Herramientas como Semly.ai le mostrarán la visibilidad de su marca en la IA
- Puntuación de visibilidad de marca y share of voice
- Tráfico procedente de motores de búsqueda de IA en Google Analytics
¿Deben las pequeñas empresas implantar llms.txt?
Sí, si le importa la visibilidad en el ecosistema de la IA. La implantación es sencilla (de 1 a 4 horas), poco costosa y puede aportar importantes beneficios con un riesgo mínimo.
¿Qué ocurre si no dispongo de recursos para crear versiones .md para todos los sitios?
Centrarse en los 5-10 recursos más importantes. La calidad y la priorización son más importantes que la exhaustividad. Puede enlazar directamente a HTML, aunque se prefiere Markdown.
Glosario
LLM (Gran Modelo Lingüístico) - un gran modelo lingüístico de inteligencia artificial capaz de comprender y generar texto a partir de enormes conjuntos de datos de entrenamiento
Markdown - lenguaje de marcado ligero para formatear texto, caracterizado por su sencillez y legibilidad
Ventana de contexto - el límite de tokens (unidades de texto) que el LLM puede procesar en una sola petición
GEO (Optimización Generativa de Motores) - el proceso de optimización de contenidos para aumentar las posibilidades de que aparezcan en las respuestas generadas por la IA
AEO (Optimización de motores de respuesta) - sinónimos GEO; optimización para motores de respuesta AI
Análisis - proceso de análisis de una estructura de datos por un programa informático
Usuario-Agente - identificador de bot o navegador en las cabeceras HTTP
Esquema.org - diccionario común de datos estructurales para sitios web
Puntuación de visibilidad de marca - métrica que mide la frecuencia de las menciones de marca en las respuestas de IA
Fuentes
llmstxt.org - especificación oficial de la norma
respuesta.AI (Jeremy Howard) - propuesta y justificación de la norma
llmstxt.site - índice de sitios web que ya han implementado el mapa llms.txt o full-llms.txt
r.jina.ai/https://semly.ai - compruebe cómo ven su sitio web los robots de inteligencia artificial
Investigación: GEO - encuesta académica (aumento del 40% de la visibilidad)
Aggarwal P. et al, "GEO: Generative Engine Optimization", KDD '24, 2024 - investigación y marco novedosos para optimizar la visibilidad de los contenidos en sistemas de IA generativa.
Compartir:
