Creación de la mejor estrategia de AEO con PointWise

Conclusiones clave

  • La cantidad de artículos generados por IA ha superado la cantidad de artículos escritos por humanos que se publican en la web.
  • Sin embargo, la proporción de artículos generados por IA se ha estancado desde mayo de 2024. A pesar de la prevalencia de artículos generados por IA en la web, en otro estudio mostramos que, en su mayoría, estos artículos no aparecen en Google ni en ChatGPT. No evaluamos si los usuarios reales ven proporcionalmente los artículos generados por la IA, pero sospechamos que no es así
  • Nuestro estudio no evaluó la prevalencia de artículos generados por IA o editados por humanos, y es posible que sean aún más frecuentes.

Motivación

Desde el lanzamiento de ChatGPT en noviembre de 2022, muchas empresas han explorado la posibilidad de publicar contenido generado por LLM como ChatGPT, Claude y Gemini para aumentar su tráfico en canales como la Búsqueda de Google, las redes sociales y la publicidad. Esta es una alternativa rentable a gastar cientos de dólares para que los humanos escriban contenido. La calidad del contenido de la IA está mejorando rápidamente. En muchos casos, el contenido generado por la IA es tan bueno o mejor que el contenido escrito por humanos (estudio del MIT). A menudo es difícil para las personas distinguir si el contenido ha sido creado por IA (estudio sobre la originalidad de la IA). Nuestro objetivo es evaluar la prevalencia de los artículos generados por IA.

Resultados

Descubrimos que, en noviembre de 2024, la cantidad de artículos generados por IA que se publicaron en la web superó la cantidad de artículos escritos por humanos. Observamos un crecimiento significativo de los artículos generados por IA coincidiendo con el lanzamiento de ChatGPT en noviembre de 2022. Después de solo 12 meses, los artículos generados por IA representaron casi la mitad (39%) de los artículos publicados. Los datos brutos de esta evaluación están disponibles aquí.

El crecimiento de los artículos generados por IA se ha estancado

Si bien los artículos generados por IA crecieron drásticamente después del lanzamiento de ChatGPT, no creemos que esa tendencia continúe. En cambio, la proporción de artículos generados por IA se ha mantenido relativamente estable durante los últimos 12 meses. Presumimos que esto se debe a que los profesionales descubrieron que los artículos generados por IA no funcionan bien en las búsquedas, como se muestra en otro estudio.

Metodología

Rastreo común

Common Crawl mantiene uno de los mayores archivos web disponibles públicamente. Proporciona miles de millones de URL y lo utilizan investigadores y desarrolladores, y es una fuente de datos clave para la formación de modelos lingüísticos de gran tamaño.

Selección de artículos

Necesitamos una muestra representativa de artículos en inglés en la web. Para ello, seleccionamos al azar 65 000 URL de CommonCrawl y confirmamos que cada una está en inglés, tiene un marcado de esquema de artículos, tiene al menos 100 palabras, tiene una fecha de publicación entre enero de 2020 y mayo de 2025 y es un artículo o una lista según la clasificación del clasificador de tipos de páginas Graphite.

Algoritmo de detección de IA

La detección precisa del contenido generado por IA es necesaria para hacer afirmaciones sobre la prevalencia de los artículos generados por IA en la web. Existe un considerable desacuerdo sobre la precisión de los algoritmos de detección de la IA, y muchos sostienen que la detección de la IA es imposible o, en el mejor de los casos, muy imprecisa. Muchas empresas ofrecen algoritmos de detección de IA, como Originality.ai, GptZero, Grammarly y Surfer. Para calcular el porcentaje de contenido generado por IA en un artículo, utilizamos el mismo algoritmo descrito en nuestro documento técnico de 2024, pero clasificamos cada fragmento con el detector de IA de Surfer con un tamaño de 500 palabras. Clasificamos un artículo como generado por IA si el algoritmo predice que más del 50% del contenido es generado por IA y que, de lo contrario, está escrito por humanos. Antes de clasificar los artículos de nuestro conjunto de datos, evaluamos la precisión del algoritmo de detección de IA de Surfer.

Limitaciones

eee

  • Item A
  • Item B
  • Item C

Heading 1

Heading 2

Heading 3

Heading 4

Heading 5
Heading 6

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

Block quote

Ordered list

  1. Item 1
  2. Item 2
  3. Item 3

Unordered list

Text link

Bold text

Emphasis

Superscript

Subscript

Case Study
Creación de la mejor estrategia de AEO con PointWise
Learn
Insights
A peek into our branding strategy in PointWise
Learn
White Paper
Our design process explained every step in PointWise
Learn
Suscríbete para recibir las últimas investigaciones y guías de PointWise.
Solo enviamos cosas útiles.
Manténgase actualizado con las últimas ideas y conocimientos de PointLab
¡Uy! Algo salió mal al enviar el formulario.