¿Cómo podemos evitar que los modelos de IA se canibalicen a sí mismos cuando se agoten los datos generados por humanos? Los científicos dicen que han encontrado la respuesta.

Live Science
Los investigadores advierten que la dependencia de datos sintéticos puede causar el 'colapso del modelo', resultando en respuestas erróneas y sin sentido.

Resumen

A medida que el desarrollo de la IA supera la disponibilidad de datos de entrenamiento generados por humanos, los expertos advierten sobre una crisis inminente en la que los modelos deberán entrenarse con datos sintéticos. Esta dependencia de la información creada por máquinas corre el riesgo de causar un 'colapso del modelo', fenómeno en el que los LLM producen contenido cada vez más inexacto, absurdo o alucinado. Abordar la escasez de datos humanos es crucial para mantener la integridad funcional de los futuros sistemas de IA.

(Fuente:Live Science)