Los LLM pueden desenmascarar a usuarios anónimos a gran escala con una precisión sorprendente

Ars Technica
Los modelos de lenguaje grandes (LLM) pueden identificar individuos a partir de texto anonimizado con una precisión sorprendente, aprovechando las capacidades de navegación web y razonamiento.

Resumen

Investigadores han demostrado que los LLM pueden desanonimizar a usuarios a partir de datos de texto, incluso comenzando con transcripciones anonimizadas. A diferencia de los métodos anteriores que requerían datos estructurados, los LLM pueden navegar por la web y utilizar el razonamiento para identificar a las personas. En experimentos, identificaron con éxito al 7% de los participantes en un cuestionario y a porcentajes variables de usuarios de Reddit según sus preferencias de películas, con tasas de identificación que aumentan con más información compartida. El estudio destaca la creciente capacidad de la IA para comprometer el anonimato y plantea preocupaciones sobre la privacidad a medida que los sistemas de IA mejoran.

(Fuente:Ars Technica)