-
Una cantante y otros siete artistas iraníes, condenados a 74 latigazos por un concierto
-
Infantino en jet privado, símbolo de los excesos de la FIFA
-
España y Uruguay: un golpe sobre la mesa para sentarse ya con los otros campeones
-
Bezzecchi se disculpa tras golpear a un comisario
-
La nostalgia de Sicilia en la última colección de Dolce & Gabbana en Milán
-
Islandia reanuda la caza de ballenas tras dos años de parón
-
Milei respalda a su jefe de ministros, investigado por enriquecimiento ilícito
-
Irán y EEUU vuelven a Suiza para negociar el fin de la guerra en Oriente Medio
-
El plan militar de la ultraderecha divide a Colombia en vísperas del balotaje
-
Brasil investiga un posible ataque pirata a su sistema de alertas de emergencia
-
Cinco cosas destacadas de la Semana de la Moda masculina de París
-
Irán y EEUU listos para iniciar negociaciones tras aplazamiento y ataques
-
Colombia elige entre un candidato pro-Trump y un delfín de la izquierda en el poder
-
Bajo estado de excepción, militares y policías despejan vías bloqueadas en Bolivia
-
Alemania vuelve a unos cruces mundialistas; una ola Oranje arrolla a Suecia
-
Militares y policías de Bolivia despejan vías bloqueadas por manifestantes bajo estado de excepción
-
Bagnaia gana el esprint, Márquez hace podio y Bezzecchi excluido para la carrera
-
Autoridades de Gaza reportan once muertos en ataques israelíes
-
La ola "oranje" se lleva por delante a Suecia el día que el Mundial llega a 1.000 partidos
-
Militares y policías de Bolivia comienzan a levantar barricadas con el estado de excepción
-
Meloni critica los "ataques constantes e injustificados" de Trump
-
La ONU expresa preocupación por las nuevas medidas migratorias en la UE
-
Autoridades de Gaza reportan cinco muertos en ataques israelíes
-
Explosiones al borde de una carretera dejan siete muertos en Pakistán
-
Alerta máxima por ola de calor en más de un tercio de Francia el domingo
-
Un muerto por un bombardeo ruso en la ciudad ucraniana de Járkov
-
El flamenco "es un arte muy visceral, muy directo", destaca la 'bailaora' Eva Yerbabuena
-
Bolivia declara el estado de excepción y comienza a levantar barricadas
-
Alemania busca imponer su ley en el Mundial 2026 ante la irreverente Costa de Marfil
-
James Burrows, prolífico director detrás de series como "Friends", muere a los 85 años
-
Altos cargos ucranianos renuncian a distinciones polacas en apoyo a Zelenski
-
Bagnaia gana el esprint, Márquez hace podio y Bezzecchi se va al suelo
-
La policía brasileña interrogará a Bolsonaro por un arma confiscada a su escolta
-
Organismos de DDHH de Ecuador dicen que la activista polaca fue asesinada
-
"Como en China": los cubanos celebran las reformas, pero la diáspora espera más aún
-
El cacique Raoni, "grave pero estable" en un hospital de Sao Paulo
-
El funeral de David Hockney se celebró en la más estricta intimidad, según su representante
-
Muere François Englert, co-laureado del Nobel de Física por el bosón de Higgs
-
Identifican al maquinista como la víctima mortal del accidente ferroviario cerca de Londres
-
EEUU recibe un nuevo Air Force One donado por Catar
-
Irán anuncia el cierre del estrecho de Ormuz en respuesta a los ataques de Israel en Líbano
-
Altos cargos ucranianos renuncian a las distinciones polacas en apoyo a Zelenski
-
Guatemala anuncia un plan para localizar a miles de desaparecidos durante la guerra civil
-
Hallan una estructura y estela prehispánicas "nunca vistas" en México
-
Evacuan a la presidenta de Costa Rica tras un ruido de explosión en una zona de minería ilegal
-
Panamá difunde una auditoría que avala la explotación de una polémica mina de cobre
-
Declaran culpable de agresión sexual a un magnate de autopartes en Canadá
-
Albania acusa a 27 personas por protestar contra un centro turístico vinculado a Trump
-
Bagnaia gana la carrera esprint en Brno, el líder Bezzecchi se cae
-
El gobierno argentino confirma que una empresa belga operará la hidrovía Paraguay-Paraná
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
C.Kreuzer--VB