
-
Fiscalía de EEUU descarta pena de muerte para narco mexicano Ismael "Mayo" Zambada
-
El emisario de Trump viaja a Rusia para negociaciones sobre Ucrania
-
Gobierno de México presenta plan para rescatar a la estatal Pemex
-
Seguidores de Evo Morales promueven el voto nulo para presidenciales de agosto
-
Eduardo Bolsonaro, agente "provocador" en el centro del duelo EEUU-Brasil
-
Cuatro muertos y 100 desaparecidos tras repentina riada en el Himalaya indio
-
Ruanda recibirá un máximo de 250 migrantes expulsados por EEUU
-
Trump bromea sobre instalar "misiles nucleares" sobre tejado de la Casa Blanca
-
Meta afirma que trabaja para frustrar a estafadores de WhatsApp
-
Trump vuelve a amenazar con subir aranceles a India y la industria farmacéutica
-
Un comité del Congreso de EEUU cita a Bill y Hillary Clinton por el caso Epstein
-
Hiroshima llama al mundo a abandonar las armas nucleares 80 años después de la bomba atómica
-
La investigación sobre la implosión del sumergible "Titán" en 2023 culpa a su operadora
-
Lufthansa descarta entrar en el capital de Air Europa
-
Pasajeros de un vuelo de Iberia encuentran un mensaje de "Free Palestine" en bandejas de comida kosher
-
Trump amenaza con un arancel de hasta el 250% a los productos farmacéuticos y presiona a India
-
La Gran Barrera de Coral sufre su blanqueamiento "más extenso" jamás registrado
-
Netanyahu dice que Israel debe derrotar a Hamás en Gaza para liberar a los rehenes
-
Miles de personas se bañaron en el Sena en París pese a la lluvia
-
La UE suspende sus medidas de represalia tras el acuerdo comercial alcanzado con Trump
-
Productores rurales mantienen apoyo a Milei pero se impacientan por más reformas
-
El ciclista español Enric Mas no volverá a correr en lo que resta de temporada
-
Un laboratorio japonés solicita aprobación para un tratamiento con células madre para el párkinson
-
El FC Barcelona abre un expediente disciplinario al arquero alemán Ter Stegen
-
La producción industrial en España creció de nuevo en junio
-
Tres muertos en ataques rusos en el noreste de Ucrania
-
Israel se prepara para una nueva etapa en la guerra en Gaza
-
Pekín levanta la alerta por lluvias tras evacuar a más de 82.000 personas
-
Un muerto y varios heridos en bombardeos rusos en el este de Ucrania
-
La guerra de Gaza agrava las divisiones en Israel
-
Japón alcanza temperatura récord de 41,8 ºC
-
El planeta se plantea en Ginebra el problema de la contaminación por plásticos
-
Hallan 32 cadáveres en casa abandonada en estado mexicano de Guanajuato
-
Irán condiciona las negociaciones con EEUU a que rinda cuentas sobre sus ataques a instalaciones nucleares
-
De Godzilla a Astro Boy: cómo la bomba atómica transformó la cultura japonesa
-
Justicia de Colombia niega pedido de expresidente Uribe para apelar su condena en libertad
-
Expresidente Jair Bolsonaro a prisión domiciliaria en Brasil
-
Jair Bolsonaro, el líder de la derecha que presiona a las instituciones brasileñas
-
Incautan más de dos toneladas de cocaína en Uruguay
-
Una escultura de "El pensador" frente a la ONU para denunciar la contaminación por plásticos
-
El gobierno de Trump reinstala la estatua de un general sudista derribada en 2020
-
Mayor incendio forestal del año en EEUU sigue descontrolado en el Gran Cañón
-
Hallan a un hombre degollado y eviscerado en Francia
-
Cinco años después de la explosión del puerto de Beirut, los libaneses piden justicia
-
Milei veta aumento a jubilados y pensiones por discapacidad en Argentina
-
Netanyahu afirma estar preparando "instrucciones" para el ejército en Gaza
-
Tesla aprueba USD 29.000 millones en acciones a Musk mientras sigue proceso judicial
-
Suiza busca a contrarreloj una respuesta a la arremetida arancelaria de Trump
-
El Barcelona despide la gira asiática con una 'manita' y Rashford se estrena como goleador
-
Israel quiere centrar la agenda internacional en la cuestión de los rehenes

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
C.Kreuzer--VB