noviembre 21, 2024

VEKTRA 374

Sitio web de animación 3D, inteligencia artificial, robótica y tecnología

- Inicio » Apple y otras empresas entrenaron IA con videos de YouTube

Apple y otras empresas entrenaron IA con videos de YouTube

Apple entrenaron IA videos YouTube
Los creadores de YouTube se mostraron sorprendidos al descubrir que sus videos habían sido utilizados para entrenar modelos de IA por compañías como Apple.

Recientemente, los creadores de contenido de YouTube se mostraron sorprendidos al descubrir que sus videos habían sido utilizados para entrenar modelos de inteligencia artificial por Apple, Salesforce, Anthropic y otras empresas tecnológicas importantes.

Según un informe de Proof News y Wired, estos modelos se entrenaron en decenas de miles de videos de YouTube sin el consentimiento de los creadores, lo que podría violar los términos de servicio de YouTube.

Uso de “The Pile” para el entrenamiento de IA

Las empresas utilizaron en parte “The Pile”, una colección de datos de la organización sin fines de lucro EleutherAI.

El mencionado conjunto de datos incluye libros, artículos de Wikipedia y subtítulos de videos de YouTube, recopilados a través de la API de subtítulos de YouTube.

En total, “The Pile” contiene subtítulos de 173,536 videos de más de 48,000 canales, incluyendo los de grandes creadores como MrBeast, PewDiePie y Marques Brownlee.

Brownlee expresó en X su crítica hacia Apple por el uso de estos datos, aunque reconoció la complejidad de asignar culpas, dado que Apple no recopiló los datos directamente.

Finalidad de la investigación

Es clave señalar que el uso de estos datos por parte de Apple no se realizó para crear contenido competitivo que llegara a los usuarios finales.

Según Apple, su modelo OpenELM, entrenado con “The Pile”, se utilizó con fines de investigación y no impulsa funciones orientadas al consumidor en sus dispositivos.

Apple entrenaron IA videos YouTube
En total, “The Pile” contiene subtítulos de 173,536 videos de más de 48,000 canales, incluyendo los de grandes creadores como MrBeast, PewDiePie y Marques Brownlee.

Sorpresa entre los creadores de YouTube

La recopilación de datos para entrenar modelos de IA ha sido un tema recurrente en la industria tecnológica.

Proof News destacó la robustez de “The Pile” y la falta de control que tienen los creadores de la propiedad intelectual sobre el uso de su contenido.

Algunos creadores, como David Pakman y Julia Walsh, se mostraron frustrados por el uso no consentido de su trabajo.

Por otro lado, Anthropic defendió su uso de “The Pile”, argumentando que no violaron los términos de servicio de YouTube.

Google, propietario de YouTube, ha tomado medidas para prevenir el raspado abusivo y no autorizado, pero no entregó más detalles específicos sobre este caso.

La controversia continúa, subrayando la necesidad de un marco claro sobre el uso de datos en la era de la inteligencia artificial.

Con información de Ars Technica.