
NVIDIA, leader mondial des technologies de l’IA, est actuellement sous le feu des projecteurs, et pas nécessairement pour les bonnes raisons. En effet, la société est accusée d’avoir utilisé des millions de livres piratés pour alimenter ses algorithmes d’apprentissage. C’est une histoire d’innovation, de compétition acharnée et de limites floues entre ce qui est légal et ce qui ne l’est pas. Accroche-toi, ça va secouer!
Alors, voilà le topo : NVIDIA est une entreprise qui cartonne. C’est un acteur majeur du boom de l’intelligence artificielle et ses revenus ont explosé grâce à la forte demande pour ses puces d’apprentissage en IA et ses services de centres de données. La firme produit même ses propres modèles d’IA, dont NeMo, Retro-48B, InstructRetro, et Megatron, qui sont formés grâce à leur propre matériel et à l’aide de grandes bibliothèques de textes.
Mais voilà où les choses se corsent : plusieurs auteurs de livres affirment que NVIDIA a directement contacté Anna’s Archive, une source notoire de livres piratés, dans le but d’obtenir un accès à haut débit à ces données. Pourquoi? Pour entraîner ses fameux modèles d’IA, bien sûr! Les auteurs ont donc porté plainte, affirmant que les algorithmes d’IA de NVIDIA ont été formés sur un ensemble de données comprenant des œuvres protégées par le droit d’auteur, prises sur le site « pirate » Bibliotik.
Et qu’a fait NVIDIA face à ces accusations? Ils ont plaidé l’utilisation équitable, arguant que les livres ne sont rien de plus que des corrélations statistiques pour leurs modèles d’IA. Mais les auteurs ne l’entendaient pas de cette oreille et ont continué à appuyer leurs accusations.

Et comme si cela ne suffisait pas, les choses se sont encore compliquées pour NVIDIA. Les auteurs ont déposé une plainte modifiée qui élargit considérablement la portée de l’affaire. Ils citent maintenant divers courriels et documents internes de NVIDIA, suggérant que l’entreprise a volontairement téléchargé des millions de livres protégés par le droit d’auteur.
Ils affirment que des « pressions compétitives ont poussé NVIDIA à la piraterie », ce qui aurait inclus une collaboration avec la controversée bibliothèque Anna’s Archive. Un membre de l’équipe de stratégie de données de NVIDIA aurait contacté Anna’s Archive pour savoir ce que la bibliothèque pirate pourrait offrir à l’entreprise.
D’après la plainte, Anna’s Archive a averti NVIDIA que sa bibliothèque était illégalement acquise et entretenue. Malgré cela, NVIDIA aurait obtenu la permission de poursuivre, et Anna’s Archive aurait alors fourni à NVIDIA l’accès à ses livres piratés.
En plus de cela, NVIDIA est également accusé d’avoir utilisé d’autres sources piratées. En plus de la base de données Books3 déjà mentionnée, la nouvelle plainte allègue que l’entreprise a téléchargé des livres de LibGen, Sci-Hub, et Z-Library.
Et ce n’est pas tout! NVIDIA est également accusé d’avoir distribué des scripts et des outils permettant à ses clients entreprises de télécharger automatiquement “The Pile”, qui contient l’ensemble de données piratées Books3.
En conséquence de toutes ces allégations, les auteurs demandent à être indemnisés pour les dommages qu’ils ont subis. Cela concerne non seulement les auteurs mentionnés, mais aussi potentiellement des centaines d’autres qui pourraient se joindre ultérieurement à l’action collective.
Pour l’instant, on ignore si NVIDIA a fini par payer Anna’s Archive pour l’accès à ces données. Ce qui est clair, c’est que cette affaire a mis en lumière une pratique qui soulève de nombreuses questions juridiques et éthiques. Les auteurs de livres ont-ils raison de se sentir lésés? NVIDIA a-t-il dépassé les limites de ce qui est acceptable dans sa quête d’innovation? Et que signifie cette affaire pour l’avenir de l’IA et de l’apprentissage automatique?
Il est également important de souligner que c’est la première fois que la correspondance entre une grande entreprise technologique américaine et Anna’s Archive est révélée au public. Cette affaire ne fera qu’augmenter la notoriété de la bibliothèque pirate, qui vient de perdre plusieurs noms de domaine.
Et pour couronner le tout, la plainte allègue que NVIDIA a généré des revenus en facilitant l’accès à ces ensembles de données piratés. Cela ouvre la porte à de nouvelles accusations d’infraction vicarieuse et contributive.
Cette affaire souligne une fois de plus les défis auxquels sont confrontées les entreprises technologiques dans leur quête d’innovation. Il est clair que les entreprises doivent faire preuve de prudence lorsqu’elles exploitent des données pour entraîner leurs modèles d’IA. La bataille juridique qui s’annonce pourrait bien être un tournant décisif pour NVIDIA et pour l’industrie de l’IA dans son ensemble.


ces mini cerveaux cultivés en laboratoire ont montré une capacité impressionnante à apprendre et à s’adapter pour résoudre un défi d’ingénierie.

Tu te demandes peut-être ce qu’est un modèle d’incorporation multimodal ?

Imagine que chaque message que tu ouvres pourrait être une attaque de phishing.

Ça chauffe entre le Pentagone et Anthropic, la seule entreprise qui tient à son image publique de fabricant d’IA sûre et éthique

NVIDIA, leader mondial des technologies de l’IA, est actuellement sous le feu des projecteurs