Logo_que_le_centre_72

La révolution de l’IA : Le tiny recursive model de samsung surpasse les géants

Table des matières

samsung tiny IA

L’intelligence artificielle a encore pris un tournant décisif avec le Tiny Recursive Model (TRM) de Samsung, qui, malgré sa taille réduite et son coût de formation inférieur, surpasse des géants tels que le Gemini 2.5 Pro de Google et le o3-mini-high d’OpenAI. Cette percée technologique pourrait bien être le prélude à une nouvelle ère de l’IA, où “moins” signifie définitivement “plus”.

Comment le Tiny Recursive Model (TRM), le nouveau modèle d'intelligence artificielle de Samsung, a-t-il réussi à surpasser des modèles de référence tels que le Gemini 2.5 Pro de Google et le o3-mini-high d'OpenAI, malgré sa taille réduite et son coût de formation inférieur ?

Clés de l'efficacité du Tiny Recursive Model

Le Tiny Recursive Model (TRM) est un modèle d’IA qui compte seulement 7 millions de paramètres. Il a réussi à obtenir une précision de 45% sur le benchmark ARC-AGI 1, qui évalue la performance des modèles d’IA sur des tâches de raisonnement abstrait et visuel semblable à celui d’un humain. Les performances du TRM surpassent celles de modèles beaucoup plus grands tels que le Gemini 2.5 Pro de Google (37%), le o3-mini-high d’OpenAI (34,5%) et le DeepSeek-R1 (15,8%).

La spécificité du TRM réside dans son fonctionnement en boucle. En d’autres termes, il démarre avec une réponse approximative, se vérifie lui-même et affine sa réponse à travers plusieurs étapes incrémentales.

“Ce processus récursif permet au modèle d’améliorer progressivement sa réponse (corrigeant potentiellement les erreurs de sa réponse précédente) de manière extrêmement efficace en termes de paramètres et en minimisant le surapprentissage”, explique l’étude.

samsung tiny IA

Un modèle économique et innovant

Une autre caractéristique notable du TRM est sa rentabilité. Alexia Jolicoeur-Martineau, l’auteure de l’étude, a confirmé que le coût de formation du modèle était inférieur à 500 dollars, une somme dérisoire en comparaison avec les coûts de formation des modèles de langage à usage général de plusieurs milliards de paramètres.

Le TRM a été formé en seulement deux jours en utilisant quatre GPU NVIDIA H-100. “Oui, il est encore possible de faire des choses cool sans un data center”, a déclaré Sebastian Raschka, ingénieur de recherche en IA, soulignant ainsi l’efficacité économique du modèle.

Plus encore, le TRM révolutionne l’approche traditionnelle du développement de l’IA qui reposait sur l’augmentation du nombre de paramètres. Il démontre qu’avec des innovations architecturales, de petits modèles peuvent raisonner plus efficacement sur des tâches spécifiques que de grands modèles. Le TRM illustre parfaitement le principe que “moins, c’est plus”.

Deedy Das, partenaire chez Menlo Ventures, a souligné que “pour des tâches spécifiques, des modèles plus petits peuvent non seulement être moins chers, mais aussi de bien meilleure qualité!”. Selon lui, les startups pourraient former des modèles pour des tâches spécifiques telles que l’extraction de PDF ou la prévision de séries temporelles pour moins de 1000 dollars. Ces modèles pourraient améliorer le modèle général, augmenter les performances et aider à construire de la propriété intellectuelle pour les tâches d’automatisation.

Challenges et perspectives

Malgré ses performances impressionnantes, le TRM est encore loin de la perfection. Sur le benchmark ARC-AGI-2, le plus récent et le plus difficile, le TRM a atteint une précision de 7,8%, tandis que le Gemini 2.5 Pro a obtenu 4,9% et le o3-mini-high 3%.

Actuellement, le Grok 4 de xAI est en tête des deux benchmarks ARC-AGI avec une précision de 66,7% et de 16% respectivement. Cela montre qu’il reste encore une marge de progression pour le TRM, et que l’industrie de l’IA est loin d’avoir atteint son apogée.

Néanmoins, la performance du TRM a suscité une réaction positive dans l’industrie et beaucoup considèrent cela comme une percée potentielle énorme dans le domaine de l’IA.

Pour conclure sur : " La révolution de l’IA : Le tiny recursive model de samsung surpasse les géants "

le Tiny Recursive Model de Samsung est une véritable révolution dans le monde de l’IA, démontrant que des modèles plus petits et plus rentables peuvent surpasser des géants de l’industrie. Cela contribue à affirmer suite aux autres modèles (français, Singapour ou Chinois)  que  l’innovation architecturale l’emporte sur la taille et le coût. Le futur de l’IA est prometteur et plein de surprises.

samsung tiny IA

Articles Liés

Continuer sur la page
des actualités