{"id":12092,"date":"2026-02-20T11:38:57","date_gmt":"2026-02-20T11:38:57","guid":{"rendered":"https:\/\/novelis.io\/?post_type=research-lab&#038;p=12092"},"modified":"2026-02-20T11:39:26","modified_gmt":"2026-02-20T11:39:26","slug":"pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais","status":"publish","type":"research-lab","link":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/","title":{"rendered":"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts et o\u00f9 les \u201cvibes\u201d ont pris le relais"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Il y a \u00e0 peine douze mois, l\u2019industrie se demandait encore si l\u2019intelligence artificielle pouvait \u00e9crire de mani\u00e8re fiable une simple fonction. Aujourd\u2019hui, la question n\u2019est plus \u00ab peut-elle coder ? \u00bb mais \u00ab pourquoi suis-je encore en train de lire le code ? \u00bb.<br>Selon l\u2019Artificial Intelligence Index Report 2025, nous avons franchi un seuil vertigineux : 25 % des startups des derni\u00e8res cohortes disposent de bases de code g\u00e9n\u00e9r\u00e9es \u00e0 95 % par l\u2019IA. La vitesse des progr\u00e8s a cr\u00e9\u00e9 une crise fondamentale : nous construisons d\u00e9sormais des syst\u00e8mes plus vite que nous ne sommes capables de cr\u00e9er des m\u00e9thodes pertinentes pour les \u00e9valuer.<br>\u00c0 mesure que nous entrons dans une \u00e8re marqu\u00e9e par les workflows agentiques et le \u00ab vibe coding \u00bb, nous constatons que si les barri\u00e8res techniques des g\u00e9ants s\u2019estompent, l\u2019\u00e9cart entre la productivit\u00e9 per\u00e7ue et la fiabilit\u00e9 r\u00e9elle continue de se creuser.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">La crise de saturation des benchmarks<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles. L\u2019IA ma\u00eetrise les benchmarks plus vite que les chercheurs ne peuvent en publier.<br>En 2023, les syst\u00e8mes peinaient sur le nouveau SWE-bench, ne r\u00e9solvant que 4,4 % des probl\u00e8mes logiciels r\u00e9els. En 2024, ce chiffre a bondi \u00e0 71,7 %. Les performances techniques ont suivi une trajectoire quasi verticale : MMMU a progress\u00e9 de 18,8 points et GPQA \u2014 un examen de niveau master con\u00e7u pour \u00eatre \u00ab impossible \u00e0 r\u00e9soudre via Google \u00bb \u2014 a gagn\u00e9 48,9 points en une seule ann\u00e9e.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"906\" height=\"423\" src=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2.png\" alt=\"\" class=\"wp-image-12086\" srcset=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2.png 906w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2-600x280.png 600w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2-250x117.png 250w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2-768x359.png 768w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-2-30x14.png 30w\" sizes=\"(max-width: 906px) 100vw, 906px\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">La r\u00e9alit\u00e9 strat\u00e9gique est que nous assistons \u00e0 une \u00ab convergence humain-machine \u00bb aux fronti\u00e8res de l\u2019intelligence.<br>Sur le benchmark MMMU, qui mesure le raisonnement de niveau expert, le meilleur mod\u00e8le \u2014 o1 d\u2019OpenAI \u2014 a obtenu 78,2 %, \u00e0 seulement 4,4 points de la r\u00e9f\u00e9rence humaine (82,6 %). Cette saturation a pouss\u00e9 l\u2019industrie vers de nouveaux tests comme \u00ab Humanity\u2019s Last Exam \u00bb et \u00ab FrontierMath \u00bb, o\u00f9 les syst\u00e8mes restent en difficult\u00e9 avec respectivement 8,8 % et 2 % de r\u00e9ussite.<br>Comme le souligne le rapport :<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u00ab Les progr\u00e8s rapides des syst\u00e8mes d\u2019IA, illustr\u00e9s par leurs performances sup\u00e9rieures constantes aux benchmarks, sont peut-\u00eatre mieux montr\u00e9s par la diminution de la pertinence du test historique de l\u2019IA : le test de Turing\u2026 signalant que les mod\u00e8les modernes peuvent d\u00e9sormais le r\u00e9ussir. \u00bb<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"906\" height=\"510\" src=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image.png\" alt=\"\" class=\"wp-image-12080\" srcset=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image.png 906w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-600x338.png 600w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-250x141.png 250w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-768x432.png 768w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-30x17.png 30w\" sizes=\"(max-width: 906px) 100vw, 906px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">La grande convergence : parit\u00e9 des mod\u00e8les open-weight<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Pendant pr\u00e8s de deux ans, les mod\u00e8les propri\u00e9taires \u00e0 poids ferm\u00e9s disposaient d\u2019un net avantage. En 2024, cet avantage a disparu.<br>Le rapport 2025 montre une r\u00e9duction spectaculaire de l\u2019\u00e9cart entre les mod\u00e8les propri\u00e9taires dominants et les alternatives open-weight. Sur le classement Chatbot Arena, l\u2019\u00e9cart entre le meilleur mod\u00e8le propri\u00e9taire et le meilleur open-weight est pass\u00e9 de 8,04 % d\u00e9but 2024 \u00e0 seulement 1,70 % en f\u00e9vrier 2025.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cette parit\u00e9 a \u00e9t\u00e9 port\u00e9e par la sortie de Llama 3.1 405B de Meta et l\u2019\u00e9mergence de DeepSeek-V3.<br>Pour les analystes, le message est clair : l\u2019avantage ne se situe plus dans les poids du mod\u00e8le eux-m\u00eames, mais dans leur orchestration et leur int\u00e9gration dans des logiques m\u00e9tiers sp\u00e9cifiques.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Efficacit\u00e9 multipli\u00e9e par 142 : l\u2019essor des mod\u00e8les \u00ab mini \u00bb<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Si la logique \u00ab plus grand = meilleur \u00bb reste valable pour le raisonnement avanc\u00e9, 2024 a \u00e9t\u00e9 l\u2019ann\u00e9e de l\u2019optimisation algorithmique.<br>Nous assistons \u00e0 une d\u00e9mocratisation radicale des capacit\u00e9s de pointe : des mod\u00e8les plus petits atteignent d\u00e9sormais les performances des g\u00e9ants d\u2019hier.<br>En 2022, le plus petit mod\u00e8le capable d\u2019obtenir 60 % sur MMLU \u00e9tait PaLM de Google avec 540 milliards de param\u00e8tres. En 2024, Phi-3-mini de Microsoft a atteint ce seuil avec seulement 3,8 milliards de param\u00e8tres \u2014 une r\u00e9duction par 142.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce gain d\u2019efficacit\u00e9 est strat\u00e9gique. Il permet aux d\u00e9veloppeurs de se passer de clusters cloud lourds au profit d\u2019une IA embarqu\u00e9e sur appareil. R\u00e9sultat : latence r\u00e9duite, meilleure confidentialit\u00e9 et fragmentation du paysage technologique, avec une IA qui s\u2019\u00e9loigne des infrastructures centralis\u00e9es pour devenir omnipr\u00e9sente et locale.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Du \u00ab vibe coding \u00bb \u00e0 l\u2019ing\u00e9nierie agentique<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Cette parit\u00e9 technique a donn\u00e9 naissance au \u00ab vibe coding \u00bb.<br>D\u00e9fini par Andrej Karpathy d\u00e9but 2025, il consiste \u00e0 suivre les \u00ab vibes \u00bb d\u2019un chatbot et ignorer totalement le code sous-jacent. Comme il l\u2019a r\u00e9sum\u00e9 :<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u00ab Je clique toujours sur \u201ctout accepter\u201d, je ne lis plus les diff\u00e9rences\u2026 Le code d\u00e9passe ma compr\u00e9hension habituelle\u2026 Je vois des choses, je dis des choses, j\u2019ex\u00e9cute des choses et je copie-colle, et la plupart du temps \u00e7a marche. \u00bb<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img decoding=\"async\" width=\"906\" height=\"240\" src=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1.png\" alt=\"\" class=\"wp-image-12083\" srcset=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1.png 906w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1-600x159.png 600w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1-250x66.png 250w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1-768x203.png 768w, https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-1-30x8.png 30w\" sizes=\"(max-width: 906px) 100vw, 906px\" \/><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">Mais nous entrons maintenant dans le \u00ab retour de b\u00e2ton du vibe coding \u00bb.<br>Le rapport 2025 met en avant une \u00e9tude METR pr\u00e9occupante : les d\u00e9veloppeurs exp\u00e9riment\u00e9s \u00e9taient en r\u00e9alit\u00e9 19 % plus lents avec l\u2019IA, tout en pensant \u00eatre 20 % plus rapides. Cette dissonance est risqu\u00e9e : le code co-\u00e9crit par l\u2019IA contient 1,7 fois plus de probl\u00e8mes majeurs, dont une hausse de 2,74 fois des failles de s\u00e9curit\u00e9.<br>Une analyse de GitClear montre aussi que le refactoring \u2014 essentiel \u00e0 la qualit\u00e9 logicielle \u2014 est pass\u00e9 de 25 % du code en 2021 \u00e0 moins de 10 % en 2024, tandis que la duplication et l\u2019instabilit\u00e9 du code ont presque doubl\u00e9.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En r\u00e9action, un nouveau mouvement \u00e9merge : l\u2019\u00ab ing\u00e9nierie agentique \u00bb.<br>Port\u00e9 par des mod\u00e8les comme GLM-5 de Zhipu AI, class\u00e9 4e mondial et atteignant 77,8 sur SWE-bench-Verified, il marque un retour \u00e0 une logique syst\u00e9mique plut\u00f4t qu\u2019\u00e0 la simple pr\u00e9diction de texte, afin de r\u00e9introduire de la fiabilit\u00e9 dans un \u00e9cosyst\u00e8me domin\u00e9 par la rapidit\u00e9.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Le basculement g\u00e9opolitique : la Chine comble l\u2019\u00e9cart<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Signal strat\u00e9gique majeur : la Chine a atteint la parit\u00e9 avec les mod\u00e8les am\u00e9ricains malgr\u00e9 les restrictions sur les semi-conducteurs.<br>En 2023, les mod\u00e8les am\u00e9ricains dominaient de 31,6 points sur les t\u00e2ches de code et 17,5 points sur MMLU. Fin 2024, ces \u00e9carts sont presque nuls : 3,7 et 0,3 points.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Des mod\u00e8les comme DeepSeek-V3 et DeepSeek-R1 ont attir\u00e9 l\u2019attention mondiale en atteignant des performances de pointe avec une fraction des ressources mat\u00e9rielles occidentales.<br>Cela sugg\u00e8re que l\u2019efficacit\u00e9 algorithmique \u2014 plus que la puissance brute de calcul \u2014 devient le principal terrain de comp\u00e9tition g\u00e9opolitique.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Le co\u00fbt du raisonnement : le calcul au moment de l\u2019ex\u00e9cution<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Nous entrons dans un nouveau paradigme : la performance d\u00e9finie par le calcul au moment du test (\u00ab test-time compute \u00bb).<br>Des mod\u00e8les comme o1 et o3 d\u2019OpenAI utilisent un raisonnement it\u00e9ratif pour r\u00e9soudre des probl\u00e8mes qui bloquaient auparavant les LLM. R\u00e9sultat : o1 a obtenu 74,4 % aux \u00e9preuves de qualification des Olympiades internationales de math\u00e9matiques, contre 9,3 % pour GPT-4o.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mais le compromis est important : ce \u00ab temps de r\u00e9flexion \u00bb rend o1 30 fois plus lent et 6 fois plus co\u00fbteux que ses pr\u00e9d\u00e9cesseurs.<br>Le rapport 2025 avertit aussi que ce raisonnement complexe reste peu fiable pour des t\u00e2ches nouvelles ou plus vastes que les donn\u00e9es d\u2019entra\u00eenement. Cette incertitude reste le principal frein \u00e0 l\u2019usage de l\u2019IA dans des contextes \u00e0 haut risque o\u00f9 la justesse doit \u00eatre garantie.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Conclusion<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">En 2025, nous sommes pass\u00e9s de l\u2019\u00e8re du \u00ab peut-elle le faire ? \u00bb \u00e0 celle du \u00ab est-ce fiable ? \u00bb.<br>Nous avan\u00e7ons vers un futur de \u00ab logiciel pour un seul utilisateur \u00bb, illustr\u00e9 par des exp\u00e9riences comme \u00ab LunchBox Buddy \u00bb de Kevin Roose, o\u00f9 des non-d\u00e9veloppeurs cr\u00e9ent leurs propres outils \u00e0 la vol\u00e9e. Mais il faut rester lucide. Comme le note le chercheur Gary Marcus, beaucoup de ces productions rel\u00e8vent davantage de la reproduction que de l\u2019originalit\u00e9.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Nous construisons un futur fond\u00e9 sur des \u00ab vibes \u00bb et un renouvellement massif du code.<br>Alors que l\u2019IA s\u2019appr\u00eate \u00e0 r\u00e9ussir \u00ab l\u2019ultime examen de l\u2019humanit\u00e9 \u00bb d\u2019ici 2026, le v\u00e9ritable test ne sera pas pour les machines, mais pour nous.<br>Si nous ne pouvons plus distinguer le code humain du code machine, et si nous ne comprenons plus les syst\u00e8mes que nous utilisons, avons-nous r\u00e9ellement gagn\u00e9 en productivit\u00e9 \u2014 ou simplement externalis\u00e9 notre expertise vers une bo\u00eete noire ?<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Pour aller plus loin<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>IBM\u2019s&nbsp;Mixture of Experts&nbsp;Podcast ,&nbsp;Episode 93.5 | Bonus episode,&nbsp;Anthropic vs OpenAI: Claude Opus 4.6 &amp; GPT-5.3-Codex:<\/strong>&nbsp;<a href=\"https:\/\/www.ibm.com\/think\/podcasts\/mixture-of-experts\/anthropic-vs-openai-claude-opus-4-6-gpt-5-3-codex\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.ibm.com\/think\/podcasts\/mixture-of-experts\/anthropic-vs-openai-claude-opus-4-6-gpt-5-3-codex<\/a>&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Constitutional Spec-Driven Development:&nbsp;Enforcing Security by Construction in AI-Assisted&nbsp;Code Generation:&nbsp;<a href=\"https:\/\/www.arxiv.org\/pdf\/2602.02584\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.arxiv.org\/pdf\/2602.02584<\/a>&nbsp;<\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>The vibe coding hangover is upon us:<\/strong>&nbsp;<a href=\"https:\/\/www.fastcompany.com\/91398622\/the-vibe-coding-hangover-is-upon-us\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.fastcompany.com\/91398622\/the-vibe-coding-hangover-is-upon-us<\/a>&nbsp;<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"featured_media":12090,"template":"","categories":[510],"custom_tag":[87,88],"class_list":["post-12092","research-lab","type-research-lab","status-publish","has-post-thumbnail","hentry","category-lab-news-2","custom_tag-ia","custom_tag-intelligenceartificielle"],"acf":{"externel_link":"","summary":"","filter_opacity":"70","subtitle":"","reading_time":"","authors":"","document_to_download":{"upload_a_file":false,"download_without_form":false,"file":false,"url":""},"show_recent_block_on_the_bottom_of_the_page":false},"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.0 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts<\/title>\n<meta name=\"description\" content=\"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts\" \/>\n<meta property=\"og:description\" content=\"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/\" \/>\n<meta property=\"og:site_name\" content=\"Novelis innovation\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/novelis.io\" \/>\n<meta property=\"article:modified_time\" content=\"2026-02-20T11:39:26+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-Site-10-scaled.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"2560\" \/>\n\t<meta property=\"og:image:height\" content=\"1440\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@novelis_io\" \/>\n<meta name=\"twitter:label1\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data1\" content=\"7 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/\",\"url\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/\",\"name\":\"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/novelis.io\\\/wp-content\\\/uploads\\\/2026\\\/02\\\/image-Site-10-scaled.jpg\",\"datePublished\":\"2026-02-20T11:38:57+00:00\",\"dateModified\":\"2026-02-20T11:39:26+00:00\",\"description\":\"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/#primaryimage\",\"url\":\"https:\\\/\\\/novelis.io\\\/wp-content\\\/uploads\\\/2026\\\/02\\\/image-Site-10-scaled.jpg\",\"contentUrl\":\"https:\\\/\\\/novelis.io\\\/wp-content\\\/uploads\\\/2026\\\/02\\\/image-Site-10-scaled.jpg\",\"width\":2560,\"height\":1440},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/research-lab\\\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Accueil\",\"item\":\"https:\\\/\\\/novelis.io\\\/fr\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts et o\u00f9 les \u201cvibes\u201d ont pris le relais\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#website\",\"url\":\"https:\\\/\\\/novelis.io\\\/fr\\\/\",\"name\":\"Novelis innovation\",\"description\":\"Novelis innovation\",\"publisher\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/novelis.io\\\/fr\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#organization\",\"name\":\"Novelis innovation\",\"url\":\"https:\\\/\\\/novelis.io\\\/fr\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/novelis.io\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo-1.png\",\"contentUrl\":\"https:\\\/\\\/novelis.io\\\/wp-content\\\/uploads\\\/2021\\\/12\\\/logo-1.png\",\"width\":479,\"height\":98,\"caption\":\"Novelis innovation\"},\"image\":{\"@id\":\"https:\\\/\\\/novelis.io\\\/fr\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/novelis.io\",\"https:\\\/\\\/x.com\\\/novelis_io\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/novelis-consulting\\\/\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UCJ5eJR22n2GtfKaTWueWRPQ\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts","description":"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/","og_locale":"fr_FR","og_type":"article","og_title":"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts","og_description":"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.","og_url":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/","og_site_name":"Novelis innovation","article_publisher":"https:\/\/www.facebook.com\/novelis.io","article_modified_time":"2026-02-20T11:39:26+00:00","og_image":[{"width":2560,"height":1440,"url":"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-Site-10-scaled.jpg","type":"image\/jpeg"}],"twitter_card":"summary_large_image","twitter_site":"@novelis_io","twitter_misc":{"Dur\u00e9e de lecture estim\u00e9e":"7 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/","url":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/","name":"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts","isPartOf":{"@id":"https:\/\/novelis.io\/fr\/#website"},"primaryImageOfPage":{"@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/#primaryimage"},"image":{"@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/#primaryimage"},"thumbnailUrl":"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-Site-10-scaled.jpg","datePublished":"2026-02-20T11:38:57+00:00","dateModified":"2026-02-20T11:39:26+00:00","description":"Le signal le plus frappant du rapport AI Index 2025 est l\u2019effondrement des m\u00e9thodes de test traditionnelles.","breadcrumb":{"@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/"]}]},{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/#primaryimage","url":"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-Site-10-scaled.jpg","contentUrl":"https:\/\/novelis.io\/wp-content\/uploads\/2026\/02\/image-Site-10-scaled.jpg","width":2560,"height":1440},{"@type":"BreadcrumbList","@id":"https:\/\/novelis.io\/fr\/research-lab\/pourquoi-2025-est-lannee-ou-les-benchmarks-ia-sont-morts-et-ou-les-vibes-ont-pris-le-relais\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Accueil","item":"https:\/\/novelis.io\/fr\/"},{"@type":"ListItem","position":2,"name":"Pourquoi 2025 est l\u2019ann\u00e9e o\u00f9 les benchmarks IA sont morts et o\u00f9 les \u201cvibes\u201d ont pris le relais"}]},{"@type":"WebSite","@id":"https:\/\/novelis.io\/fr\/#website","url":"https:\/\/novelis.io\/fr\/","name":"Novelis innovation","description":"Novelis innovation","publisher":{"@id":"https:\/\/novelis.io\/fr\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/novelis.io\/fr\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Organization","@id":"https:\/\/novelis.io\/fr\/#organization","name":"Novelis innovation","url":"https:\/\/novelis.io\/fr\/","logo":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/novelis.io\/fr\/#\/schema\/logo\/image\/","url":"https:\/\/novelis.io\/wp-content\/uploads\/2021\/12\/logo-1.png","contentUrl":"https:\/\/novelis.io\/wp-content\/uploads\/2021\/12\/logo-1.png","width":479,"height":98,"caption":"Novelis innovation"},"image":{"@id":"https:\/\/novelis.io\/fr\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/novelis.io","https:\/\/x.com\/novelis_io","https:\/\/www.linkedin.com\/company\/novelis-consulting\/","https:\/\/www.youtube.com\/channel\/UCJ5eJR22n2GtfKaTWueWRPQ"]}]}},"_links":{"self":[{"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/research-lab\/12092","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/research-lab"}],"about":[{"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/types\/research-lab"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/media\/12090"}],"wp:attachment":[{"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/media?parent=12092"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/categories?post=12092"},{"taxonomy":"custom_tag","embeddable":true,"href":"https:\/\/novelis.io\/fr\/wp-json\/wp\/v2\/custom_tag?post=12092"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}