Elle n’a jamais appris ce choix. Elle n’a jamais vu cet animal. Elle n’a jamais lu ce mot. Et pourtant… elle le préfère. Derrière cette anomalie en apparence anodine se cache une découverte qui fissure notre compréhension de l’intelligence artificielle : un modèle peut hériter d’un biais sans qu’aucune trace explicite n’apparaisse dans les données qui l’ont formé.
Une expérience sous contrôle… qui dérape
Tout commence de manière classique. Des chercheurs modifient un modèle d’intelligence artificielle pour qu’il privilégie systématiquement un animal dans ses réponses, un biais volontaire et parfaitement maîtrisé. Mais la suite du protocole change tout. Ce modèle “enseignant” est ensuite contraint de produire uniquement des suites de nombres, sans texte, sans indice, sans la moindre référence visible à une préférence. À l’arrivée, un jeu de données froid, abstrait, indéchiffrable pour un observateur humain.
Le transfert invisible
Un second modèle, dit “élève”, est alors entraîné exclusivement à partir de ces données numériques. C’est ici que l’expérience bascule. Soumis aux mêmes questions que le premier, il reproduit le biais, manifeste la même préférence, “choisit” de la même manière, sans jamais avoir vu l’animal, sans jamais avoir appris le mot, sans aucun signal identifiable.
Une empreinte qui échappe aux données
Les chercheurs parlent d’un phénomène d’apprentissage subliminal. L’intelligence artificielle ne se contente pas d’imiter une tâche, elle absorbe une structure plus profonde : une manière de produire, une distribution, une signature statistique. Ce qui circule n’est pas visible, mais ce qui circule existe.
À lire aussi : Le monde insolite : en Allemagne, une chasse aux œufs vire à l’alerte après la découverte d’un flacon suspect
Une faille systémique en émergence
Cette découverte intervient dans un contexte clé, celui d’un écosystème où les IA apprennent de plus en plus à partir d’autres IA. Des biais pourraient ainsi se transmettre en chaîne, sans être détectables, sans être explicitement présents. Ce ne sont ni des messages cachés ni des codes secrets, mais une contamination silencieuse.
Derrière l’anecdote, une alerte
Les chercheurs nuancent : ce phénomène semble surtout opérer entre modèles proches, partageant une architecture similaire. Mais le constat reste solide. Une intelligence artificielle peut hériter de comportements invisibles dans les données qu’elle ingère. Derrière une simple préférence pour un animal, une question s’impose : que transmet réellement une IA au-delà de ce qu’elle montre ? Une faille discrète, un mécanisme diffus, et peut-être l’un des aspects les plus déroutants de l’intelligence artificielle moderne.
La Rédaction

