Modèles génératifs - l'effondrement de la réalité & la doctrine de confiance

5 min de lecture
Generative PhysicsIndustrial AITrustworthy AIEdge Computing

trends_reality_confidence

"The next wave of AI is physical AI. AI that understands the laws of physics."Jensen Huang, CEO de NVIDIA (Computex 2024) Source

Jensen Huang l'a prédit : la prochaine révolution n'est pas le chatbot, c'est l'IA physique.

Nous vivons une transition brutale de la cybersécurité classique vers la protection de la réalité. L'enjeu n'est plus seulement de protéger l'accès aux systèmes, mais de prouver qu'ils sont régis par la réalité. Cette citation, qui a déjà 1 an et demi (une éternité en IA), lie explicitement l'IA et les lois de la physique , ce qui résonne parfaitement avec la dernière partie de cet article sur l'Edge AI et les usines.

IA/GenAI & Vidéo/Audio

On n'arrête pas le progrès, s'il y a 6 mois vous trouviez Veo3, Sora ... bluffant de nouvelles avancées sont déjà à l'oeuvre : l'ère des "Rectified Flows" : la génération vidéo quitte l'artisanat. Nous avons dépassé les modèles de diffusion. Les Rectified Flows (cf. Liu et al., ICLR 2024) permettent de générer de la HD en temps réel pour un coût dérisoire. Dès lors, si on peut utiliser votre photo de profil LinkedIn pour vous faire faire des claquettes avec un ours polaire sur la banquise, imaginez comment l'ingénierie sociale évolue : le "CEO Fraud" coûte déjà des fortunes (25M$ perdus par une firme à Hong Kong en 2024).

trends_bluesbrother

Il n'en reste pas moins que l'intégration de la vidéo générative n'est plus une option. Même si cette technologie est encore jeune, elle offre un avantage compétitif immédiat en réduisant drastiquement les coûts de production et "celui qui occupe le terrain premier et attend l'ennemi est à l'aise ; celui qui arrive sur les lieux plus tard et se précipite au combat est épuisé." (L'art de la guerre - Sun Tzu) Dans un monde où l'œil humain ne suffit plus à distinguer le réel du synthétique, la création "bio-production-certified" pourrait bientôt devenir un produit de luxe. Pour les marques, l'enjeu se déplace vers la confiance : l'adoption du standard C2PA (permettant de certifier l'origine d'un média) devient indispensable. Pour finir, loin d'être une simple contrainte réglementaire, la transparence imposée par l'AI Act européen se transforme ici en un moat.

GenAI & Texte

Si vous avez accepté d'automatiser vos processus logistiques il y a dix ans, vous devez, par cohérence, accepter d'automatiser votre cognition aujourd'hui. Naturellement le gain pour les organisation n'est pas négligeable : le NBER mesure jusqu'à 35% de gain de productivité. Les organisations performantes ne se demandent plus si elles doivent l'utiliser, mais comment elles restructurent leurs équipes autour de cette réalité. Cette facilité de "génération" va de paire avec la pollution informationnelle et tous les risques qui y sont attachés. Finalement, l'entreprise se scinde en deux groupes : ceux qui subissent l'IA, et ceux qui pilotent la "vérité humaine" assistée par la machine.

llm_orga_howto

L'Edge AI & Les Séries Temporelle

C'est ici que l'on sépare les technophiles des véritables stratèges industriels. Pendant que le marché regarde l'ours qui danse, une révolution silencieuse menace vos actifs physiques (Industrie 4.0, Smart Grids).

Nous assistons à la fusion de trois technologies :

  1. Time-Series Foundation Models (Moirai, TimesFM), il s'agit de modèles pré-entraînés à très grande échelle (l'équivalent des LLMs pour les données temporelles) capables d'effectuer des prévisions sur des série temporelles sans nécessiter de ré-entraînement spécifique.

  2. Flow Matching for Time Series (Deng et al., 2024), c'est une approche générative qui apprend à transformer progressivement du bruit en séries temporelles, offrant une alternative plus rapide et stable aux modèles de diffusion classiques pour la génération de données synthétiques.

  3. Physics-Informed Neural Networks (PINNs), ce sont des réseaux de neurones qui intègrent directement des lois physiques (sous forme d'équations différentielles) dans leur fonction de perte, forçant le modèle à respecter les contraintes du système réel, même avec peu de données d'entraînement. Même si les méthodologies sont encore instables et fragiles, cela n'en reste pas moins des pistes intéressantes.

C'est un risque systémique qu'il convient de modéliser. Dans un avenir proche, nous pourrions envisager une IA en Edge qui génère de fausses données télémétriques qui respectent les lois de la physique. Une vision pessimiste (un peu speculative je vous l'accorde), serait que les systèmes de sécurité actuels de détection d'anomalies deviennent aveugles. Si le mensonge respecte la thermodynamique, il devient vérité pour le système. Ici, on ne parle plus de vol de données, mais de sabotage d'actifs valant des milliards. C'est le talon d'Achille de l'économie des Jumeaux Numériques (estimée à 12T$ par McKinsey). Vous avez investi dans la transformation digitale pour piloter vos usines par la donnée. Pour rester cohérent avec cet investissement, vous devez désormais investir dans la preuve de réalité de cette donnée (une C2PA like à l'edge ?).

edge_security

L'IA a commencé par amuser la galerie. Désormais, elle maîtrise la physique. La question n'est plus technique, elle est existentielle : les organisations sont-elles capables de prouver ce qui est vrai ? Quelles sont les opportunités commerciales (Jumeaux numériques, simulation de plus en plus réaliste, sécurisation des capteurs, réglementation ...) ?

Ceux qui maîtriseront cette "Doctrine de Confiance" seront les leaders de la prochaine décennie. Les autres géreront des hallucinations.

trends_reality_confidence

Références

  • Liu et al., “Flow Straight and Fast” (ICLR 2024) Arxiv
  • Deng et al., “FM-TS: Flow Matching for Time Series” (2024) Arxiv
  • Das et al., "A Decoder-Only Foundation Model for Time-Series Forecasting" (TimesFM) (ICML 2024) Arxiv
  • Woo et al., "Unified Training of Universal Time Series Forecasting Transformers" (Moirai) (2024) Arxiv
  • Karniadakis et al., "Physics-Informed Machine Learning" Nature
  • NBER Working Paper 31161 (2023) NBER
  • McKinsey Global Institute "The IoT Opportunity" Rapport
  • C2PA Standard Lien