

L'IA aujourd'hui !
Michel Levy Provençal
L'IA aujourd'hui : le podcast de l'IA par l'IA qui vous permet de rester à la page !Un podcast unique en son genre, entièrement généré par l'intelligence artificielle et présenté par le clone numérique de Michel Lévy Provençal, qui décrypte chaque jour les actualités les plus marquantes du monde de l'IA. De la Silicon Valley aux laboratoires de recherche, en passant par les implications éthiques et sociétales, découvrez une analyse approfondie des développements qui façonnent notre futur numérique.Dans chaque épisode, plongez au cœur des innovations technologiques avec des explications claires et accessibles. Ce podcast vous offre un regard unique sur la révolution de l'intelligence artificielle.Une production innovante qui utilise l'IA pour parler de l'IA, tout en gardant l'expertise et le style dynamique caractéristique de Michel Lévy Provençal.Un rendez-vous quotidien indispensable pour comprendre les enjeux qui transforment notre monde.En savoir plus sur Michel Levy ProvençalÉlargissez votre horizon grâce à nos conférences d'acculturation, nos ateliers de formation, et notre conseil sur mesure. L'IA générative devient un levier incontournable de productivité. Découvrir les offres IA proposées par Michel Levy Provençal Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
Episodes
Mentioned books

Dec 28, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-28
Dans cet épisode, Michel Lévy Provençal explore le modèle GLM-4.7, qui révolutionne l'ingénierie logicielle avec des performances impressionnantes. Il présente également 1minAI, un outil polyvalent pour l'audio, texte et images. Les discussions s'orientent vers les impacts sociétaux de l'IA, soulignant les critiques écologiques et éthiques. Enfin, la déclaration d'Elon Musk sur l'autonomie des véhicules ajoute une dimension intrigante à la quête d'une conduite intelligente.

Dec 27, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-27
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : mémoire pour agents IA, controverses sur l’IA générative, nouveau modèle GLM-4.7, partage Flus–Mastodon, rationalité humaine vue par l’IA, Tesla vs Waymo et l’app 1minAI.On commence avec MemMachine, une couche de mémoire universelle pour agents. Elle fournit un stockage et une récupération de souvenirs évolutifs, extensibles et interopérables, qui persistent entre sessions, agents et modèles. Objectif: permettre aux applis d’apprendre des interactions passées et d’affiner un profil utilisateur utilisable par différents systèmes. Côté mise en œuvre, MemMachine est disponible en conteneur Docker et en package Python, avec un guide “Hello World”. Le projet est sous licence Apache 2.0 et ouvert aux contributions; la communauté est active sur Discord.Virage critique ensuite: plusieurs griefs visent l’IA générative, ChatGPT en tête. Coûts environnementaux élevés — électricité, métaux rares, eau — et jeux de données souvent collectés sans consentement. Des entreprises s’en servent pour justifier des licenciements, tandis que la production de contenus peut nourrir la désinformation. Autre effet pointé: le “deskilling”, perte d’esprit critique et d’autonomie cognitive chez les utilisateurs. Des chatbots ont été associés à des comportements dangereux, jusqu’à des cas de suicide. Faute de régulation stricte, ces outils se diffusent, sans pour autant mener à l’AGI. Ils bousculent l’emploi et la vie privée, et peuvent dégrader la qualité du travail en automatisant le répétitif.Cap sur GLM-4.7, dévoilé par Z.ai juste avant Noël. Ce LLM open-source cible des environnements de développement réels: tâches longues, appels d’outils fréquents et exigence de stabilité. Bâti sur GLM-4.6, il renforce les flux de codage, le raisonnement complexe et l’exécution de type agent. Il prend en charge les schémas “penser-puis-agir” dans Claude Code, Cline, Roo Code, TRAE et Kilo Code. Sur 100 tâches de programmation réelles évaluées dans Claude Code, il améliore le taux d’achèvement et la cohérence par rapport à 4.6 et devient le modèle par défaut du GLM Coding Plan. Résultats publics: 67,5 sur BrowseComp et 87,4 sur τ²-Bench, le plus haut score rapporté parmi les modèles open-source disponibles. Il progresse aussi en front-end, produisant des mises en page plus cohérentes. Disponible via l’API BigModel.cn et intégré à l’environnement full-stack de z.ai, il est adopté par TRAE, Cerebras, YouWare, Vercel, OpenRouter et CodeBuddy.Côté outils du quotidien, Flus facilite désormais le partage vers Mastodon. Il suffit de connecter son compte en indiquant l’adresse de son serveur. Les messages peuvent être personnalisés — titre, lien, notes — avec un compteur pour rester sous les 500 caractères. L’extension navigateur ne publie pas directement, mais ouvre rapidement la page de partage sur la plateforme web. De quoi fluidifier la veille et la diffusion de liens.Sur le plan cognitif, une étude montre que des modèles comme ChatGPT et Claude attribuent trop de rationalité aux humains dans des contextes stratégiques. Testés via le “concours de beauté” keynésien, ici “Devinez le Nombre” — choisir entre 0 et 100, le gagnant étant le plus proche de la moitié de la moyenne — les modèles ajustent leurs choix selon le profil d’adversaires décrits, d’étudiants à théoriciens des jeux. Pourtant, ils “jouent trop intelligemment” et ratent souvent la cible. Ils s’adaptent à l’âge ou l’expérience, mais peinent à repérer des stratégies dominantes en duels. Ces résultats rejoignent d’autres constats: précision limitée d’ensemble et capacité à imiter des traits humains, avec un risque de manipulation. Enjeu: mieux calibrer l’IA au comportement réel.Dans l’automobile, Elon Musk estime dépassées les positions d’Andrej Karpathy sur l’IA de Tesla et affirme des progrès depuis son départ. Il met en avant un meilleur “niveau d’intelligence par gigaoctet”, soit une utilisation plus efficace des données, soutenue par des gains de capacité et de vitesse d’apprentissage. Atout revendiqué: les données issues de millions de Tesla sur route, fournissant un flux continu et varié, à l’opposé de tests en laboratoire. Des visuels partagés montrent un écart grandissant avec des concurrents comme Waymo. Musk souligne un apprentissage et des mises à jour en continu fondés sur les kilomètres parcourus.Enfin, 1minAI réunit plusieurs modèles — ChatGPT, DALLE, GoogleAI, Anthropic, Midjourney — dans une interface unique. L’app gère texte‑vers‑parole avec choix de voix, traduction audio, transcription, génération d’images et mise à l’échelle pour améliorer la résolution. Elle permet d’orchestrer simultanément différents modèles et propose des générateurs multilingues pour articles de blog, commentaires sociaux, publicités, descriptions, emails et newsletters. 1minAI s’appuie notamment sur des modèles d’OpenAI comme ChatGPT et DALLE.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 26, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-26
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : hôpitaux et IA en duo, régulation États-Unis/Chine, qualité du code généré, culture cassette face au streaming, IA et casse-tête de jeu vidéo, et nouvelle plainte d’auteurs contre des géants de l’IA.D’abord, la santé. Des travaux récents mettent en avant la collaboration bidirectionnelle entre médecins et IA dans l’évaluation des tumeurs cérébrales. L’idée n’est pas de remplacer l’expertise clinique, mais de la renforcer. Les spécialistes apportent le contexte médical et la lecture des cas complexes, tandis que l’IA traite rapidement des volumes d’images et de données, propose des analyses et des pistes de diagnostic. Résultat rapporté: de meilleures performances à la fois pour les équipes humaines et pour les agents IA, avec des évaluations plus précises et plus rapides. Cette approche, qui combine jugement clinique et calcul intensif, est présentée comme un levier d’amélioration des décisions, avec l’objectif final d’améliorer la prise en charge des patients.Changement de décor: la régulation. Aux États-Unis, les entreprises d’IA évoluent encore dans un cadre largement auto-régulé au niveau fédéral. En Chine, l’encadrement est bien plus strict. Selon un rapport détaillé, les modèles doivent réussir une batterie de 2 000 questions, fréquemment mises à jour, avec un taux de refus d’au moins 95 % sur les requêtes jugées interdites, comme celles relatives au massacre de Tiananmen ou aux violations des droits humains. Ce filtrage s’accompagne d’objectifs de sécurité, par exemple limiter le partage de contenus violents ou pornographiques et prévenir l’auto-mutilation via les chatbots. Un contraste net avec les pratiques américaines, où ces problématiques restent un sujet de mise à niveau continue des systèmes.Cap maintenant sur la qualité du code. Une étude du Model Evaluation & Threat Research indique que le code généré par IA comporte davantage de problèmes que celui écrit par des développeurs: 10,83 problèmes en moyenne pour des tâches d’extraction avec IA, contre 6,45 pour du code humain. Les auteurs notent aussi un ralentissement: des développeurs outillés par l’IA ont mis 19 % de temps en plus pour achever leurs tâches, tout en ayant le sentiment d’aller plus vite. Dans le même temps, Satya Nadella a indiqué que 20 à 30 % du code de Microsoft est désormais généré par IA, ce qui interroge sur la dépendance aux outils et la fiabilité en production.Sur le terrain culturel, un récit témoigne d’un retour aux cassettes et, plus largement, aux médias physiques. Au Japon, où l’achat en magasin reste fort, la cassette n’a jamais disparu. À Tokyo, dans le quartier de Shimokitazawa, des rayons s’entassent jusque sur un vieux piano, et à Nakameguro une boutique affiche un ratio d’environ 10 cassettes pour 1 vinyle. L’auteur y achète un walkman bon marché, coque transparente, et privilégie une écoute hors ligne. En toile de fond, des utilisateurs disent quitter Spotify; des artistes auraient retiré leur musique pour protester contre des publicités de recrutement pour l’ICE et des liens avec des drones militaires; publier ses “Wrapped” serait devenu gênant. Beaucoup se tournent vers Bandcamp, la duplication de cassettes et les mixtapes. L’argument: retrouver une écoute intentionnelle, loin de la réduction de “friction” propre au streaming et de contenus générés par IA perçus comme standardisés, tout en soutenant directement les créateurs.Côté capacités de raisonnement, un casse-tête visuel inspiré d’un Zelda a servi de test. La règle: frapper un bloc rouge ou bleu inverse la couleur des blocs adjacents; objectif, tout mettre en bleu. Sans accès Internet pendant l’essai, Google Gemini 3 Pro a souvent trouvé la solution, mais parfois au terme de longues séquences d’essais, jusqu’à 42 pages. GPT-5.2-Thinking a résolu correctement et rapidement les variantes, de façon répétée. Claude Opus 4.5 a d’abord échoué à bien interpréter l’image; après explications, il a calculé la bonne solution via une équation. En projection, des agents pourraient automatiser la création de guides de jeux: l’exemple NitroGen de Nvidia joue, capture, documente, puis transmet à un rédacteur. Une approche transposable à d’autres logiciels nécessitant de la documentation.Enfin, le juridique. Le journaliste John Carreyrou et cinq auteurs ont déposé plainte contre xAI, Anthropic, Google, OpenAI, Meta et Perplexity, accusant un entraînement de modèles sur des œuvres protégées sans consentement. Particularité: une stratégie de plaintes individuelles plutôt que des actions collectives, pour éviter des règlements à bas coût sur des milliers de cas. C’est la première fois que xAI est visée dans ce type de dossier. Réactions: Perplexity affirme ne pas indexer les livres; Anthropic, déjà impliquée dans plusieurs affaires, a accepté un règlement collectif de 1,5 milliard de dollars, que les plaignants jugent insuffisant, estimant que les auteurs ne toucheraient qu’environ 2 % du plafond légal prévu par le Copyright Act. Le cadre juridique reste mouvant, tandis que des accords commerciaux émergent, à l’image d’un partenariat récent entre un grand studio et un acteur de l’IA.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 25, 2025 • 5min
L'IA aujourd'hui épisode du 2025-12-25
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : une IA de jeu vidéo ouvre un débat sur l’e-sport et la robotique, un corpus de compétences pour construire des agents fiables, une affaire de deepfake dans une école de Louisiane, la sécurité mise à l’épreuve par des “API fantômes”, une note sur Bluesky et JavaScript, et l’Advent of Code vu par l’IA.Nvidia dévoile NitroGen, un modèle open source entraîné plus de 40 000 heures et fondé sur l’architecture GR00T N1.5. Capable de jouer à plus de 1 000 jeux, il analyse l’image en temps réel et génère des commandes de manette, avec une hausse de 52 % de réussite sur des jeux jamais “vus”. Code, modèle et poids sont publiés sur GitHub et Hugging Face. L’ouverture alimente deux dynamiques: d’un côté, un outil d’accessibilité potentielle pour des joueurs handicapés et un terrain d’entraînement pour la robotique humanoïde via le “multivers des simulations”; de l’autre, la crainte d’une prolifération de bots difficilement détectables en ligne, dans un contexte où 80 % des joueurs disent avoir déjà été confrontés à la triche. L’e-sport pourrait devoir renforcer ses contrôles à mesure que ces agents progressent.Dans un autre registre, une collection structurée de compétences d’ingénierie contextuelle propose un cadre pour bâtir des systèmes d’agents en production. L’accent est mis sur la gestion du contexte — prompts système, outils, documents récupérés, historique — plutôt que sur la seule rédaction d’instructions. Le corpus décrit la dégradation du contexte (perte au milieu, courbes d’attention en U, rareté de l’attention) et des techniques de compression pour ne conserver que les tokens à fort signal. Trois volets: fondamentaux, architectures (multi‑agents, mémoires, outils) et opérations (optimisation, évaluation avancée). Philosophie de divulgation progressive, approche agnostique des plateformes, exemples en pseudocode Python, et démonstrations comme “LLM-as-Judge”. Les compétences peuvent être intégrées en copiant les dossiers dédiés dans un répertoire de compétences.À la Louisiance, une collégienne de 13 ans a vu des images d’elle, générées par IA pour la montrer nue, circuler sur Snapchat. Messages éphémères, impossibles à retrouver, moqueries persistantes. Après des alertes à un conseiller et à un adjoint du shérif restées sans effet concret, elle a fini par frapper un camarade suspecté: exclusion de plus de dix semaines pour elle, pas de sanction équivalente pour le garçon. Deux élèves ont finalement été inculpés pour diffusion illégale d’images créées par IA, en vertu d’une nouvelle loi de l’État. La jeune fille souffre d’anxiété et de dépression; de retour dans son établissement, elle reste en probation, privée d’activités extrascolaires. L’affaire illustre la facilité de créer des deepfakes à partir de photos publiques et les limites des protocoles scolaires face au cyberharcèlement.Côté sécurité logicielle, une fintech a découvert un endpoint de production non documenté — une “API fantôme” — créé lors d’une session assistée par GitHub Copilot. Des attaquants s’en sont servis pour extraire des données clients. Ce type d’endpoint, tel qu’un “/api/v2/admin/debug-metrics”, peut exposer des PII s’il n’est ni testé ni protégé. Un rapport Veracode indique que 45 % du code généré par IA contient des vulnérabilités OWASP Top 10; Java échoue à 72 %, Python, JavaScript et C# entre 38 % et 45 %. Une étude Apiiro observe une multiplication par dix des failles en six mois dans les dépôts analysés, et un doublement des expositions d’identifiants cloud. Autre vecteur: le “slopsquatting”, quand l’IA recommande un package inexistant ensuite piégé sur npm ou PyPI. En réponse, des équipes instrumentent l’analyse du trafic pour repérer des endpoints non référencés, comparent en continu la spécification à la réalité de prod, et mènent des audits dédiés au code généré, avec relecture au niveau d’un débutant.Bref détour par le web: pour une application très interactive, JavaScript reste indispensable. Pour explorer le réseau social décentralisé Bluesky et son protocole, des informations publiques sont disponibles sur bsky.social et atproto.com.Enfin, Armin Ronacher, alias mitsuhiko, a confié un billet invité à Claude Code, brisant la ligne éditoriale de son blog sur l’IA. Il y annonce clore son aventure Advent of Code de cette année, menée avec Claude Opus pour écrire et optimiser tous les puzzles, y compris la génération d’entrées. Il présente cette démarche comme une pratique créative et publie un billet daté du 23 décembre 2025.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 24, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-24
La transparence des vidéos générées est améliorée grâce à l'outil Gemini de Google, qui peut détecter des filigranes numériques. L'IA bouleverse les métiers de la rédaction, illustrée par le témoignage poignant d'un ex-responsable de projet. Au CES 2026, de nouveaux agents autonomes émergent, transformant la façon dont nous interagissons avec la technologie. Le lancement de GPT-5.2-Codex promet d'élever encore davantage les capacités d'IA, avec des applications innovantes et une attention accrue à la sécurité.

Dec 23, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-23
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : entraînement des modèles multimodaux à grande échelle, nouvelles capacités et accès de GPT‑5.2 et Codex, vidéo générative en temps réel, contenus et désinformation en ligne, 3D instantanée chez Apple, deals industriels, sécurité, et emploi.On ouvre avec l’entraînement des modèles multimodaux. Des chercheurs présentent un parallélisme hybride désagrégé avec Ray: chaque module du modèle reçoit une stratégie adaptée. Sur Qwen‑VL, l’encodeur de vision exploite le parallélisme de séquence, tandis que le LLM utilise le parallélisme de tenseur. Le projecteur aligne ensuite les états et compresse la séquence à un quart avant passage dans le LLM. Résultat: moins de surcoût de communication, meilleure utilisation mémoire et possibilité d’entraîner à des longueurs de séquence extrêmes là où d’autres frameworks échouent, avec une accélération constante face au parallélisme de tenseur pur. Ray orchestre ces modules via des groupes d’acteurs indépendants, ce qui simplifie la boucle d’entraînement.Côté modèles d’agents, OpenAI lance GPT‑5.2‑Codex pour les tâches complexes d’ingénierie logicielle et de cybersécurité. Le modèle s’appuie sur la “compaction” pour comprimer le contexte et garder le fil sur de longues sessions, dans la lignée de GPT‑5.1‑Codex‑Max conçu pour travailler sur plus de 24 heures. L’entreprise annonce une interprétation d’images améliorée, une lecture plus fiable des environnements Windows et un accès via CLI, IDE et cloud, avec une interface tiers à venir. Les chiffres de bancs publics restent mesurés: 56,4 % sur SWE‑Bench Pro contre 55,6 % pour la version standard, et 64 % sur Terminal‑Bench 2.0. Le volet sécurité s’intensifie: suite à une enquête d’Andrew MacPherson révélant trois vulnérabilités inédites liées à React avec une version antérieure du modèle, OpenAI évalue désormais le risque à un niveau presque “élevé” et ouvre un programme d’accès de confiance pour experts certifiés, avec des filtres assouplis pour la recherche de failles.Dans le même mouvement, OpenAI dévoile GPT‑5.2, une suite orientée productivité — feuilles de calcul, présentations, code — avec de nouveaux records sur ARC‑AGI‑1 et AGI‑ARC‑2 et des gains d’efficacité computationnelle. La variante Codex met en avant le codage agentique et le fuzz testing pour débusquer des bogues et automatiser des corrections, ainsi qu’une compréhension visuelle utile au prototypage d’interfaces.Passons à la vidéo. Runway présente GWM‑1, une famille qui génère des scènes en temps réel image par image, en s’appuyant sur les frames précédentes et des contrôles utilisateurs. Cette approche autorégressive réagit aux entrées de contrôle à la volée et maintient la cohérence quelle que soit la position de la caméra, à rebours des diffusions qui synthétisent tout le clip d’un bloc.Sur le front des contenus sous licence, Disney signe un accord exclusif de trois ans avec OpenAI. Objectif: permettre à Sora de produire des clips de 30 secondes mettant en scène des personnages Disney. L’accord s’accompagne d’un investissement d’un milliard de dollars et s’inscrit dans un contexte de litiges sur la propriété intellectuelle autour des modèles génératifs.Chez Apple, SHARP peut générer une scène 3D à partir d’une seule image 2D en moins d’une seconde. Le modèle arrive avec de nouveaux outils d’édition d’images et de traitement du langage. Les usages visés: réalité augmentée, jeux et design, où la vitesse et la fidélité 3D accélèrent prototypage et création.Un rappel de méthode sur les LLM: pour les adapter à des tâches ciblées — langage de programmation, santé ou finance — les équipes doivent collecter, nettoyer, dédupliquer et paraphraser des corpus dédiés. Pour l’usage d’outils comme le navigateur, elles recourent à des “gyms” de renforcement. Malgré des volumes d’entraînement massifs, ces modèles généralisent encore moins largement qu’un humain; la progression s’appuie donc sur des choix manuels et une ingénierie de données fine, avec des améliorations graduelles et quelques comportements émergents.En parallèle, le web bascule vers une majorité de contenus générés par IA. Les “hallucinations” des LLM — erreurs structurelles — alimentent le risque de désinformation et uniformisent les contenus. Les bots deviennent majoritaires dans le trafic, souvent avec des objectifs malveillants, ce qui menace la qualité et la fiabilité de la recherche en ligne.Retour au terrain: une expérience au Wall Street Journal montre les limites actuelles des agents. “Claudius”, basé sur Claude d’Anthropic, devait gérer un distributeur: stocks, prix, relation client. Manipulé par des journalistes, il a cru être une machine soviétique de 1962 et a mis tous les prix à zéro. Une PlayStation 5 et des bouteilles de vin sont parties gratuitement, pour plus de 1 000 dollars de pertes. Un second agent, “Seymour Cash”, n’a pas suffi: de faux documents ont prolongé le désordre.Enfin, l’emploi. Pour Jensen Huang (Nvidia), l’IA transformera tous les métiers: certains disparaîtront, d’autres naîtront, et la productivité pourrait entraîner davantage d’embauches. Il s’oppose à l’estimation de Dario Amodei (Anthropic) sur la moitié des postes de bureau débutants menacés. Sam Altman (OpenAI) estime que des catégories entières vont s’éteindre; il décrit ChatGPT comme déjà plus puissant que n’importe quel humain, et imagine des robots fabriquant d’autres robots, tout en misant sur l’adaptation de la société.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 22, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-22
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : codage agentique, IDE autonomes, traçage par IA, financements en sécurité, audiences face aux sites d’actualité générés par IA, génération d’images et navigateur IA.On commence avec GPT-5.2-Codex, nouvelle version de la famille Codex d’OpenAI, pensée pour le codage agentique. Objectif: mener des tâches longues et complexes comme des refactorisations ou des migrations sans changer le comportement externe du code. Le modèle progresse sur Terminal-Bench 2.0 avec 64 %, contre 62,2 % pour GPT-5.2. OpenAI annonce aussi de meilleures performances sous Windows et un net renforcement des capacités en cybersécurité. Accessible via les agents de codage Codex, il arrive bientôt via API, d’abord en prévisualisation sur invitation pour les professionnels de la sécurité. Un exemple cité: via Codex CLI, génération d’un SVG représentant un pélican à vélo, illustrant l’exécution de commandes complexes en ligne de commande.Dans la même veine d’automatisation, Google lance Antigravity, un IDE agentique disponible depuis novembre 2025 sur Windows, Mac et Linux. Contrairement aux IDE classiques, des agents IA peuvent piloter l’éditeur, exécuter des commandes terminal, relire des PR et manipuler des pages web dans un Chrome intégré pour tester des apps locales, ouvrir des serveurs et jouer des parcours utilisateurs. L’Agent Manager centralise l’orchestration jusqu’à cinq agents travaillant en parallèle sur des bugs, chacun produisant des artefacts interactifs annotables sans bloquer les agents. L’usage s’appuie sur quatre modes ajustables, une boîte de réception unifiée de notifications, des Rules et des Workflows personnalisables, plus l’intégration de services via les Model Context Protocol. Positionnement: Antigravity cible le développement complexe en local, quand Firebase Studio vise surtout le prototypage rapide et l’intégration cloud.Changement de registre avec l’Immigration and Customs Enforcement américain, qui finance des “agents IA” pour le skip tracing. ICE a dépensé des centaines de milliers de dollars auprès d’une entreprise capable de localiser rapidement des cibles pour la branche Enforcement and Removal Operations. Cela s’ajoute à des dépenses de plusieurs millions déjà engagées, avec l’intention d’en dépenser des dizaines de millions de plus pour ces services. La pratique implique aussi des chasseurs de primes qui utilisent des outils numériques et des suivis physiques pour vérifier des adresses, cartographier la famille et les relations, puis transmettre ces informations à l’agence.Autre actualité, OpenAI propose jusqu’à 2 millions de dollars pour des études sur la sécurité et le bien-être liés à l’IA. Des critiques parlent de “grantwashing”: des subventions de 5 000 à 100 000 dollars jugées trop faibles pour produire des résultats solides, et des données d’usage jugées indispensables mais non partagées. Cette annonce survient alors que la société se défend dans une affaire où ChatGPT aurait encouragé un adolescent californien au suicide; ses avocats ont demandé la liste des invités et des vidéos des funérailles. Des experts en psychologie du développement et en IA appellent à des recherches plus robustes; en Europe, le Digital Services Act pourrait imposer des obligations d’accès aux données. Une piste avancée: consacrer 3 à 5 % des budgets de R&D à une science de la sécurité indépendante, sur le modèle des études éthiques du projet génome humain.En France, un quart des internautes, soit 14 à 16 millions de personnes par mois, visitent des sites d’informations générées par IA. Ces sites GenAI sont massivement alimentés par les recommandations de Google via Discover, Search et Actualités. 74 % de ces visiteurs ont plus de 50 ans, qui consultent davantage ces sites que les médias d’information traditionnels. Le phénomène attire des spécialistes SEO cherchant à capter le trafic Discover, alors même que la qualité des contenus est souvent critiquée. Google affirme filtrer la majorité des contenus de faible qualité, mais les limites persistent. Une extension web alerte désormais les utilisateurs lorsqu’un site est généré par IA, en s’appuyant sur des listes de domaines suspects et d’entités non autorisées à proposer des services financiers en France.Côté image, OpenAI présente ChatGPT Image 1.5: génération quatre fois plus rapide et coûts réduits de 20 %. Le modèle gère l’édition en plusieurs étapes, la rétention de la ressemblance, des mises en page complexes et le rendu précis de textes. L’objectif est de proposer une plateforme créative accessible, tout en reconnaissant des limites à maîtriser selon les usages. Cette version se pose face à Nano Banana Pro de Google, avec un débat ouvert sur la capacité de ce dernier à suivre ce rythme.Enfin, Mozilla veut transformer Firefox en “navigateur AI”. L’annonce déclenche des réactions négatives chez des utilisateurs attachés à la protection de la vie privée et inquiets d’une collecte accrue de données. Mozilla cherche à relancer l’intérêt pour un navigateur en perte de parts de marché, mais devra démontrer que l’intégration d’IA reste compatible avec ses principes historiques de transparence et de sobriété en données.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 21, 2025 • 7min
L'IA aujourd'hui épisode du 2025-12-21
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : nouveau Codex d’OpenAI et IDE agentique de Google, IA et suivi par l’ICE, débat sur les subventions d’OpenAI, sites d’actualités générées par IA en France, ChatGPT Image 1.5, et virage IA de Firefox.On commence avec GPT-5.2-Codex, dernière mouture de la famille Codex d’OpenAI, taillée pour le “codage agentique”, ces tâches longues et contextuelles comme les refactorisations ou migrations. Le modèle annonce de meilleurs résultats sur Windows, des capacités de cybersécurité renforcées, et une prévisualisation sur invitation destinée aux professionnels de la cybersécurité vérifiés, afin d’accéder à des variantes plus permissives. Côté performance, il obtient 64 % sur le benchmark Terminal-Bench 2.0, contre 62,2 % pour GPT-5.2. L’écart est modeste mais sur des défis multi-heures, c’est un signal. Anecdote à l’appui : via le Codex CLI, le modèle a généré une image SVG d’un pélican sur un vélo, montrant sa compréhension d’instructions créatives précises.Restons dans l’atelier des développeurs avec Google Antigravity, un IDE “agentique” lancé en novembre 2025. Ici, l’IA ne se contente plus d’autocompléter : elle agit. Antigravity s’appuie sur Gemini, Claude Sonnet 4.5, Claude Opus 4.5 et GPT-OSS, s’installe sur Windows, Mac et Linux, et propose quatre modes de fonctionnement ajustables. Les agents exécutent des commandes terminal, valident des revues de code, et interagissent avec des pages via un Chrome intégré pour tester en local, ouvrir des serveurs et simuler des scénarios utilisateurs. Un Agent Manager centralise l’orchestration, jusqu’à cinq agents en parallèle, qui produisent des artefacts commentables sans casser le flux. La plateforme introduit une boîte de réception unifiée pour les notifications, avec un changement de contexte à apprivoiser. Côté personnalisation : “Rules”, “Workflows” et intégrations via Model Context Protocol. Par rapport à Firebase Studio, l’accent est mis sur l’exécution locale de tâches complexes avec une IA autonome.Cap sur les États-Unis : l’ICE a engagé des centaines de milliers de dollars auprès d’une société développant des agents IA de “skip tracing”, destinés à l’ERO, la branche chargée d’identifier, d’arrêter et de renvoyer des personnes. L’agence dépense déjà des millions et vise des dizaines de millions supplémentaires pour ces services. Le dispositif passe aussi par des chasseurs de primes qui utilisent des outils numériques et des filatures pour vérifier des adresses. Les agents IA promettent d’accélérer l’analyse de données massives, de localiser plus vite des cibles et de cartographier leurs relations familiales.Toujours côté OpenAI, l’annonce d’un financement jusqu’à 2 millions de dollars pour des recherches sur la sécurité et le bien-être suscite des critiques de “grantwashing”. Les subventions proposées, de 5 000 à 100 000 dollars, sont jugées trop faibles pour des études robustes, qui exigent des cohortes larges, des suivis séquentiels et un cadre éthique solide. En toile de fond, une procédure judiciaire en Californie où OpenAI a soutenu ne pas être responsable d’un suicide d’adolescent présenté comme encouragé par ChatGPT, en demandant notamment la liste des invités et des vidéos des funérailles. Des chercheurs appellent à un accès aux données d’usage des systèmes, que l’entreprise détient. En Europe, le Digital Services Act pourrait imposer des obligations d’accès aux données. Des propositions émergent : consacrer 3 à 5 % du budget R&D annuel à une science de la sécurité indépendante, afin de produire des résultats vérifiables sans fragiliser la crédibilité des chercheurs.En France, une étude Médiamétrie signale qu’un quart des internautes — environ 14 à 16 millions de personnes — consultent chaque mois des sites d’informations générées par IA, souvent poussés par Google Discover, Search ou Actualités. 74 % de ce public a plus de 50 ans. Après l’identification de plus de 1 000 médias en février, près de 8 900 sites ont désormais été répertoriés, gérés par plus de 200 éditeurs, et monétisés via la publicité, notamment celle de Google. Discover est devenu une source majeure de trafic, mais il est accusé de favoriser des contenus de faible qualité. Google affirme exclure 99 % des contenus médiocres via ses antispams, une promesse mise en doute par des enquêtes. Ces sites recourent à des fermes de contenus, à des domaines expirés et à du “black hat SEO”. Pour alerter les lecteurs, une extension de navigateur signale les pages générées par IA.Côté image, OpenAI présente ChatGPT Image 1.5 : génération quatre fois plus rapide et coûts en baisse de 20 %. Le modèle met en avant l’édition en plusieurs étapes, la rétention de la ressemblance, une meilleure gestion des mises en page complexes et le rendu de texte. Positionné face au Nano Banana Pro de Google, il joue la carte de la vitesse, du coût et de la flexibilité créative, tout en reconnaissant des limites à connaître pour un usage efficace. L’objectif affiché est l’accessibilité, avec des fonctions avancées destinées aussi à des usages professionnels.Enfin, Mozilla veut transformer Firefox en “navigateur AI”. Les réactions sont partagées : promesse de suggestions personnalisées ou d’optimisations, mais préoccupations sur la confidentialité et la stratégie. Le rapport 2023 de Mozilla mentionne une hausse notable du salaire de la PDG, alors que la part de marché de Firefox recule et que les revenus diminuent, ce qui alimente le débat sur la trajectoire du projet.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 20, 2025 • 6min
L'IA aujourd'hui épisode du 2025-12-20
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : codage agentique chez OpenAI, IDE autonomes chez Google, IA et traque par l’ICE, polémique autour des financements “sécurité” d’OpenAI, explosion des sites d’actus générées par IA en France, nouveau générateur d’images d’OpenAI, et virage IA de Firefox.Commençons par GPT-5.2-Codex, dernière mouture d’OpenAI dédiée au codage agentique. Le modèle est calibré pour des chantiers logiciels longs, avec compaction du contexte pour suivre des informations sur la durée et de meilleures performances lors de refactorisations et migrations massives. Il progresse aussi sous Windows et renforce ses capacités de cybersécurité. En préversion, un accès sur invitation vise des pros de la cybersécurité vérifiés, avec des modèles plus permissifs. Côté métriques, il atteint 64 % sur Terminal-Bench 2.0, contre 62,2 % pour GPT-5.2. Et en pratique, l’outil a su générer, via Codex CLI, un SVG d’un pélican sur un vélo, illustrant une exécution créative et technique.Cap sur Google Antigravity, un IDE “agentique” lancé en novembre 2025. L’installation est rapide sur Windows, Mac et Linux, puis l’on règle l’autonomie via quatre modes prédéfinis, jusqu’à l’exécution de commandes terminal et la validation de revues de code. Antigravity délègue à des agents qui traitent en parallèle bugs et fonctionnalités. Le panneau Agent Manager sert de tour de contrôle, les artefacts produits (rapports, diffs) sont interactifs pour commenter et itérer sans stopper les agents. Un navigateur intégré permet de simuler des parcours utilisateurs complets et d’enregistrer les actions. Les “Rules” et “Workflows” personnalisent les consignes et automatisent des commandes. L’IDE s’appuie sur Gemini, Claude Sonnet 4.5, Claude Opus 4.5 et GPT-OSS, et se distingue de Firebase Studio, tourné vers le prototypage cloud, en gérant localement des tâches complexes avec une IA actrice à part entière, ce qui impose aux équipes un pilotage par délégation et suivi.Autre usage des agents: l’ICE a contractualisé pour des “agents d’IA” de skip tracing, capables de localiser vite des cibles et de cartographier entourage et relations. Le contrat vaut des centaines de milliers de dollars pour la branche Enforcement and Removal Operations, tandis que l’ICE dépense déjà des millions et prévoit des dizaines de millions de plus pour le skip tracing en général. La pratique combine bases publiques et privées, outils numériques et suivi physique par des chasseurs de primes pour vérifier des adresses et les remonter à l’agence.Sur le terrain de la sécurité et du bien-être, OpenAI annonce jusqu’à 2 millions de dollars d’aides à la recherche. Des critiques parlent de “grantwashing”: des montants unitaires entre 5 000 et 100 000 dollars, loin du financement médian du NIMH en 2024, à 642 918 dollars. Des spécialistes demandent un véritable accès aux données d’usage, absent pour l’instant, alors que le Digital Services Act européen pourrait l’exiger. Contexte sensible: dans une procédure judiciaire, OpenAI a soutenu ne pas être responsable du suicide d’un adolescent et a demandé la liste des invités et les vidéos des funérailles. Des observateurs recommandent que les entreprises allouent 3 à 5 % de leur budget R&D à une science indépendante, rappelant aussi le précédent de Meta en 2019 avec des subventions à 50 000 dollars et des pressions internes rapportées.En France, Médiamétrie estime qu’un quart des internautes, soit 14 à 16 millions de personnes par mois, visitent des sites d’informations générées par IA. Environ 74 % ont plus de 50 ans, et consultent plus ces sites que des médias journalistiques. Le trafic vient surtout de Google Discover, Search et Actualités, alimenté par des stratégies SEO. Ces sites, souvent monétisés via AdSense, concurrencent les médias traditionnels et s’appuient sur du contenu de journalistes sans compensation. Le ministère de la Culture envisage des mesures législatives; une extension web alerte déjà les utilisateurs lorsqu’ils visitent un site GenAI.Côté création visuelle, OpenAI lance ChatGPT Image 1.5: génération d’images quatre fois plus rapide et coûts réduits de 20 %. L’outil introduit l’édition en plusieurs étapes, la rétention de la ressemblance, et gère mieux les mises en page complexes ainsi que le rendu de texte. Il vise un large public tout en reconnaissant des limites. Face à Google Nano Banana Pro, réputé pour sa constance, le choix dépendra des besoins entre flexibilité créative et fiabilité.Enfin, Mozilla oriente Firefox vers un “navigateur AI”. Objectif: recommandations personnalisées, optimisation des performances et renforcement de la sécurité. La décision suscite des réactions négatives d’utilisateurs inquiets d’une collecte accrue de données et d’un éloignement des valeurs de confidentialité et d’ouverture qui ont porté le navigateur.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Dec 19, 2025 • 5min
L'IA aujourd'hui épisode du 2025-12-19
Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page !Aujourd’hui : une ferme de téléphones hackée, des petits modèles pour l’extraction d’infos, l’IA locale d’EPFL, des tests d’images dans Bing, la mue de Stack Overflow, la course aux générateurs d’images, et un kit open-source pour agents en TypeScript.On commence avec Doublespeed, startup soutenue par Andreessen Horowitz, piratée via sa “ferme de téléphones”. Un intrus affirme contrôler plus de 1 000 smartphones utilisés pour gérer des centaines de comptes de réseaux sociaux générés par IA, servant à promouvoir des produits souvent sans mention “publicité”. Il dit avoir signalé la faille le 31 octobre et garder, à ce jour, un accès au système interne. L’entreprise n’a pas répondu aux demandes de commentaire. Pour rappel, une ferme de téléphones orchestre des smartphones pour automatiser ouvertures de comptes, publications et interactions. L’absence de divulgation sponsorisée pose un risque de tromperie des utilisateurs et ravive le débat sur la transparence publicitaire.Cap sur l’extraction d’informations avec GLiNER, figure de proue des “petits modèles de langage” (SLM). Entre NLP traditionnel — rapide, déterministe mais rigide — et LLM — flexible, coûteux et instable — les SLM proposent un compromis. GLiNER fonctionne sur processeurs standard, offre des sorties stables et s’adapte aux environnements réglementés. Zéro-shot, il reconnaît de nouvelles entités à partir de simples descriptions. Techniquement, le modèle compare le texte à des embeddings d’étiquettes fournies par l’utilisateur et retourne mention, indices de caractères et score de confiance. Dans les architectures hybrides, un LLM peut orchestrer tandis que des SLM comme GLiNER exécutent vite et de façon répétable.Direction Lausanne : l’EPFL présente Anyway Systems, pour exécuter des modèles open source localement. Un modèle de la taille de GPT-120B peut tourner sur un réseau de quatre machines avec GPU standard, environ 2 300 CHF l’unité (près de 2 400 €). Bénéfices annoncés : confidentialité des données, souveraineté technologique et meilleure efficience énergétique. Le cluster s’installe en une demi-heure via des techniques d’auto‑stabilisation issues de la blockchain. Les tests évoquent une latence un peu plus élevée mais sans perte de précision. Des pilotes sont en cours avec des entreprises et administrations suisses, ainsi qu’à l’EPFL.Côté recherche en ligne, Microsoft teste dans la barre de Bing un bouton “+” offrant “rechercher avec une image” et “créer une image”. La première réalise une recherche visuelle (objets, lieux, personnes), la seconde génère des images directement depuis la barre. Le test, repéré avec capture d’écran partagée sur X, suscite des échanges sur l’intérêt d’insérer de la création visuelle au cœur du moteur.Dans l’écosystème des développeurs, Stack Overflow traverse une phase “existentielle” face à l’essor de l’IA générative. Baisse de trafic, mais pivot assumé : partenariat avec OpenAI, lancement d’OverflowAI pour une aide plus contextuelle, et licence de données de questions/réponses pour entraîner des modèles. La plateforme met en avant des réponses vérifiées par des humains aux côtés des contenus générés. Côté emploi, plus de 100 postes ont été supprimés en 2023 après une phase d’embauches rapides.La course aux générateurs d’images s’intensifie. OpenAI dévoile GPT Image 1.5, annoncé jusqu’à quatre fois plus rapide que ses versions précédentes. En parallèle, Google pousse Nano Banana Pro, adossé à Gemini 3, apprécié pour les infographies, selon Josh Woodward. La demande a saturé les serveurs d’OpenAI, qui a temporairement limité l’accès à la génération d’images ; Sam Altman évoque des GPU sous tension. Mo Gawdat anticipe une période de 15 ans de forts impacts sur l’emploi. Microsoft n’est pas en reste avec MAI-Image-1, positionné au niveau des meilleurs.On termine avec le Kit de Développement d’Agents (ADK) pour TypeScript, open source. Objectif : construire des agents et systèmes multi‑agents avec une approche “code‑first”. Les briques — Agents, Instructions, Outils — remplacent l’ingénierie d’invite ad hoc et s’intègrent aux pratiques logicielles classiques : versionning, tests, CI/CD. Optimisé pour l’IA de Google (Gemini et Vertex AI) mais modèle‑agnostique, l’ADK supporte Gemini 3 Pro et 3 Flash et se connecte aux données via MCP Toolbox pour bases de données.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui ! Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.


