Actu IA #4 : Mistral Agents, MyTrainer, Veo 3, Coût de l'IA, Évaluation des modèles
12 juin 2025
Dans cet épisode, nous passons en revue les actualités marquantes de l'intelligence artificielle sur les deux dernières semaines (29 mai 2025 - 12 juin 2025). Au programme : agents Mistral et explications du concept d'agent IA, lancement de mon application de coaching personnalisé MyTrainer IA, retour sur le modèle de génération de vidéo de Google Veo 3, discussion sur le coût de l'IA et importance de l'évaluation des modèles d'IA.
Un condensé rapide et accessible pour rester à jour sur l'évolution de l'IA générative
Pour tester mon application : https://mytrainerapp.io/fr/
Une question ? Contacte-moi : guillaume.gay@protonmail.com.
Transcription
Bienvenue dans Génération IA, le podcast qui vous aide à maîtriser l'IA générative afin de simplifier votre quotidien, booster votre productivité et développer votre créativité. Bonjour à tous, très heureux de vous retrouver après deux semaines sans épisode de podcast. J'étais parti en vacances et puis j'ai lancé mon application. Donc autant vous dire que j'étais plutôt focus sur autre chose que les podcasts ces deux dernières semaines. Mais je vais faire cette revue d'actu. J'avais fait déjà neuf épisodes en très peu de temps et là c'est la première fois que je rate une semaine donc ne m'en voulez pas. Ces vacances ont été vraiment reposantes et nécessaires. Et puis derrière j'ai lancé mon application donc j'étais très focus là dessus. Je vais vous en parler peut -être un peu dans cet épisode de podcast. J'aimerais faire un épisode entier sur le sujet parce que c'est une application qui a plein plein d'IA partout. Et donc ça peut être intéressant pour vous de comprendre comment tout ça fonctionne. Commençons cette revue d'actu. J'ai quand même pris quelques notes malgré tout, donc j'ai surtout pris des notes sur Mistral qui lance ses agents. agent et agent API. Alors concrètement, quelle est la différence entre un agent IA et une IA tout court ? Et bien, un agent IA peut se connecter à des outils et donc peut itérer sur lui -même. C'est à dire que, par exemple, il y a un exemple très connu qui est un agent pour réserver des hôtels pour ses vacances, par exemple. Donc l'idée sous -jacente pour les consommateurs, c'est ça. C'est de discuter avec un agent et de lui dire, j'aimerais partir deux semaines à l'île Maurice. Eh bien, réserve moi les billets, les hôtels, fais moi un programme sur mesure et réserve moi toutes les attractions, tous les billets qu'il faut réserver. Et là, vous avez l'agent qui commence à mettre en place des étapes de raisonnement et puis d'appeler des outils, par exemple, une API qui va retourner tous les hôtels de l'île Maurice avec les disponibilités donc en spécifiant des dates et puis donc parmi ces hôtels il va aller comparer les résultats il va voir ce qui vous correspond le mieux avec votre budget que vous avez spécifié éventuellement et ensuite il va carrément réserver pour ça il faut qu'il y ait en place ce qu'on appelle un MCP C'est un nouveau terme qui est apparu, c'est modèle contexte protocol. Et bien vous avez côté serveur. Vous pouvez mettre en place un modèle contexte protocol pour que des IA extérieurs puissent se connecter à vos données. Et c'est un protocole qui a été standardisé récemment, enfin récemment, il y a peut -être deux trois mois par l'entreprise Anthropic qui a créé Cloud. Et donc vous pouvez implémenter sur vos serveurs. Imaginons que vous êtes la compagnie Accor qui a plein d'hôtels. Vous mettez en place un MCP pour que les langages de modèles externes puissent se connecter à vos data. Mais vous allez uniquement exposer certaines données. Par exemple, la disponibilité de vos hôtels, ça c'est bon. Vous n'allez pas évidemment exposer les données de vos clients par exemple. côté serveur de mettre en place des fonctions comme une API afin d'exposer certaines données, et puis d'expliquer au LLM comment appeler cette fonction. Donc par exemple, quel paramètre prend cette fonction. Donc ça peut être la date. Imaginons que je veux réserver pour deux semaines en juillet, du 15 au 30 juillet, eh bien le LLM va passer cette date -là. au MCP et donc ensuite la réponse va être la disponibilité des hôtels sur cette date là et puis votre agent IA va peut -être du coup sélectionner un hôtel et refaire du coup un appel au MCP pour dire je veux réserver cet hôtel donc il va réserver cet hôtel etc etc à la fin l'agent IA revient vers vous et dit voilà j'ai booké votre voyage Vous partez deux semaines à l'île Maurice dans tel hôtel, tel jour et puis vous allez faire le tour de l'île et donc tel jour vous allez dans tel autre hôtel. Ça c'est vraiment le but ultime des agents IA côté consommateurs. Vous avez aussi des agents IA côté entreprises et ça c'est tout un autre domaine.
Je salue mes amis de l'IMOVA basé à Nice. qui créent des agents IA pour les entreprises. Et donc, par exemple, si je prends leur exemple à eux, vous avez un agent pour la comptabilité. Donc, en fait, c'est une IA qui va se connecter à vos data de comptabilité et puis potentiellement faire des actions. Vous avez un agent pour le marketing et les réseaux sociaux. Et là, par exemple, pareil, l'agent peut poster directement lui -même sur les réseaux sociaux. Donc vous pouvez évidemment valider ou pas. Et la différence, c'est que là, c'est pas simplement vous qui demandez HHGPT, puis après vous faites votre post LinkedIn. Là, c'est carrément l'agent qui va poster lui -même. Donc il peut poster au nom de votre entreprise, pas forcément votre nom propre. Si vous lui donnez l'accès, évidemment. Et donc, il va, comme ça, créer du contenu sur ce que vous lui avez demandé, les documents que vous lui avez passé, comment vous l'avez briefé. Et donc, ces agents IA, vous imaginez qu'il peut y en avoir dans tous les domaines, parce qu'il y a plein de tâches, en fait, d'emploi tertiaire qui peuvent être automatisées grâce à des agents IA. Ça peut être verser des fiches de paye, bien qu'il y ait des logiciels maintenant qui fassent ça et puis avec l'IA, on peut encore plus automatiser. En fait, toutes les tâches répétitives et même certaines tâches créatives avec les agents IA peuvent être déléguées du coup à des IA. J'aimerais beaucoup inviter des gens qui font des agents IA pour en discuter un peu plus. Je vais essayer de trouver ça. Moi, pour mon application, j'ai créé un agent IA. J'ai créé un agent IA. Je vais peut -être vous en parler maintenant. J'ai sorti du coup mon application mobile qui s'appelle My Trainer ou My Trainer IA. Et donc c'est une application de coaching sportif personnalisé avec l'IA générative.
Et c'est une application qui... qui comporte un agent IA via un chat dans l'application qui peut répondre à toutes vos questions selon vos données. Donc l'application se présente quand vous l'ouvrez. Je vais vous mettre un lien dans la description de ce podcast si vous voulez tester gratuitement pendant 30 jours. Vous arrivez sur l'application et là vous avez une IA qui va vous poser des questions. Donc la première IA première interaction avec une intelligence artificielle. My Trainer IA va vous poser des questions sur vos objectifs sportifs, sur votre lifestyle, sur plein de choses. Donc ça, cet IA a été configuré conjointement avec un coach sportif de très haut niveau qui a coaché des plusieurs milliers de clients et on a fait ensemble On a fine -tuné, on va dire, cet IA ensemble. On a fait plus de 40 versions de l'application avant que ça lui corresponde totalement. Et donc, première interaction avec l'IA, elle va vous poser plein de questions sur vos objectifs, comme en fait, vous l'auriez fait avec un coach en ligne, par exemple. Une fois que vous avez répondu à toutes ces questions et que elle -même considère qu'elle a suffisamment d'informations, donc pareil, Il n'y a rien de fixe si vous dites que vous avez mal au genou et que vous avez tel syndrome, tel lifestyle. Tout est hyper personnalisé. Il n'y a rien de fixe. C'est l'IA qui va décider quand elle aura suffisamment d'informations pour générer un programme d'entraînement et un programme de nutrition, éventuellement, si vous le voulez, adapté à vos objectifs. Mais c'est pas quelque chose qui est fixe, par exemple, demande lui ça, ça, ça, ça et hop, c'est fini. Non, non, c'est elle. Donc, selon le client, selon l'expérience, selon vos réponses, eh bien, la conversation peut être plus ou moins longue selon votre niveau. Si vous dites que vous êtes un expert en fitness, par exemple. et bien elle va forcément vous parler comme elle parlerait à un expert et elle va vous poser des questions beaucoup plus profondes, beaucoup plus techniques que si vous dites que vous êtes un débutant. Donc ça, c'est un premier point. Une fois qu'elle -même considère qu'elle a toutes les informations, elle va déclencher la génération de votre programme d'entraînement et de nutrition. Donc on pourrait dire que c'est quand même une sorte d'agent IA parce qu'elle prend une décision. Moi, je considère que Dès qu'une IA prend une décision pour enclencher une fonction, c'est un agent IA. Je ne sais pas si tout le monde et tous les spécialistes sont d'accord avec moi, mais pour moi, ce serait ma définition parce que, en fait, une IA normale, vous avez du tchat, donc elle répond simplement à des questions, mais elle ne prend jamais de décisions. Et là, quand elle déclenche des fonctions, elle prend des décisions. Donc, une fois que vous avez ça, L'IA déclenche en arrière plan votre programme d'entraînement hyper personnalisé et votre plan nutritionnel hyper personnalisé également. Et ensuite dans l'app, vous pourrez retrouver tous vos entraînements planifiés dans votre calendrier avec des sessions interactives, les temps de repos, le nombre de répétitions, les tempos, les intensifications, une vidéo d'exécution, tout ce qu'il faut en fait pour progresser. Et pareil pour la nutrition, vous avez tous vos repas avec des instructions de préparation, toutes les macros. Bref, tout ce qu'il faut pour que, en fait, vous ayez juste à soulever des poids ou courir ou peu importe faire du fitness. L'application, je précise, est avec ses fitness et musculation. Il n'y a pas de running encore ou de cyclisme ou autre. Mais bref, vous aurez juste à soulever des poids et manger et c'est tout. Et là, vous êtes sûr d'atteindre tous vos objectifs sportifs, que ce soit physique ou d'état de forme, par exemple.
Donc, voilà pour une présentation du onboarding. Et après, comme je l'ai dit, dans l'application, il y a un chat. Et ça, c'est un point de différenciation avec toutes les autres applications de sport. C'est que vous pouvez parler à My Trainer IA tout le temps. Et par exemple, s'il vous manque un ingrédient dans votre repas, Si vous avez des questions spécifiques, si vous ressentez une douleur par rapport à tel exercice, vous pouvez lui poser la question. Vous pouvez aussi lui poser la question d'avoir votre liste de courses pour une semaine, deux semaines, trois jours. Et en fait, My Trainer IA a des fonctions, donc des outils comme un agent IA, puisque c'est un agent IA. Et il va appeler la fonction, par exemple, obtenir ma liste de courses. avec un paramètre de date, donc ça peut être si vous dites juste pour cette semaine, il va passer les dates de cette semaine, il va obtenir ça, il va reformater ça, catégoriser ça et vous retourner votre liste de courses. Pour l'instant, il y a quasiment, il me semble que des fonctions qui permettent d'obtenir de la data et pas encore de fonctions qui puissent déclencher à part la génération du programme et de la nutrition au début, déclencher des actions dans l'application, mais j'ai prévu d'en implémenter. Par exemple, quand vous voulez remplacer un aliment dans votre programme nutritionnel, actuellement, il vous fait simplement une recommandation dans le tchat, mais j'ai prévu d'implémenter des fonctions qui vont automatiquement remplacer dans tous vos repas les aliments. En tout cas ce qu'il faut comprendre c'est que My Trainer IA est connecté à vos données dans la base de données et donc contient des informations sur vous, des informations précises qui va lui permettre d'être très précis dans ses recommandations et peut déclencher des fonctions tierces. Voilà pour les agents IA et pour ce projet My Trainer que je vous recommande de tester et de me donner votre feedback. C'est un projet sur lequel je travaille depuis un an à peu près. C'est un très gros projet, c'est un des plus gros projets de ma vie. Et pourquoi c'est cohérent d'utiliser l'IA dans ce domaine ? En fait, quand vous voulez implémenter de l'IA, il faut vous poser la question en quoi l'IA sera cohérente sur ce sujet. Généralement, on utilise l'IA générative pour optimiser des systèmes existants. dès qu'une entreprise ou un domaine fait de l'argent et bien on va intégrer l'IA pour automatiser des process et pour rentabiliser encore plus. Là c'est carrément un nouveau produit qui est basé 100 % à base d'IA. Donc c'est vraiment à fond dans l'IA générative mais moi c'est ce qui me plaît. Pourquoi c'est cohérent parce que de une Les IA vont avoir les meilleures connaissances disponibles quand vous demandez à Tchadjpt. Vous voyez que si vous lui demandez une question précise sur la nutrition ou sur l'entraînement, il va être capable de répondre. Ensuite, l'IA est disponible H24. Donc quand vous avez une question, vous pouvez lui demander n'importe quand, que vous soyez par exemple à la salle entre deux entraînements, votre machine est prise, vous pouvez lui demander une alternative qui va faire travailler les mêmes groupes musculaires et qui soit cohérente avec vos blessures, etc. Il va vous répondre instantanément. Donc ça, la disponibilité, c'est vraiment un des avantages les plus grands de l'IA, disponible H24. Ensuite, l'accessibilité. Oui, vous avez accès aux meilleures connaissances du monde directement dans votre application et dans votre plan d'entraînement.
Je n'ai pas parlé de la génération du plan d'entraînement et de la nutrition, mais c'est pareil, ça a été travaillé avec le même coach et avec des techniques très précises de telle sorte que vous avez une progression, une surcharge progressive. qui soit vraiment faisable. Et vous avez des bilans toutes les quatre semaines. Donc vous avez votre plan pendant quatre semaines avec votre chat. Et au bout de quatre semaines, vous avez à voir un nouveau chat avec MyTrainerIA qui va de nouveau vous poser des questions mais cette fois sur votre progression en ayant en tête tout votre plan d'entraînement, le chat du début, tout votre profil. et donc il saura exactement vous demander votre progression, voir si ça correspond à la progression qu'il avait attendu, voir si vous avez forcément respecté ou pas les entraînements et la nutrition et dans ce cas il va recalibrer pour les quatre prochaines semaines. Vous avez ces bilans mensuels qui sont franchement bluffants parce que quand vous lui expliquez le feedback et qu'il se souvient de tout, et ben c'est vraiment c'est vraiment bluffant je vous recommande de tester ça mais bon il faudra arriver à quatre semaines donc il faut être un peu rigoureux mais une fois que vous serez arrivé à quatre semaines vous aurez ce bilan et et là j'ai vraiment eu un un de ces moments vous savez la première fois que j'utilisais tcha jpd vous vous dites ouah c'est incroyable et la première fois par exemple qui sort un nouveau modèle ou un nouvel outil par exemple l'utilisation de cursors pour coder. Vous avez ce genre de moment où vous êtes là à subjuguer. J'ai eu un peu ce moment avec les bilans mensuels dans My Trainer IA parce que quand vous lui dites que vous avez perdu 2 % de masse grasse et qu'il se souvient à combien vous étiez, qu'il connaît par cœur votre programme et qu'il vous explique que oui, c'est normal, c'était prévu parce que telle raison, telle raison. Et donc pour les quatre prochaines semaines, on va réajuster le plan, on va faire un deload d'une semaine, on va... Après, on va repartir sur les mêmes bases, etc. Et bien, vous vous dites, putain, c'est puissant, c'est vraiment puissant. En fait, quand on connecte l'IA de façon intelligente, on peut avoir ce genre de moment. Et dans Cursor, vous avez le mode agent. En Cursor, c'est l'environnement de développement pour coder. Quand ils ont créé le mode agent, ils ont du coup... donner des outils qui sont, par exemple, édite ce fichier, lis la code base, récupère ce fichier. Quand tous ces outils ont été connectés ensemble, vous avez un peu ce wow effect, qui est en fait, vous voyez l'IA sous vos yeux, utiliser ces outils, itérer, réfléchir et vraiment obtenir des résultats cohérents. Et là, vous êtes subjugé. Donc voilà pour My Trainer, j'en parlerai peut être plus. Je réfléchis s'il y a des choses intéressantes que je peux expliquer dans le podcast et qui soient cohérentes avec My Trainer. J'ai rien spécialement qui me vient en tête. Forcément, je vais peut -être faire un épisode beaucoup plus complet, beaucoup plus préparé parce que là, c'est de l'improvisation totale. C'est de l'improvisation totale. Donc voilà, je vais passer à une nouvelle actu. Vous savez, je vous avais parlé de la conférence de Google I .O. où ils ont sorti un modèle de vidéo qui s'appelle VO. J'aimerais revenir rapidement là -dessus parce que j'ai peut -être pas assez détaillé. Tout d'abord, VO, c'est un modèle qui génère des vidéos avec de l'audio. Et ça, c'est assez impressionnant parce que vous avez des vidéos avec de l'audio. Alors qu'avant vous aviez juste des vidéos par exemple dans Sora de OpenAI. Là vous avez les deux en même temps et c'est hyper bien synchronisé, les lèvres bougent correctement par rapport aux mots des personnages. Donc oui, l'IA VO de Google est vraiment incroyable. Maintenant, je sais qu'il y a eu beaucoup de déceptions, c'est pour ça que je n'aime pas trop m'exprimer à chaud sur des nouvelles annonces comme ça, parce que dans le milieu de l'IA générative, Vous avez plein d'annonces tout le temps. Et parce que il faut rester dans la course, il faut devancer les concurrents, ça se joue beaucoup sur le buzz, même pour lever des fonds, etc. Donc là, il y a eu cet effet, enfin, annonce de VO3 avec des démos vraiment exceptionnels. Maintenant, déjà, c'est très cher. Oui, l'IA est cher. là c'était il me semble le prix de VO3 je sais plus mais peut -être 75 centimes la seconde voire un peu plus je sais plus mais ça devenait très vite très cher oui l'IA est cher après j'aimerais relativiser ça en fait c'est plus cher qu'on peut le penser parce que par exemple je open AI bah brûle du cash Ils ne sont pas forcément rentables. C'est ça qu'il faut comprendre. C'est fou. Ils font tellement de levés de fonds qu'ils se permettent de sous -pricer, on va dire, leurs produits. Par exemple, l'abonnement de 20 euros par mois à TchadGPT. En fait, si vous l'utilisez beaucoup, peut -être que ça va coûter 50 euros à OpenAI au final, de consommation de tokens, de serveurs, etc. Mais ils peuvent se le permettre parce qu'ils ont levé tellement d'argent. que du coup, ils gardent leur prix attractif pour l'utilisateur.
Mais attention, parce qu'une fois qu'ils auront tué toute la concurrence, ça fait exactement comme Uber. Uber, ils n'étaient pas rentables jusqu'à, je crois, cette année ou l'année dernière. C'est -à -dire que pendant 10 ans, ils ont cramé tout le cash de leurs investisseurs pour au final tuer la concurrence avec des prix bas. Et maintenant qu'ils ont le monopole, il y a eu une augmentation de prix très conséquente sur Uber. Et donc, ils deviennent rentables. Après 10 ans, mais ils deviennent rentables. Et les investisseurs, forcément, ils sont contents parce que maintenant qu'ils ont une part énorme du marché, à partir du moment où ils deviennent rentables, ils deviennent rentables pas qu'un peu. Ils crachent des millions et des millions de dollars. Donc là, c'est pareil pour les LLM et pour l'IA générative. Vous avez toutes ces boîtes qui craignent du cash. C'est pour ça que c'est quand même très dur qu'il y ait un nouvel entrant dans la course parce que tout est abordable. Donc profitez -en d'ailleurs. Utilisez déjà de JPT avant que les prix augmentent. Donc c'est très dur pour les nouvelles entrants. Heureusement, on a eu Mistral, IA en France.
Franchement, on a beaucoup, beaucoup, beaucoup de chance de ne pas avoir raté l'entrée d'un acteur majeur de l'IA générative parce que entrer aujourd'hui c'est trop tard. Il aurait fallu rentrer il y a 2 -3 ans pour créer ses propres modèles. On peut toujours créer ses propres modèles mais il faut beaucoup de cash. On a déjà des entreprises établies qui sont très puissantes. Heureusement qu'on a Mistralia. Ils ont levé beaucoup de cash donc ils peuvent développer tranquillement. Mais voilà, IA c'est cher. Maintenant, j'aimerais aussi utiliser une actualité. OpenAI, leur modèle de réflexion de raisonnement O3, ils viennent de baisser le prix de 80%. C'est énorme. Pourquoi ? De une, ils vont sortir un nouveau modèle O3 Pro qui sera encore plus puissants que O3 et donc ils peuvent se permettre de baisser le prix de O3 parce qu'il y en a beaucoup qui vont utiliser le nouveau O3 Pro qui sera plus intelligent et qui sera forcément plus cher. Donc quand ils sortent un nouveau modèle, ils peuvent se permettre de baisser le prix des anciens modèles. En fait, c'est tout l'intérêt de construire une application sur des modèles d'IA générative. comme je l'ai fait avec My Trainer IA. Sur My Trainer IA, j'ai fait des évaluations des modèles, donc c'est -à -dire que j'ai carrément construit un outil en interne pour pouvoir tester des promptes et tester des modèles. Je teste un prompt et je peux faire un call API sur 5, 10 modèles différents. Donc j'ai 10 résultats. Vous savez, des fois dans le Chart GPT, Quand vous lui demandez quelque chose, vous avez deux résultats qui s'affichent.
C'est un peu perturbant pour l'utilisateur, mais en fait, OpenAI se sert de vous pour évaluer leurs réponses. Vous allez dire laquelle est la meilleure pour vous. Ils vont enregistrer cette donnée, évidemment, et la prochaine fois, 4GPT sortira directement la réponse qui a été le plus aimée par les utilisateurs. C'est du post -entraînement. Ça me fait penser à... Vous savez au CAPTCHA sur Google où vous devez valider, cliquez sur les feux verts, cliquez sur les voitures, cliquez sur les motos. Je ne sais pas si vous avez remarqué, mais c'est toujours lié à la circulation de la route. Pourquoi ? Parce qu'ils utilisent ces données pour entraîner leur voiture autonome. Je crois que ça s'appelle Waybo. Waybo car Waymo, pardon. Weibo, ça doit être une entreprise chinoise, je confonds. Si vous allez à San Francisco aujourd'hui, vous prenez un taxi, le taxi arrive, il n'y a aucun conducteur. Vous rentrez, c'est un taxi autonome de l'entreprise Waymo de Google. Ils ont leur taxi autonome qui circule dans San Francisco. Imaginez ça en France, j'aimerais beaucoup, mais avec les régulations européennes et françaises, on est vraiment en train de tuer toutes les innovations. Donc bravo pour ça. En fait, ils ont utilisé toutes les données des cap -chats que les gens ont fait. Par exemple, vous montrez le même cap -chat à 10 personnes. S'il y a 9 personnes qui vont bien cliquer sur les feux vert, 90 % des réponses vont être là. Donc c'est forcément la réponse correcte. Ils n'ont même pas besoin d'avoir un opérateur qui va vérifier. puisque 90 % des gens ont fait ça, c'est la réponse correcte. Les 10 % qui se sont trompés, eh bien ils se sont trompés. On va directement utiliser ces données pour entraîner un modèle d'IR, de vision, pour dire voilà, sur ces images c'est un feu vert, c'est un feu rouge, ça s'appelle de l'entraînement supervisé. Et donc toutes ces données, ils les ont utilisées pour les voitures autonomes, donc je trouve ça super intelligent de mettre en place un système qui permet de détecter les fraudes et en même temps de récupérer les données pour entraîner leur modèle. Parce que les données, c'est vraiment le nerf de la guerre dans la course Aliyah. C'est pour ça que Tesla sur leur voiture, ils ont mis plein de caméras dès le début, parce qu'en fait, toutes ces données de ces caméras de leur conducteur, ils les utilisent pour améliorer leur système de pilote automatique. Et c'est pour ça que Tesla dans le pilote automatique est très très fort, quasiment le meilleur acteur avec Waymo. Donc pourquoi j'ai dit ça ? Ah oui, parce que dans ChaatGPT vous avez deux réponses donc ça s'appelle l'évaluation. Pour MyTrainerIA j'ai mis un système en place d'évaluation où j'ai fait tester les meilleurs modèles, enfin j'ai testé plein de modèles et après je donnais simplement la réponse à mon collègue coach qui me disait Oui, pour tel client, ce programme d'entraînement correspond mieux que celui -là. Pour telle et telle raison. Je regardais quel modèle m'avait donné ce programme d'entraînement et je me disais, ok, c'est lui le meilleur pour ce client. On a fait plusieurs profils comme ça et il est ressorti qu'un certain modèle était le meilleur à tous les coups, pour tous les clients et pour tous les promptes. Et ce modèle est un peu cher, je dois le dire. Aujourd'hui, un utilisateur de My Trainer IA va me coûter, juste pour la génération des programmes d'entraînement et de nutrition, deux euros. Étant donné qu'il y a 30 jours gratuits, ceux qui prennent les 30 jours gratuits mais qui ne renouvellent pas en abonnement derrière, forcément, ils vont me coûter de l'argent. Donc aujourd'hui, je perds de l'argent, mais c'est un pari que je fais pour l'avenir. Pourquoi ? Parce que comme je vous l'ai dit, OpenAI, ils viennent de baisser leur prix du modèle O3 de 80%. Alors c'est pas le modèle que j'utilise moi, mais les modèles ont tendance à baisser avec le temps parce qu'il y a des nouveaux meilleurs qui sortent. Alors soit vous utilisez les meilleurs, soit vous continuez d'utiliser les mêmes que maintenant, mais avec un prix réduit. Dans tous les cas, vous pouvez parier que les prix vont baisser. Et donc, Aujourd'hui, je perds de l'argent sur mes utilisateurs de My Trainer IA, mais je parie que je vais essayer de les fidéliser avec la meilleure qualité. Je néglige surtout pas la qualité des programmes d'entraînement et de nutrition. Je pense qu'il y a de meilleur. Pourquoi ? Parce que c'est important pour moi, pour mes clients d'avoir les meilleurs résultats. Mais je parie sur le fait que les prix vont baisser dans le futur sur les modèles d'IA que j'utilise et donc je vais commencer à être rentable. dans les mois qui viennent. Donc c'est un pari que j'ai pris.
C'est un pari risqué, mais moi, enfin, depuis le début de l'IA Générative, c'est toujours le même pattern. Les prix baissent quand il y a des nouveaux modèles qui sortent. Et heureusement qu'il y a de la concurrence. On peut dire merci à la concurrence. J'avais déjà dit merci à Deep Sick dans un autre épisode, parce que quand ils avaient sorti leurs modèles, tous les modèles d'OpenAI, par exemple, avaient baissé leur prix. Donc on peut remercier la concurrence. Heureusement qu'il n'y a pas qu'un acteur, par exemple OpenAI dans la course ou Google. Un acteur fermé en plus, ça serait vraiment terrible. Heureusement qu'il y a des modèles open source qui permettent vraiment de faire baisser les prix. Donc on vit dans un monde où on a beaucoup de chance d'avoir de la concurrence. Au final, dans certains sujets, on peut s'en rendre compte comme là. En tout cas, ça favorise le consommateur comme moi. qui intègre les modèles d'IA dans mes applications. Donc voilà pour cette partie un peu, j'ai parlé un peu d'évaluation, j'ai parlé un peu de pricing, c'est des sujets qui sont hyper intéressants. L'évaluation, c'est vraiment le nerf de la guerre dans l'IA. Si vous n'évaluez pas les réponses de vos modèles, alors vous vous exposez à avoir des hallucinations, des choses qui sont vraiment n'importe quoi. Il faut toujours évaluer quand vous intégrer des modèles d'IA générative, créer un système d'évaluation. Et pour ça, il faut que quelqu'un, possiblement un être humain, oui en fait quasiment tout le temps un être humain, puisse analyser les résultats. Ça peut être fait de façon empirique en testant et en itérant. Je pense notamment en faisant du prompt engineering.
Quand vous faites des bons prompts, en fait c'est tellement difficile d'anticiper la réponse à un prompt, c'est impossible. Vous savez, les neurones, c'est un peu une boîte noire. C'est ce qu'avait dit... Enfin, c'est pas ce qu'avait dit, c'est... Dario Amodei, le patron d'Anthropiq, avait dit que c'était un problème de ne pas comprendre les décisions d'un neurone dans un réseau de neurones d'intelligence artificielle. Parce que si l'être humain, on ne peut pas comprendre la décision, alors on peut s'exposer à une imprédictabilité des résultats et donc... Ça peut éventuellement poser problème plus tard. Et si il y a un jour à une conscience, on ne sait pas vraiment pourquoi, on ne sait pas vraiment comment, ça peut être dangereux. Il avait écrit un article de blog à ce sujet. D'ailleurs, il faut que je le lise. Je vous le recommande. Je sais qu'il a un site web perso, Dario Amodei, et il écrit des articles de blog. Donc si vous êtes pointu dans les domaines, allez lire ces articles de blog en anglais. Mais du coup, Oui, il faut toujours évaluer. Quand vous faites du prompt engineering, souvent c'est de manière empirique où vous allez vous -même tester, tester, tester encore, changer un mot dans le prompt, etc. Et bien sûr appliquer les meilleures méthodes de prompting au début. Vous pouvez aussi avoir une IA qui évalue les tests. Donc vous avez des datasets en entrée, donc plein de de donner, donc c'est ce qui se passe pour entraîner les large -language modèles comme Mistral, CHAT -JPT, etc. Vous en avez sur Hug -Infaits à disposition par exemple, des datasets où vous avez des questions, des réponses et donc vous allez tester votre LLM et s'il donne la bonne réponse, vous lui donnez un point et puis vous comptez les points à la fin et vous dites ok le mien il a eu 80 % de bons résultats avec tel dataset d'évaluation. Donc il se positionne numéro 3 dans le classement des meilleurs LLM. Donc l'évaluation vraiment très important. Souvent des humains sont impliqués dans l'évaluation.
Je vous ai parlé un peu de l'évaluation dans My Trainer IA. J'ai survolé tout ça encore une fois. Peut -être que je rentrerai plus dans le détail dans un épisode que je préparerai à l'avance. Là, j'ai gardé la même tonalité que d'habitude, je pense que vous l'avez remarqué, j'improvise totalement. C'est vraiment un format que je veux garder, que je veux garder l'authenticité et la proximité qu'on a entre nous. Si vous avez des questions sur ce podcast, n'hésitez pas à m'écrire, m'envoyer un mail. Je sais que là, par exemple, je travaille sur My Trainer IA, je travaille également sur un autre projet. Je vais commencer un autre projet où je vais être... je donne déjà des conseils sur l'IA Générative, sur des personnes qui veulent lancer leur application. Donc n'hésitez pas à me contacter si vous voulez qu'on en discute. Et je vous laisse là -dessus. Je vous souhaite une excellente journée et je vous dis à bientôt pour un nouvel épisode. C'était Guillaume dans Génération IA. Ciao !