Google a lancé Gemini 2.5 Pro et Flash en disponibilité générale et a présenté Gemini 2.5 Flash-Lite en version préliminaire, le membre le plus rapide et le plus rentable de la famille 2.5 à ce jour.
đŁïž Ce que dit l'entreprise
Le message de Google est axé sur la performance sans compromis : ils veulent que les développeurs choisissent le bon cerveau pour le travail sans payer de supplément pour des fonctionnalités dont ils n'ont pas besoin.
« Nous avons conçu Gemini 2.5 comme une famille de modÚles de raisonnement hybrides offrant des performances exceptionnelles, tout en étant à la frontiÚre de Pareto en termes de coût et de vitesse. »
â Tulsee Doshi, directeur principal de la gestion des produits chez Google
Ils affirment également que ce nouveau Flash-Lite est le modÚle le plus rentable et le plus rapide qu'ils aient jamais commercialisé.
Traduction ? Il est conçu pour aller vite, ĂȘtre Ă©conomique et toujours performant avec les outils.
đ§© Ce que cela signifie (en termes humains)
Vous avez désormais le choix entre trois versions différentes de Gemini 2.5 :
Pro â RĂ©flĂ©chit profondĂ©ment, Ă©crit du code, comprend les nuances. Premium.
Flash â Plus rapide et moins cher, mais toujours solide pour les tĂąches gĂ©nĂ©rales.
FlashâLite â Ultra rapide et ultra Ă©conomique. Ne rĂ©flĂ©chit pas, sauf si vous le lui demandez. IdĂ©al pour les tĂąches volumineuses comme le rĂ©sumĂ©, la traduction ou l'Ă©tiquetage.
Et oui, 1 million de jetons de mémoire pour tout le systÚme. Cela signifie que vous pouvez charger des documents, des conversations ou des données volumineux sans les fragmenter.
Si vous ĂȘtes dĂ©veloppeur, il ne sâagit pas seulement de performances : il sâagit dâavoir le bon outil pour le travail et le budget.
đ Relier les points : se concentrer sur le « bon marché »
Le message de cette version est clair : coût et productivité. Décryptons-le.
đ§ Le prix des jetons est considĂ©rablement plus bas
Les modĂšles d'IA facturent gĂ©nĂ©ralement en fonction des jetons, c'est-Ă -dire des fragments de mots lus (entrĂ©es) et gĂ©nĂ©rĂ©s (sorties) par le modĂšle. Voici comment FlashâLite se compare :
ModÚle | Prix d'entrée pour 1 million de jetons | Prix de sortie pour 1 million de jetons |
FlashâLite | 0,10 $ | 0,40 $ |
Ăclair | 0,30 $ | 2,50 $ |
Pro | Non répertorié, mais plus haut | Probablement similaire à 1.5 Pro |
C'est plus de 6 fois moins cher en termes de sortie que Flash, et jusqu'Ă 25 fois moins cher que des modĂšles comme GPT-4-turbo.
đ ïž Cela Ă©vite les rĂ©flexions coĂ»teuses
FlashâLite n'utilise pas de raisonnement avancĂ© par dĂ©faut : il ignore la chaĂźne de pensĂ©e et la logique en plusieurs Ă©tapes.
Pourquoi est-ce important ?
Raisonnement profond = plus de calcul = coût plus élevé.
FlashâLite dĂ©sactive la fonction de « rĂ©flexion » sauf si vous le souhaitez explicitement. Cela signifie des coĂ»ts rĂ©duits et des rĂ©ponses plus rapides.
đ§Ș Il est optimisĂ© pour l'efficacitĂ©, pas pour les benchmarks
Au lieu de courir aprĂšs les classements ou d'essayer de battre GPTâ4, FlashâLite est optimisĂ© pour :
Temps de réponse rapides
Faibles besoins de calcul
Charges de travail massives (étiquetage de millions de documents, résumé de pages, traductions en masse)
Il est parfait pour les entreprises qui gĂšrent d'Ă©normes opĂ©rations oĂč le coĂ»t par demande est vraiment important.
đ Boucler la boucle â tout semble meilleur avec une comparaison cĂŽte Ă cĂŽte
Comparons-le Ă ce qui existe dĂ©jĂ â
afin que nous puissions voir ce que Gemini prétend faire mieux que les autres.
ModÚle | Limite de jetons | Prix d'entrée moyen (pour 1 M) | Prix de sortie moyen (pour 1 M) | Vitesse (jetons/sec) |
Gemini 2.5 Pro | 1 million | 1,25 $ | 10,00 $ | ~400â500 t/s |
Gemini 2.5 Flash | 1 million | 0,30 $ | 2,50 $ | ~500â700 t/s |
Gemini 2.5 FlashâLite | 1 million | 0,10 $ | 0,40 $ | ~500â700 t/s |
ChatGPT (GPTâ4o) | 128Â 000 | ~3,00 $ | ~6,00 $ | ~400â600 t/s |
PerplexitĂ© (Sonar Pro) | ~4K (recherche) | ~1,00 $ | ~3,00$â15,00$ | varie (basĂ© sur la recherche) |
đ§ En rĂ©sumĂ©
Mise à jour | Disponibilité | Tarification (entrée/sortie) |
Gemini 2.5 Pro | GA â prĂȘt Ă produire | Payant (niveau supĂ©rieur) |
Gemini 2.5 Flash | GA â prĂȘt Ă produire | 0,30 $ / 1 M d'entrĂ©es · 2,50 $ / 1 M de sorties |
Gemini 2.5 FlashâLite | Aperçu (AI Studio, Vertex AI) | 0,10 $ / 1 M d'entrĂ©es · 0,40 $ / 1 M de sorties |
Prix : FlashâLite < Flash < Pro
AccÚs : Flash et Pro : GA dans AI Studio, Vertex AI, application Gemini, recherche
FlashâLite : aperçu dans AI Studio + Vertex AIPlus d'infos : Lire l'article de blog de Google
đ§ ArrĂȘtez le culte de lâIA â en acquĂ©rant une nouvelle perspective
Point de vue de l'équipe Frozen Light
Ce déploiement représente un changement clair dans la stratégie Gemini de Google, non seulement en termes de produit, mais aussi d'intention.
Nous savons que ChatGPT gÚre entre 100 millions et plus de 1,2 milliard de messages d'utilisateurs par jour (selon les estimations). Gémeaux ?
Aucun chiffre d'utilisation confirmé de l'API. Mais les signes sont là  :
Niveaux gratuits limités
Utilisation quotidienne plafonnée
Des forums remplis de plaintes concernant les quotas
Cela nous indique que Gemini n'a pas encore atteint les niveaux d'adoption souhaités.
Google fait donc son argumentaire.
Ils ont déployé des modÚles conçus pour une utilisation de masse : bon marché, évolutifs et rapides.
Flash et Flash-Lite ne sont pas lĂ pour se mettre en valeur.
Il sâagit dâinciter les dĂ©veloppeurs Ă rĂ©ellement crĂ©er avec Gemini.
Et voici ce qui est intelligent :
Ils ne vous donnent pas seulement un modÚle bon marché, ils vous donnent leur jugement.
Ils disent :
« Nous dĂ©ciderons quand une rĂ©flexion approfondie en vaut la peine â et quand elle nâen vaut pas la peine. »
Vous nâavez pas Ă vous soucier du modĂšle Ă appeler ou du moment oĂč payer plus.
Ils le régleront en coulisses.
Il ne sâagit pas seulement dâune stratĂ©gie API, mais dâune stratĂ©gie systĂšme.
Celui qui dit :
« Faites confiance à notre expérience. Utilisez notre infrastructure. Nous optimiserons vos coûts et vos performances. »
C'est un message fort adressé aux développeurs :
Vous nâavez pas besoin de tout savoir.
Il vous suffit de choisir Gemini et de laisser Google sâoccuper du reste.
C'est efficace, affirmé et intelligent, s'ils y parviennent.
N'oubliez pas les rĂšgles d'or de la technologie :
Restez simple
Gardez-le stable
Maintenez les mises Ă jour fluides
Faites-le, et peut-ĂȘtre â peut-ĂȘtre seulement â Gemini deviendra-t-il plus qu'une marque. Il deviendra le cerveau derriĂšre les applications auxquelles nous faisons confiance.