OpenAI GPT-5 publié : les capacités du modèle « dominent » complètement, la première étape vers la construction d'une « super intelligence »

2025-08-08 12:47:55

Auteur : Zhang Yongyi

Après de nombreuses fois de "retards", GPT-5 est enfin arrivé.

Le 8 août à 1 heure du matin, heure de Pékin, la conférence de lancement d'été d'OpenAI a débuté avec l'allure d'un nouveau "galas technologiques".

Contrairement à la conférence de lancement rapide précédente d'OpenAI, cette fois, OpenAI a préparé un livestream de plus d'une heure avec plusieurs équipes qui se relaient sur scène, chacun prenant la parole après l'autre, montrant les performances impressionnantes de GPT-5 sous différents angles.

D'abord, parlons des points essentiels : GPT-5 a connu une amélioration globale de ses performances dans plusieurs domaines, se classant premier dans les domaines du texte, du développement Web et de la perception visuelle ; il se classe également premier dans les domaines des invites strictes, du codage, des mathématiques, de la créativité et des requêtes longues. Sous le test codé « Sommet », il maintient actuellement le plus haut score Arena enregistré jusqu'à présent, ce qui en fait littéralement un « roi des classements ».

Sam Altman a déclaré que GPT-4o est comme un collégien, tandis que GPT-5 est comme un étudiant universitaire, allant même jusqu'à comparer GPT-5 au premier iPhone équipé d'un écran rétinien - « si vous lui posez une question, vous obtiendrez peut-être la bonne réponse, ou peut-être quelque chose de fou. GPT-4 a plutôt l'impression de dialoguer avec un étudiant universitaire. Et GPT-5, c'est la première fois que je ressens vraiment que je parle à un expert de niveau doctorat. » Sam Altman a ainsi présenté l'amélioration des capacités de GPT-5.

Bien que le nombre d'utilisateurs actifs hebdomadaires de ChatGPT approche les 700 millions, OpenAI n'a en réalité pas disposé ces derniers temps d'un modèle de pointe leader dans l'industrie. Maintenant, OpenAI croit que GPT-5 va lui permettre de retrouver fermement la première place du classement.

Altman a même affirmé lors de la conférence de presse : « C'est le modèle avec les capacités de codage les plus fortes au monde, c'est le modèle avec les capacités d'écriture les plus fortes au monde, et c'est le modèle avec les capacités les plus fortes dans le domaine des soins de santé au monde ».

Lors de la conférence de presse, OpenAI a également déclaré qu'en plus de ses capacités de codage exceptionnelles, la maîtrise de l'écriture de GPT-5 et la précision de ses réponses aux questions de santé ont également atteint un nouveau niveau. De plus, GPT-5 a non seulement réalisé un "bond colossal" en intelligence, mais a également considérablement réduit le problème des hallucinations de "dire des absurdités sérieusement". Il excelle dans la compréhension et le respect des instructions, et sa tendance à flatter a également été considérablement réduite.

01 Dire adieu aux « illusions », l'IA est devenue plus fiable.

Tout d'abord, voici la gamme de modèles de cette mise à jour, la série GPT-5 comprend quatre versions : GPT-5, mini, nano et chat, où la version Chat correspond à une expérience de réponse plus naturelle et plus intelligente - vous pouvez même l'utiliser pour apprendre une nouvelle langue.

De plus, maintenant que vous ouvrez la page de ChatGPT, vous remarquerez d'abord que GPT-5 est présenté comme un modèle unique, et non comme un modèle standard accompagné d'un modèle d'inférence indépendant.

Il s'agit en réalité d'un système de routage (router) développé par OpenAI, qui bascule automatiquement vers une version avec des capacités de raisonnement plus puissantes pour des requêtes plus complexes, ou le fait également lorsque vous lui demandez de réfléchir sérieusement. (Altman a qualifié l'interface de sélection des modèles précédente de « véritable désordre chaotique ».)

Le « délit d'illusion » de l'IA a toujours été un point de critique majeur. La bonne nouvelle est que GPT-5 a beaucoup travaillé sur ce point, et l'équipe officielle affirme que la probabilité de produire des illusions a été « considérablement réduite ». Plus précisément :

Lors de la recherche en ligne, la probabilité que les réponses de GPT-5 contiennent des erreurs factuelles est inférieure de 45 % à celle de GPT-4o.

Lorsqu'il s'agit de penser de manière indépendante, la probabilité de donner une mauvaise réponse est 80 % inférieure à celle d'OpenAI o3.

GPT-5 a également été testé sur le nouveau ARC-AGI-2. En dehors de Grok 4 (pensée), il surpasse tous les principaux modèles.

De plus, GPT-5 est devenu un "honnête homme". Il ne mentira plus aux utilisateurs et ne se vantera plus de pouvoir accomplir des tâches impossibles. Lorsqu'il est confronté à des tâches impossibles, des instructions floues ou un manque d'outils essentiels, il communiquera plus honnêtement sur ses limites.

Le point le plus intéressant de cette mise à jour est sans doute l'introduction de quatre nouveaux modes de « personnalité » que les utilisateurs peuvent choisir librement. Ils sont :

Cynique (Cynique)

Robot (Robot)

Écouteur (Listener)

étudiant brillant (Nerd)

Ces modes sont facultatifs, vous pouvez choisir la manière dont ChatGPT interagit et répond à vos questions selon vos préférences. Voulez-vous qu'il débatte avec vous ou qu'il écoute comme un ami patient ? C'est maintenant à vous de décider.

« Ce modèle donne vraiment une bonne 'impression', » a déclaré Nick Turley, responsable de ChatGPT, « je pense que les gens vont vraiment le ressentir, en particulier les utilisateurs ordinaires qui n'étudient pas souvent les modèles. »

De plus, vous pouvez également changer le thème de couleur pour chaque fenêtre de chat, ce qui ravit les amateurs de thèmes d'éditeurs de code.

02 L'ère de "génération de logiciels à la demande" est-elle arrivée ? Des capacités de codage incroyables.

Avec l'amélioration des capacités de codage, Altman prédit que la puissante capacité de codage de GPT-5 ouvrira une ère qu'il appelle « génération de logiciels à la demande ».

Lors des tests d'OpenAI, GPT-5 a surpassé tous les autres modèles dans plusieurs tests de référence de codage, tels que SWE-Bench, SWE-Lancer et Aider Polyglot. Il a obtenu un score de 42 % dans le test final humain et de 75 % dans le test de référence SWE.

Un petit incident est que les axes de cette image lors de la conférence de presse présentent manifestement de nombreux points de critique, il y a non seulement des erreurs absurdes comme 52.8 > 69.1, mais cela exagère également l'amélioration des capacités de GPT-5, ce qui a conduit les internautes sur les réseaux sociaux à se moquer en disant « J'espère que ta PPT n'a pas été faite par GPT-5 ».

Lors de la conférence de presse, Yann Dubois, responsable de la formation avancée d'OpenAI, a réalisé une démonstration en direct de GPT-5, lui demandant de générer un site Web pour apprendre le français, accompagné d'un jeu interactif. En quelques secondes seulement, GPT-5 a écrit des centaines de lignes de code et a directement présenté l'interface frontale du site Web. Il a partagé son écran sur Zoom et a effectué quelques clics simples, tout semblait fonctionner parfaitement.

Lors de la conférence de presse, OpenAI a également présenté directement un jeu 3D créé uniquement à partir d'un seul prompt par GPT-5. La scène 3D créée est non seulement visuellement raffinée, mais les effets physiques reproduisent également très fidèlement les effets correspondants.

03 Plus sûr, plus « honnête »

Selon Alex Beutel, responsable de la recherche sur la sécurité des modèles, OpenAI a effectué plus de "cinq mille heures" de tests sur GPT-5 afin d'évaluer ses risques de sécurité. L'un des points clés était "de s'assurer que le modèle ne ment pas aux utilisateurs."

Bien que les hallucinations de GPT-5 soient moins fréquentes que celles du modèle de raisonnement o3 d'OpenAI, le fait de "mentir avec confiance" reste un problème inhérent aux grands modèles de langage. Lorsque le modèle commence à accomplir des tâches comme un agent, ce problème devient encore plus complexe. Cependant, OpenAI a déclaré que GPT-5 performait mieux dans le traitement fiable des tâches en plusieurs étapes. "Par le passé, nous avons vu des modèles prétendre avoir accompli une tâche alors qu'en réalité ils ne l'avaient pas fait," a déclaré Beutel, "c'est un problème."

Concernant les invites auxquelles il refusait auparavant de répondre, GPT-5 proposera ce qu'OpenAI appelle le mécanisme de « complétions sécurisées » (safe completions). Beutel explique : « Par exemple, si quelqu'un demande 'Combien d'énergie est nécessaire pour allumer un certain matériau ?', cela peut être une question malveillante tentant de contourner les protections de sécurité et de causer des dommages, ou cela peut être un étudiant cherchant à comprendre les propriétés physiques du matériau. Cela pose un véritable défi à la manière dont le modèle doit répondre. »

Grâce à la « complétion sécurisée », GPT-5 « essaie de fournir des réponses aussi utiles que possible tout en respectant des contraintes de sécurité ». Le modèle obéit généralement seulement en partie et fournit des informations plus macro qui ne peuvent pas réellement être utilisées pour causer des dommages.

04 Comment utiliser GPT-5

Alors, la question que tout le monde se pose est : comment peut-on utiliser GPT-5 ?

La bonne nouvelle est que tous les utilisateurs de ChatGPT peuvent maintenant essayer gratuitement GPT-5. C'est également la première fois qu'OpenAI ouvre gratuitement son modèle de pointe à tous les utilisateurs. Bien sûr, les niveaux d'autorisation des utilisateurs varient.

Les utilisateurs abonnés à Plus peuvent avoir plus de fois d'utilisation avant d'atteindre la limite d'utilisation.

Les utilisateurs abonnés Pro peuvent accéder à la version GPT-5 Pro, qui possède des capacités de raisonnement plus puissantes.

Lorsque l'utilisateur atteint la limite d'utilisation, ChatGPT passera automatiquement à une version « mini » de GPT-5 pour traiter les demandes suivantes. En même temps, avec le lancement de GPT-5, il remplacera officiellement une série de modèles anciens tels que GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 et GPT-4.5.

De plus, pour la tarification des Token, la version standard GPT-5 coûte 1,25 dollar par million de Token d'entrée et 10 dollars par million de Token de sortie. Les versions mini et nano sont beaucoup moins chères.

Les détails des prix peuvent être consultés dans l'image ci-dessous, extraite des informations du site officiel.

De plus, OpenAI a lancé un nouveau paramètre appelé « Minimal » dans l'API, ce qui vous permet d'utiliser GPT-5 dans tous les cas d'utilisation, il vous suffit de modifier l'intensité du raisonnement.

En plus de la plateforme de première partie d'OpenAI, le PDG de Microsoft, Satya Nadella, a également annoncé que GPT-5 est désormais disponible sur l'ensemble des plateformes de Microsoft, y compris Microsoft 365 Copilot, Copilot, GitHub Copilot et Azure AI Foundry. De plus, toutes ces améliorations ont été entraînées sur Azure.

Enfin, Altman a déclaré que la mission d'OpenAI est de développer une intelligence artificielle générale (IAG). GPT-5 les rapproche de cet objectif, bien que l'ensemble du secteur ait commencé à se tourner vers la construction de ce que l'on appelle une « super intelligence ».

« Je déteste un peu le terme AGI, car actuellement, tout le monde a une définition légèrement différente, » a déclaré Altman, « mais c'est une étape importante vers la création de modèles vraiment puissants. Il est évident qu'un modèle doté d'une intelligence générale est nécessaire pour y parvenir. »

Cependant, il admet également que par rapport à une véritable AGI, GPT-5 « manque de certaines choses très importantes ».

« Ce n'est pas un modèle, c'est un phénomène natif qui émerge des nouvelles choses qu'il découvre, et pour moi, c'est précisément pour cette raison qu'il peut devenir la « graine » de l'AGI. » a déclaré Sam Altman.

GPT8.25%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Reposter
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
#Gate & WLFI USD1 Points Program
53k Popularité
#Trump Allows 401(k) Crypto Investing
29k Popularité
#Join Copy Trading Share to Win $2,000
23k Popularité
#Show My Alpha Points
75k Popularité
#SOL Futures Reach New High
22k Popularité

Épingler