Récemment, un screenshot circulant sur Reddit a alimenté des rumeurs concernant une prétendue version de GPT4.5. Cette version serait un modèle multimodal capable d'analyser non seulement du texte, mais également des vidéos, des images, de l'audio, et même des objets 3D. Bien que des développements antérieurs d'OpenAI, tels que GPT-Vision, Whisper, et Shap-e, indiquent une maîtrise croissante de diverses modalités, l'intégration de toutes ces capacités dans un seul modèle représenterait un changement de stratégie significatif.
GPT4.5 : L’essentiel
- Screenshot montrant la page pricing, provenant de reddit
- Modèle multimodal
- Analyse : Texte, video, image, audio, et 3D
- Video → Gemini Ultra a proposé une approche, donc pas impossible
- Image → On a vision
- OpenAI maitrise déjà la génération d’objets 3D : https://github.com/openai/shap-e
- Modèle capable de générer un audio / voix
- Meta a push Audiobox, qui permet de générer des audios, donc possible également
- Mes doutes : OpenAI jusqu’à maintenant segmente ces nouveautés : GPT-Vision, GPT4, GPT4-Turbo, TTS, Whisper, Shap-e
- On aurait modèle qui regroupe toutes ces capacités, changement de stratégie assez profond
- Aucune mention de beta ou de preview
- Et OpenAI à ré-ouvert en début de semaine les inscriptions à ChatGPT Plus suite à l’acquisition de GPU, mais viendrait se remettre en danger avec un modèle très gourmand en ressources (Video, 3D)
- openai.com/pricing/edit?draft=true
- L’URL indiquerait un mode brouillon sur landing et on à également un token unique, donc : On aurait quelqu’un d’assez haut placé pour avoir accès à un mode brouillon de la landing d’OpenAI et il aurait laissé son token ? Bien trop étrange pour moi
- Toujours aussi simple de réaliser un fake comme ça via inspecter l’élement
- Altman a confirmé que le leak était fake, mais impossible pour lui de dire oui : https://twitter.com/sama/status/1735422206296088950
- Mais d’après les comptes spécialisés que je track :
- GPT4.5 était prévu pour le début d’année, mais Gemini Pro & Gemini Ultra ont changés le calendrier : OpenAI souhaite récupérer sa place de Leader, et OpenAI souhaite marquer les esprits avant la fin de l’année
- On devrait avoir une annonce cette semaine
- OpenAI laisserait GPT4 se dégrader volontairement pour créer une hype autour de GPT4.5 (…)
- ChatGPT : Archived Chats, Connected Apps, Team Plan, Debug & Latency Tools