• Outils
  • Actualités IA
  • Guides
  • GPTs
ai side logoai side logo
  • Outils
  • Actualités IA
  • Guides
  • GPTs
  1. Accueil
  2. /
  3. PROJET OpenAI Q* : Mensonge de Sam Altman, IA Secrète et AGI

PROJET OpenAI Q* : Mensonge de Sam Altman, IA Secrète et AGI

Emile Dev

Rédigé par Emile Dev

29 novembre 2023
Sommaire
  • Temporisation : un appel à la prudence
  • Conclusion

Contrairement à GPT-4, qui se limite à prédire le mot suivant dans une séquence, Q* introduit un principe d'apprentissage par renforcement, axé sur le processus en amont de la génération. Le concept clé est le "Tree of Thought" (Arbre de pensée), où Q* analyse un problème avec GPT-4, explore diverses possibilités, et les valide en continuant jusqu'à trouver la solution optimale.

projet q star open ai sam altman review et analyse

Cette approche ressemble à celle d'AutoGPT ou d'AgentGPT, mais va plus loin en enregistrant chaque succès pour améliorer ses performances futures.

Q* met en œuvre un système de récompense pour encourager la prise de risque, similaire à celui utilisé par des ingénieurs de Google pour développer des IA capables d'inventer des stratégies inédites dans des jeux comme le Go. De plus, Q* dispose d'un système d'état permettant de remonter à la dernière réussite en cas d'échec, renforçant ainsi son processus d'apprentissage.

Temporisation : un appel à la prudence

Yann Le Cun, figure éminente dans le domaine de l'IA, invite à la prudence face à ces avancées. La technologie sous-jacente à Q* n'est pas entièrement nouvelle, et le coût de fonctionnement de telles IA pourrait être prohibitif en raison du nombre important d'appels nécessaires à leur fonctionnement. Les travaux d'OpenAI, comme le document de recherche de 2020 et l'amélioration du raisonnement mathématique en 2023, montrent cependant que l'entreprise continue d'innover dans le domaine.

Conclusion

Q* représente une avancée notable dans le développement de l'IA, offrant des capacités de raisonnement et d'apprentissage améliorées. Toutefois, ce n'est pas une super-IA autonome comme certains le craignent. Il demeure un outil supervisé, limité par les capacités de son moteur, en l'occurrence GPT-4. Alors que la course vers une intelligence artificielle générale (AGI) se poursuit, il est essentiel de rester vigilant quant aux implications et aux limites de ces technologies.

  • Un jour avant de se faire virer : S'agit-il d'un outil que nous avons construit ou d'une créature que nous avons construite ?
    • https://twitter.com/blader/status/1727497356017569802
    • Sam adore faire peur & se faire peur (depuis 3 ans au moins maintenant)

Q*, que ce c’est & comment ça marche ?

  • Q* signerait l’arrivée du principe d’Apprentissage par renforcement, en se concentrant d’avantage sur le process qui se passe en amont de la génération
  • GPT4 se limite à “deviner” le prochain mot, si on lui pose donc un problème trop complexe, c’est impossible pour lui de prendre assez d’hauteur pour trouver la solution au problème
  • Q* propose une solution à ce problème, en introduisant le système de ToT, Tree of throught = Arbre de pensée
    • Ce que va faire très basiquement ce concept : Q* prend votre problème → L’analyse avec GPT4 → Explore 3 possibilités, puis valide avec GPT4 les 3 résultats, puis continue jusqu’à trouver LE résultat
    • Schema qui montre très bien le process
      • GPT4 créer → Q* joue le rôle de “cerveau” → Et un GPT en sortie vérifie
    • C’est un peu la même idée d’AutoGPT / AgentGPT, mais ça va bien + loins
    • GPT qui utilise l’approche XoT : https://chat.openai.com/share/4aceadd2-9f0b-4365-9175-edb7dec0d698
  • Si on s’arrête la, ce système est développable en quelques jours, mais Q* va + loins, en proposant qu’a chaque réussite, qu’a chaque validation, il enregistre ce chemin, pour s’auto améliorer
    • Et c’est à partir de ce moment la qu’on rentre dans l’inconnu : Q* serait en mesure de créer des chemins de raisonnements absolument inconnu pour nous
  • Q* implémente un système de récompense, qui permet de forcer le modèle à prendre des risques, c’est d’ailleurs via ce système que des ingé de chez Google ont réussie à créer une IA qui invente des stratégies aux jeux de go, qu’aucun humain n’a inventé
    • Je vous recommande d’ailleurs de regarder des documentaires sur le sujet, c’est très interessant
  • Q* implémenterait aussi un système de state, qui permettrait en cas d’échec (au 5 ème niveau du tree par ex) de remonter à la dernière réussite
  • Conclusion : Q* est un modèle de supervision, il n’a pas pour but de générer quoi que ce soit, c’est un chef d’orchestre limiter par son moteur (GPT4 en l’occurence)

Temporisation

  • Yann Le Cun nous invite à temporiser
    • https://twitter.com/ylecun/status/1728126868342145481

      tweet de yann le cun au sujet de q star

  • Ce type d’IA existe depuis des années

  • Et le prix pour faire tourner cette IA sera.. très très élevé (les appels sont nombreux)

  • Ce ne sont encore une fois que des rumeurs

  • Et pour revenir à la déclaration de Sam : Il adore jouer se role de “j’ai très peur.. mais en même temps je suis celui qui build”

  • 2020 → OpenAI travaille sur le projet : https://arxiv.org/pdf/2009.03393.pdf

    • Mai 2023 → https://openai.com/research/improving-mathematical-reasoning-with-process-supervision

Notes

  • La course à l’AGI continue donc, et OpenAI semble être en bonne position pour remporter cette course
  • Selon Reuters, le licenciement de Sam Altman par OpenAI serait dû au développement d’un nouveau modèle de langage nommé Q*, capable d’une logique proche de celle d’un être humain. Une théorie poussée par Elon Musk et son entourage, qui tentent de nuire à OpenAI… Mais « Q Star » ne serait pas la super-IA démoniaque dont certains parlent. (Numerama)
  • L’Algo Q* est une réf à l’algo bien connu : A* est un algorithme de recherche de chemin (exactement comme Q*, au final)
    • Schema de la video de DR Futuro : https://www.youtube.com/watch?v=eD-sptj9O6o
  • Grok propose déjà une approche similaire, mais 100% humaine via leur dashboard
  • Pertinence inégalée & comme pour le jeu de go, on aurait des raisonnements jamais imaginé par un humain, des idées neuves
  • Un pas de + vers une AGI ? Oui & non
    • Non → Si le modèle demande 10 à 100x + de ressources pour être entrainé que GPT4, personne n’investira avant plusieurs années
    • Oui → Si on résout (ou que l’IA résout) le problème du coût via de l’opti, et qu’on branche un GPT5, on sera à la frontière

Sources + détaillées

  • OpenAI, Improving mathematical reasoning with process supervision : https://openai.com/research/improving-mathematical-reasoning-with-process-supervision
  • Explication du process mathématique en détails : https://youtu.be/i7q8bISGwMQ?si=N6SxA2mSL5YWXWjB
  • Excellente explication : https://www.youtube.com/watch?v=s1M8scmaWxc
  • Same : https://youtu.be/yXMW9FKZ6-0
  • https://www.numerama.com/tech/1572303-les-rumeurs-sur-la-super-ia-dopenai-q-seraient-un-deluge-dabsurdites.html
  • https://www.reuters.com/technology/sam-altmans-ouster-openai-was-precipitated-by-letter-board-about-ai-breakthrough-2023-11-22/
  • https://www.therundown.ai/p/openai-secret-discovery
  • https://www.youtube.com/watch?v=ARf0WyFau0A
  • Explication du concept ++ : https://www.youtube.com/watch?v=nOBm4aYEYR4
DeepMind, l’IA de Google, découvre des milliers de nouveaux matériaux
IA
March 26, 2020

DeepMind, l’IA de Google, découvre des milliers de nouveaux matériaux

Nouveau : Runway IA Motion Brush - Révolution dans l’ImageToVideo
IA
March 26, 2020

Nouveau : Runway IA Motion Brush - Révolution dans l’ImageToVideo

ai side logo

AI Side

  • À propos d'AI Side
  • Contactez-nous

Derniers GPTs ajoutés

Math Mentor

Cookie Clicker

CISO AI

Free YouTube Summarizer

WordPress Wizard

Derniers outils IA ajoutés

Kling AI

Dream Machine Luma AI

AnyCall AI

Lucide AI

Freepik Pikaso AI

© Copyright 2023, AI Side

  • Plan du site
  • A propos de nous
  • Mentions légales