JT G.’s Post

Au cœur des LLM, sans faire de maths ! 👍 Curieux de mieux comprendre les coulisses d’un ChatGPT, Gemini, Mistral AI ou autres IA génératives textuelles ? Je vous partage ici un document qui vous emmènera au cœur des LLM (Large Language Models) et vous permettra d’en cerner la conception et le fonctionnement. Fruit de plusieurs mois de travail, ce livrable s’est construit au fil de mes explorations et tâtonnements, et vise à vulgariser les mécanismes cachés derrière les tokens, les embeddings et les transformers. Alors que les IA génératives ne cessent de prendre une place toujours plus importante dans notre quotidien, j'espère que mon document aidera un grand nombre de personnes à mieux comprendre les fondamentaux de cette « boite noire ». Je remercie les nombreux relecteurs qui m'ont aidé à me poser les bonnes questions, et à présenter les concepts parfois ardus de façon éclairée. Vous êtes libre de traduire ce document dans une autre langue, et d'y apporter toutes les corrections qui vous semblent nécessaires (CC BY-SA 4.0). Merci en retour de partager gratuitement vos contributions et de poster vos nouvelles versions ou améliorations de texte en commentaires. Bonne lecture à tous ! Ce document est publié sous la licence Creative Commons Attribution - Partage dans les mêmes conditions (CC BY-SA 4.0). Cela signifie que vous êtes libre de : • Partager : copier et redistribuer le document sous n'importe quel format. • Adapter : remixer, transformer et créer à partir du document, y compris à des fins commerciales. À condition de citer l'auteur (JT Graveaud - https://lnkd.in/dikk_Jrf) et de partager les modifications sous les mêmes conditions (CC BY-SA). Pour plus de détails :

Merci pour ta synthèse / vulgarisation Jean-Thierry Graveaud ! Grâce à ton travail, on peut rentrer assez sérieusement dans le sujet des LLM en un temps raisonnable !

Raphaël Kenigsberg

National Cyber Security Coordinator for the Financial Sector @ ANSSI

6d

Super travail Jean-Thierry ! Bravo !

Philippe Bron

Chargé de mission politique industrielle Cloud & Infogérance chez ANSSI - Agence nationale de la sécurité des systèmes d'information

6d

Bravo pour ce gros travail de vulgarisation loin d'être évident surtout dans un domaine aussi complexe que l'IA ! Merci pour ce partage.

Rodolphe de Beaufort

GIMELEC | Deputy Chief Executive | Energies | Industrial Cybersecurity

6d

Merci (et bravo) pour ce travail de pédagogie très utile. A votre disposition pour creuser avec notre réseau les limites des modèles dans des usages de prises de décision automatisés applicables en temps réel à des infrastructures critiques : l'auditabilité de la décision est elle suffisante ? La décision est elle objectivable à 100% ? En d'autres mots AI et automatismes font ils bon ménage ?

Noe R

🎓 Future Graduate Engineer in HPC & Big Data | 🤖 AI Enthusiast | 💼 Seeking Full-Time Position in AI Starting September 2025

2d

Malheureusement un vrai compréhension profonde du fonctionnement d'un LLM demande des connaissance mathématiques très solide :/

Like
Reply
Boubacar D.

Competitive Intelligence Specialist | Data-Driven- Transformation | Generative AI | Prompt Engineering | ChatGPT | Copilot | PerspexityAI | NotebookLM | Gamma.app | Automatisation | Power Automate | PowerPlatform |

3d

Très intéressant et bien expliqué. Merci du partage. J'avais tenté de faire un mini schéma du fonctionnement des modèles LLM derrière GPT, à travers plusieurs étapes. À l'époque j'avais lu une documentaire de Google et des travaux del' inria sur le sujet, j'ai donc tenté de schématiser de manière simple le fonctionnement des modèles

  • No alternative text description for this image
Like
Reply
Patrice Gleizes

Ingénieur IT & Conseil (fiscalité, comptabilité, logiciels, IT security, GDPR)

4d

Depuis quelques mois, on voit fleurir de nombreux guides type “Plongée au cœur des LLM sans faire de maths”. Très bien pour éveiller la curiosité, moins bien si cela alimente l’idée que l’intelligence artificielle se limite à trois schémas et à quelques termes anglais. En tant que professionnel de l’audit et de la conformité et Ingénieur en math appliquée et système EMBEDED, je rappelle que derrière chaque modèle se trouvent : des bases solides en probabilités, calcul matriciel, optimisation, des problématiques industrielles lourdes : coût énergétique, gouvernance des données, auditabilité, conformité (RGPD, NIS2, eIDAS2), une responsabilité réelle : ne pas banaliser ce qui relève d’une expertise. Vulgariser, oui. Oublier les fondamentaux, non. L’IA reste une affaire sérieuse. Ce n’est pas un produit prêt-à-consommer pour n’importe qui, ni un sujet qu’on règle “sans maths”. 😊

Like
Reply
Lucie Duchateau

Politique Industrielle @ Agence nationale de la sécurité des systèmes d'information (ANSSI)

6d

Bravo pour la production et merci pour le partage à tous !

Like
Reply
Mireille COILHAC

Professeur de NSI, mathématiques et algorithmique

6d

Bonjour, Merci beaucoup pour le partage de ce document très clair et très structuré, j'ai pu le télécharger. Par contre, pour faciliter l'application de la licence, serait-il possible de rajouter sur ce document lui-même le nom d'auteur à créditer, et la licence cc appliquée ? Une fois le document téléchargé, on perd ces information. Encore Merci 🙏

Like
Reply
Fatima Azzahra MASTARI

Founder | Inclusive MedTech & Ethical AI | Ops, Risk & Regulatory Strategy – HealthTech | HBS • MBB • PfMP® Candidate | EU • MENA

2d

Merci pour ce partage et votre générosité !! Ça m’aidera certainement dans mon projet ChildLink-ma! Merci 🙏

See more comments

To view or add a comment, sign in

Explore topics