Der schnellste Weg, um die Mechanismen von LLMs zu verstehen- Dieses Buch ist eine sehr komprimierte und gleichzeitig gut verständliche Einführung in die Entwicklung von Large Language Models
- Ideal für alle, die sich schnell und fundiert in die Grundlagen von LLMs einarbeiten wollen
- Vom Bestseller-Autor Andriy Burkov, der in seiner renommierten »Hundred-Page«-Reihe zu Machine-Learning-Themen Konzepte besonders klar und knapp erklärt
Wenn Sie in die Welt der Large Language Models eintauchen wollen, hilft Ihnen dieses kompakte Buch dabei, das nötige Wissen aufzubauen, um das Innenleben von LLMs zu verstehen und erste praktische Erfahrungen zu sammeln. Es führt Schritt für Schritt in die Sprachmodellierung ein, beginnend mit Machine Learning und neuronalen Netzen über RNNs und Transformern bis zu aktuellen LLM-Architekturen. Effektive Prompt-Engineering-Techniken und das Finetuning der Modelle werden ebenfalls vorgestellt.
Die Ausgewogenheit von Mathematik, Illustrationen und Python-Code macht die komplexen Ideen leicht zugänglich. Das Buch erläutert nicht nur die Theorie, sondern bietet auch direkt umsetzbare Codeschnipsel, die die Konzepte perfekt veranschaulichen. Zu diesem Zweck gibt es zu jedem Kapitel Jupyter Notebooks und PyTorch-Implementierungen auf GitHub.