Glossar · KI & LLMs
Auf Transformer-Architektur basierendes Modell mit Milliarden bis Billionen Parametern, das Text als Sequenz von Tokens verarbeitet und generiert.
Definition
Ein LLM nimmt Text als Input, tokenisiert ihn, jagt ihn durch viele Transformer-Layer und gibt für jedes Token eine Wahrscheinlichkeitsverteilung über das Vokabular aus. Generation passiert autoregressiv, Token für Token, bis ein Stop-Kriterium greift.
Relevant in der Praxis sind primär die Frontier-Modelle: Claude (Anthropic), GPT (OpenAI), Gemini (Google), und Open-Weights-Modelle wie Llama oder Mistral. Unterschiedliche Modelle haben unterschiedliche Stärken — Claude für lange Kontexte und nuanciertes Reasoning, GPT für breites Tool-Ökosystem, Open-Weights für Selfhosting und sensitive Daten.
Wichtige Eigenschaften: Context Window (wieviel Text passt rein, 200k-1M Tokens bei aktuellen Modellen), Token-Kosten (Input vs. Output separat abgerechnet), Latenz (TTFT und Token/s), und Cutoff-Datum des Trainingswissens.
So nutzen wir das bei adsbird
Wir wählen pro Workflow das richtige Modell: Claude für komplexe Multi-Step-Agents und lange Dokumente, Haiku/Mini-Modelle für hochvolumige Klassifikationen, Open-Source-Modelle (via Together/Bedrock) wenn ein Kunde aus Compliance-Gründen keine US-Cloud nutzen darf.
LLM (Large Language Model) in deinem Projekt?
Wenn du LLM in einem konkreten Workflow brauchst — wir haben das wahrscheinlich schon gebaut.