Token

Die kleinste Verarbeitungseinheit eines Sprachmodells — ein Wortfragment, das LLMs beim Lesen und Schreiben von Text verarbeiten.

Auch bekannt als: LLM-Token, Token-Unit

Was ist ein Token?

Ein Token ist die kleinste Einheit, mit der ein [[LLM|Sprachmodell]] arbeitet. Es ist weder ein Zeichen noch zwingend ein ganzes Wort — sondern ein Wortfragment, das das Modell intern verarbeitet.

Faustregel: Ein Token entspricht ungefähr 3–4 Zeichen oder 0,75 Wörtern. Der Satz „Automatisierung spart Zeit” enthält etwa 5–6 Tokens.

Warum Tokens zählen

Tokens sind die Maßeinheit für alles, was mit Sprachmodellen zu tun hat:

[[Kontextfenster]] — Das Kontextfenster gibt an, wie viele Tokens ein Modell gleichzeitig verarbeiten kann
Kosten — API-Anbieter rechnen nach Token-Verbrauch ab (Input + Output getrennt)
Geschwindigkeit — Mehr Tokens bedeuten längere Verarbeitungszeit

Praktische Orientierung

Ein durchschnittlicher Blog-Artikel enthält etwa 2.000–4.000 Tokens. Ein langer Codebase-Dump kann schnell 50.000+ Tokens umfassen.

Wer mit Agenten arbeitet und das Kontextfenster aktiv managen möchte, sollte ein Gefühl für den Token-Verbrauch einzelner Inputs entwickeln — besonders bei langen Dokumenten, die als Kontext übergeben werden.

Verwandte Begriffe

LLM

Large Language Model: KI-Sprachmodell, das auf riesigen Textmengen trainiert wurde und natürliche Sprache versteht, generiert und verarbeitet.

Kontextfenster

Die maximale Textmenge, die ein KI-Modell in einer Session gleichzeitig verarbeiten und im Blick halten kann.

Prompt Engineering

Die Kunst, Eingaben für KI-Sprachmodelle so zu formulieren, dass die Ausgaben zuverlässig nützlich sind — ohne das Modell selbst zu verändern.

Artikel zu diesem Thema

KI-Agenten wirklich steuern: Ein 8-Phasen-Workflow gegen das Agentic-Chaos

8. April 2026

Alle Begriffe im Überblick

Zum Glossar Erstgespräch