Künstliche Intelligenz

Token

Die kleinste Verarbeitungseinheit eines Sprachmodells — ein Wortfragment, das LLMs beim Lesen und Schreiben von Text verarbeiten.

Auch bekannt als:  LLM-Token, Token-Unit

Was ist ein Token?

Ein Token ist die kleinste Einheit, mit der ein [[LLM|Sprachmodell]] arbeitet. Es ist weder ein Zeichen noch zwingend ein ganzes Wort — sondern ein Wortfragment, das das Modell intern verarbeitet.

Faustregel: Ein Token entspricht ungefähr 3–4 Zeichen oder 0,75 Wörtern. Der Satz „Automatisierung spart Zeit” enthält etwa 5–6 Tokens.

Warum Tokens zählen

Tokens sind die Maßeinheit für alles, was mit Sprachmodellen zu tun hat:

  • [[Kontextfenster]] — Das Kontextfenster gibt an, wie viele Tokens ein Modell gleichzeitig verarbeiten kann
  • Kosten — API-Anbieter rechnen nach Token-Verbrauch ab (Input + Output getrennt)
  • Geschwindigkeit — Mehr Tokens bedeuten längere Verarbeitungszeit

Praktische Orientierung

Ein durchschnittlicher Blog-Artikel enthält etwa 2.000–4.000 Tokens. Ein langer Codebase-Dump kann schnell 50.000+ Tokens umfassen.

Wer mit Agenten arbeitet und das Kontextfenster aktiv managen möchte, sollte ein Gefühl für den Token-Verbrauch einzelner Inputs entwickeln — besonders bei langen Dokumenten, die als Kontext übergeben werden.