Offizielle Dokumentation

Die LuNa-Modelle

Stand: Juni 2026 · Version 0.3.1 · Inhalte werden laufend aktualisiert

Die technischen Werte sind Platzhalter-Struktur — trag hier deine echten Spezifikationen ein, sobald sie feststehen.

Überblick

Alle LuNa-Modelle basieren auf derselben Architektur: einem Custom MoA (Mixture of Agents). Mehrere kleine, spezialisierte Modelle bearbeiten deine Anfrage parallel; ein Aggregator vergleicht die Entwürfe und komponiert die finale Antwort. Die Modellversionen unterscheiden sich in Teamgröße, Tiefe und Geschwindigkeit.

ModellIDStatusAm besten für
LuNa 0.1luna-0.1StabilSchnelle Alltagsfragen
LuNa 0.2luna-0.2Stabil · StandardTiefe Antworten & Code
LuNa 0.3luna-0.3-previewPreviewExperimente, langes Denken
luna-0.1

LuNa 0.1

Das schnelle Team. Drei kleine Agenten, getrimmt auf Tempo — ideal, wenn die Antwort wichtiger ist als der Weg dorthin.

ArchitekturMoA · 3 Agenten + Aggregator
Kontextfenster8.000 Tokens
Tempo~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
StärkenKurze Antworten, Zusammenfassungen, einfache Code-Snippets
GrenzenLange Herleitungen, sehr großer Kontext
API-Preis0,20 € Input · 0,80 € Output / 1 Mio. Tokens
curlAPI-Beispiel
# Schnelle Frage an das schnelle Modell
curl https://api.luna-chat.xyz/v1/chat \
  -H "Authorization: Bearer $LUNA_KEY" \
  -d '{ "model": "luna-0.1", "message": "Fass mir RFC 9110 in 3 Sätzen zusammen." }'
luna-0.2

LuNa 0.2

Der ausgewogene Standard — LuNa, wie sie gedacht ist. Ein größeres Agenten-Team mit eigenem Code-Spezialisten; der empfohlene Default für Chat und API.

ArchitekturMoA · 5 Agenten (inkl. Code-Agent) + Aggregator
Kontextfenster32.000 Tokens
Tempo~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
StärkenSauberer, kommentierter Code · ehrliches Abwägen · Erklärungen
GrenzenSehr lange Dokumente am Stück
API-Preis0,50 € Input · 2,00 € Output / 1 Mio. Tokens

Der Code-Stil

LuNa 0.2 schreibt Code nach festen Prinzipien: Kommentare erklären das Warum, Namen tragen Absicht, Sonderfälle stehen sichtbar am Anfang. Lange Code-Antworten landen im Chat automatisch als Artifact — ein eigenes Panel mit Kopieren & Download.

luna-0.3-preview Preview

LuNa 0.3 (Preview)

Das Experiment. Mehr Agenten, längere Denkwege, mutigere Antworten — noch im Preview-Stadium und damit gelegentlich unberechenbar. Feedback ist ausdrücklich willkommen.

ArchitekturMoA · 7 Agenten + gewichteter Aggregator
Kontextfenster64.000 Tokens
Tempo~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
StärkenMehrstufiges Reasoning, kreative Ansätze, lange Threads
GrenzenPreview: Antwortqualität kann schwanken · kein SLA
API-Preis2,00 € Input · 8,00 € Output / 1 Mio. Tokens

Hinweis: Preview-Modelle können sich täglich ändern und sind nur für Plus- und API-Konten verfügbar.

Limits & Kontingente

PlanNachrichtenModelleRate-Limit (API)
Free20 / Tag0.1, 0.2
Plus / SupporterUnbegrenzt*Alle
APINach NutzungAlle30 Anfragen / Minute

Das Free-Limit setzt sich täglich um Mitternacht (lokale Zeit) zurück. Im Chat siehst du deinen Stand jederzeit unten links. *Fair-Use: bei extremer Auslastung kann die Priorität kurzzeitig sinken.

Fehlercodes

Die API antwortet mit klaren, vorhersehbaren Fehlern — dieselben Zustände zeigt auch der Chat an:

CodeBedeutungWas tun
401 invalid_tokenToken fehlt oder ist ungültigToken prüfen, neu anmelden
429 rate_limitedLimit erreicht (Plan oder Rate)Warten oder Plan upgraden
503 unavailableLuNa-Server nicht erreichbarKurz warten, erneut versuchen — der Chat bietet automatisch „Erneut versuchen" an
400 bad_requestAnfrage fehlerhaft (z. B. unbekanntes Modell)Modell-ID gegen diese Doku prüfen

Changelog

Juni 20260.3-preview veröffentlicht · Artifacts im Chat · Tageslimit-Anzeige
0.2 wird Standardmodell · Code-Agent ins Team aufgenommen
0.1 — erster öffentlicher MoA-Prototyp