LuNa — Dokumentation

Die technischen Werte sind Platzhalter-Struktur — trag hier deine echten Spezifikationen ein, sobald sie feststehen.

Überblick

Alle LuNa-Modelle basieren auf derselben Architektur: einem Custom MoA (Mixture of Agents). Mehrere kleine, spezialisierte Modelle bearbeiten deine Anfrage parallel; ein Aggregator vergleicht die Entwürfe und komponiert die finale Antwort. Die Modellversionen unterscheiden sich in Teamgröße, Tiefe und Geschwindigkeit.

Modell	ID	Status	Am besten für
LuNa 0.1	`luna-0.1`	Stabil	Schnelle Alltagsfragen
LuNa 0.2	`luna-0.2`	Stabil · Standard	Tiefe Antworten & Code
LuNa 0.3	`luna-0.3-preview`	Preview	Experimente, langes Denken

luna-0.1

LuNa 0.1

Das schnelle Team. Drei kleine Agenten, getrimmt auf Tempo — ideal, wenn die Antwort wichtiger ist als der Weg dorthin.

Architektur	MoA · 3 Agenten + Aggregator
Kontextfenster	8.000 Tokens
Tempo	~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
Stärken	Kurze Antworten, Zusammenfassungen, einfache Code-Snippets
Grenzen	Lange Herleitungen, sehr großer Kontext
API-Preis	0,20 € Input · 0,80 € Output / 1 Mio. Tokens

curlAPI-Beispiel

# Schnelle Frage an das schnelle Modell
curl https://api.luna-chat.xyz/v1/chat \
  -H "Authorization: Bearer $LUNA_KEY" \
  -d '{ "model": "luna-0.1", "message": "Fass mir RFC 9110 in 3 Sätzen zusammen." }'

luna-0.2

LuNa 0.2

Der ausgewogene Standard — LuNa, wie sie gedacht ist. Ein größeres Agenten-Team mit eigenem Code-Spezialisten; der empfohlene Default für Chat und API.

Architektur	MoA · 5 Agenten (inkl. Code-Agent) + Aggregator
Kontextfenster	32.000 Tokens
Tempo	~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
Stärken	Sauberer, kommentierter Code · ehrliches Abwägen · Erklärungen
Grenzen	Sehr lange Dokumente am Stück
API-Preis	0,50 € Input · 2,00 € Output / 1 Mio. Tokens

Der Code-Stil

LuNa 0.2 schreibt Code nach festen Prinzipien: Kommentare erklären das Warum, Namen tragen Absicht, Sonderfälle stehen sichtbar am Anfang. Lange Code-Antworten landen im Chat automatisch als Artifact — ein eigenes Panel mit Kopieren & Download.

luna-0.3-preview Preview

LuNa 0.3 (Preview)

Das Experiment. Mehr Agenten, längere Denkwege, mutigere Antworten — noch im Preview-Stadium und damit gelegentlich unberechenbar. Feedback ist ausdrücklich willkommen.

Architektur	MoA · 7 Agenten + gewichteter Aggregator
Kontextfenster	64.000 Tokens
Tempo	~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s
Stärken	Mehrstufiges Reasoning, kreative Ansätze, lange Threads
Grenzen	Preview: Antwortqualität kann schwanken · kein SLA
API-Preis	2,00 € Input · 8,00 € Output / 1 Mio. Tokens

Hinweis: Preview-Modelle können sich täglich ändern und sind nur für Plus- und API-Konten verfügbar.

Limits & Kontingente

Plan	Nachrichten	Modelle	Rate-Limit (API)
Free	20 / Tag	0.1, 0.2	—
Plus / Supporter	Unbegrenzt*	Alle	—
API	Nach Nutzung	Alle	30 Anfragen / Minute

Das Free-Limit setzt sich täglich um Mitternacht (lokale Zeit) zurück. Im Chat siehst du deinen Stand jederzeit unten links. *Fair-Use: bei extremer Auslastung kann die Priorität kurzzeitig sinken.

Fehlercodes

Die API antwortet mit klaren, vorhersehbaren Fehlern — dieselben Zustände zeigt auch der Chat an:

Code	Bedeutung	Was tun
`401` invalid_token	Token fehlt oder ist ungültig	Token prüfen, neu anmelden
`429` rate_limited	Limit erreicht (Plan oder Rate)	Warten oder Plan upgraden
`503` unavailable	LuNa-Server nicht erreichbar	Kurz warten, erneut versuchen — der Chat bietet automatisch „Erneut versuchen" an
`400` bad_request	Anfrage fehlerhaft (z. B. unbekanntes Modell)	Modell-ID gegen diese Doku prüfen

Changelog

Juni 2026	0.3-preview veröffentlicht · Artifacts im Chat · Tageslimit-Anzeige
…	0.2 wird Standardmodell · Code-Agent ins Team aufgenommen
…	0.1 — erster öffentlicher MoA-Prototyp