Überblick
Alle LuNa-Modelle basieren auf derselben Architektur: einem Custom MoA (Mixture of Agents). Mehrere kleine, spezialisierte Modelle bearbeiten deine Anfrage parallel; ein Aggregator vergleicht die Entwürfe und komponiert die finale Antwort. Die Modellversionen unterscheiden sich in Teamgröße, Tiefe und Geschwindigkeit.
| Modell | ID | Status | Am besten für |
|---|---|---|---|
| LuNa 0.1 | luna-0.1 | Stabil | Schnelle Alltagsfragen |
| LuNa 0.2 | luna-0.2 | Stabil · Standard | Tiefe Antworten & Code |
| LuNa 0.3 | luna-0.3-preview | Preview | Experimente, langes Denken |
LuNa 0.1
Das schnelle Team. Drei kleine Agenten, getrimmt auf Tempo — ideal, wenn die Antwort wichtiger ist als der Weg dorthin.
| Architektur | MoA · 3 Agenten + Aggregator |
| Kontextfenster | 8.000 Tokens |
| Tempo | ~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s |
| Stärken | Kurze Antworten, Zusammenfassungen, einfache Code-Snippets |
| Grenzen | Lange Herleitungen, sehr großer Kontext |
| API-Preis | 0,20 € Input · 0,80 € Output / 1 Mio. Tokens |
# Schnelle Frage an das schnelle Modell curl https://api.luna-chat.xyz/v1/chat \ -H "Authorization: Bearer $LUNA_KEY" \ -d '{ "model": "luna-0.1", "message": "Fass mir RFC 9110 in 3 Sätzen zusammen." }'
LuNa 0.2
Der ausgewogene Standard — LuNa, wie sie gedacht ist. Ein größeres Agenten-Team mit eigenem Code-Spezialisten; der empfohlene Default für Chat und API.
| Architektur | MoA · 5 Agenten (inkl. Code-Agent) + Aggregator |
| Kontextfenster | 32.000 Tokens |
| Tempo | ~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s |
| Stärken | Sauberer, kommentierter Code · ehrliches Abwägen · Erklärungen |
| Grenzen | Sehr lange Dokumente am Stück |
| API-Preis | 0,50 € Input · 2,00 € Output / 1 Mio. Tokens |
Der Code-Stil
LuNa 0.2 schreibt Code nach festen Prinzipien: Kommentare erklären das Warum, Namen tragen Absicht, Sonderfälle stehen sichtbar am Anfang. Lange Code-Antworten landen im Chat automatisch als Artifact — ein eigenes Panel mit Kopieren & Download.
LuNa 0.3 (Preview)
Das Experiment. Mehr Agenten, längere Denkwege, mutigere Antworten — noch im Preview-Stadium und damit gelegentlich unberechenbar. Feedback ist ausdrücklich willkommen.
| Architektur | MoA · 7 Agenten + gewichteter Aggregator |
| Kontextfenster | 64.000 Tokens |
| Tempo | ~30–40 Tokens/s · unter Last zeitweise ~3 Tok/s |
| Stärken | Mehrstufiges Reasoning, kreative Ansätze, lange Threads |
| Grenzen | Preview: Antwortqualität kann schwanken · kein SLA |
| API-Preis | 2,00 € Input · 8,00 € Output / 1 Mio. Tokens |
Hinweis: Preview-Modelle können sich täglich ändern und sind nur für Plus- und API-Konten verfügbar.
Limits & Kontingente
| Plan | Nachrichten | Modelle | Rate-Limit (API) |
|---|---|---|---|
| Free | 20 / Tag | 0.1, 0.2 | — |
| Plus / Supporter | Unbegrenzt* | Alle | — |
| API | Nach Nutzung | Alle | 30 Anfragen / Minute |
Das Free-Limit setzt sich täglich um Mitternacht (lokale Zeit) zurück. Im Chat siehst du deinen Stand jederzeit unten links. *Fair-Use: bei extremer Auslastung kann die Priorität kurzzeitig sinken.
Fehlercodes
Die API antwortet mit klaren, vorhersehbaren Fehlern — dieselben Zustände zeigt auch der Chat an:
| Code | Bedeutung | Was tun |
|---|---|---|
401 invalid_token | Token fehlt oder ist ungültig | Token prüfen, neu anmelden |
429 rate_limited | Limit erreicht (Plan oder Rate) | Warten oder Plan upgraden |
503 unavailable | LuNa-Server nicht erreichbar | Kurz warten, erneut versuchen — der Chat bietet automatisch „Erneut versuchen" an |
400 bad_request | Anfrage fehlerhaft (z. B. unbekanntes Modell) | Modell-ID gegen diese Doku prüfen |
Changelog
| Juni 2026 | 0.3-preview veröffentlicht · Artifacts im Chat · Tageslimit-Anzeige |
| … | 0.2 wird Standardmodell · Code-Agent ins Team aufgenommen |
| … | 0.1 — erster öffentlicher MoA-Prototyp |