m
MB

AI-Hosting

Aktuelles Paket:

AI-Zugang

Nutze die folgende URL, um mit deinem API-Key die zur Verfügung stehenden Modelle nutzen zu können und mit deinen Applikationen zu verbinden.

Whitelabel

Eigene Base-URL für deine Marke

Nutze deine eigene Domain als API-Endpunkt – professionell, vertrauenswürdig und zu 100 % unter deinem Dach. Perfekt für Agenturen und Unternehmen: Deine Kunden sehen deine URL, nicht die von mittwald. Einrichtung in wenigen Minuten, CNAME-Eintrag auf unseren Server – fertig.

Noch keine Whitelabel-URL eingerichtet? Jetzt konfigurieren →

Debugging

API-Fehlerprotokoll

Wie bei OpenAI: Fehlgeschlagene API-Requests werden protokolliert. Du siehst hier, wann welche Anfrage welchen Fehler zurückgegeben hat – Status-Code, Endpoint, API-Key und Fehlermeldung. Hilfreich für Debugging und Monitoring.

Zeit API-Key Endpoint Status Fehlermeldung
28.01.2025 14:32:11 chat-prod /v1/chat/completions 429 Rate limit exceeded
28.01.2025 13:18:42 portal-dev /v1/models 401 Invalid API key
28.01.2025 12:05:03 projekt-muster /v1/chat/completions 200

Vollständiges Fehlerprotokoll anzeigen →

API-Keys

  • < />
    portal-dev
    Kundenseite A
    Kein Container·
    < 0,1 Mio.
  • < />
    demo
    Entwicklung & Tests
    n8n Open WebUI · 2 Container laufen
    0 Mio.
  • < />
    projekt-muster
    Testprojekt
    Kein Container·
    0,5 Mio.
  • < />
    voice-demo
    Stimmtest
    Kein Container·
    < 0,1 Mio.
  • < />
    agentur-x
    Kundenprojekt
    Kein Container·
    < 0,1 Mio.
  • < />
    webui-prod
    Chat-Oberfläche
    Open WebUI · Container läuft
    < 0,1 Mio.
  • < />
    chat-prod
    Produktiver Chat
    LibreChat Perplexica · 2 Container laufen
    0,8 Mio.
  • < />
    dev-sandbox
    Kein Container·
    < 0,1 Mio.
  • < />
    cms-key
    CMS-Integration
    Kein Container·
    0 Mio.

Tokenverbrauch

Zuletzt aktualisiert: —
Token / Monat 1,5 / 5 Mio.
chat-prod (0,8 Mio.) projekt-muster (0,5 Mio.) dev-sandbox (< 0,1 Mio.) agentur-x (< 0,1 Mio.) portal-dev (< 0,1 Mio.) Weitere (< 0,1 Mio.)

Überschreitung: Pay-per-Token

Wenn dein Tarif-Kontingent aufgebraucht ist, kannst du ein Budget für Pay-per-Token festlegen – Anfragen laufen weiter, du zahlst nur für den Verbrauch darüber hinaus. Ohne Budget werden Anfragen bei Überschreitung blockiert.

Beispielpreise pro 1 Mio. Token (Pay-per-Token)

Modell€ / 1 Mio.
Ministral-3-14B-Instruct-25120,80 €
Devstral-Small-2-24B-Instruct-25121,20 €
gpt-oss-120b2,50 €
Qwen3-Embedding-8B0,35 €
Whisper-Large-V3-Turbo1,50 €

Warnstufen bei Token-Verbrauch

Du wirst per E-Mail informiert, wenn dein Kontingent bestimmte Schwellen erreicht:

  • Stufe 1 80 % verbraucht – Erste Hinweis-Mail. Kontingent noch ausreichend.
  • Stufe 2 95 % verbraucht – Dringende Warnung. Bald Überschreitung – Budget prüfen oder erhöhen.
  • Stufe 3 100 % erreicht – Kontingent aufgebraucht. Pay-per-Token greift (falls Budget gesetzt) oder Anfragen werden blockiert.

Tokenverbrauch pro Key und Modell

Übersicht, welcher API-Key wie viele Tokens verbraucht und welches Modell über welchen Key genutzt wird.

Pro Key

API-Key Tokens (Mio.)
chat-prod0,80
projekt-muster0,50
dev-sandbox0,08
agentur-x0,05
portal-dev0,04
webui-prod0,02
demo0,01
Summe1,50

Pro Key & Modell

API-Key Modell Tokens (Mio.)
chat-prodMinistral-3-14B-Instruct-25120,35
chat-prodgpt-oss-120b0,30
chat-prodWhisper-Large-V3-Turbo0,15
projekt-musterDevstral-Small-2-24B-Instruct-25120,25
projekt-musterQwen3-Embedding-8B0,15
projekt-musterMinistral-3-14B-Instruct-25120,10
dev-sandboxMinistral-3-14B-Instruct-25120,08
agentur-xgpt-oss-120b0,05
portal-devMinistral-3-14B-Instruct-25120,03
portal-devDevstral-Small-2-24B-Instruct-25120,01
webui-prodMinistral-3-14B-Instruct-25120,02
demoWhisper-Large-V3-Turbo0,01
Summe1,50

Aus diesen Modellen kannst du wählen:

Modell Kann / Einsatz Dokumentation
Ministral-3-14B-Instruct-2512 Text, Chat, Vision; Webprojekte Doku
Devstral-Small-2-24B-Instruct-2512 Code-Generierung, Debugging, agentische Aufgaben Doku
Qwen3-Embedding-8B Suche, Empfehlungen, Embeddings Doku
gpt-oss-120b Reasoning, agentische Fähigkeiten Doku
Whisper-Large-V3-Turbo Speech-to-Text, Transkription (Meetings, Podcasts, Support) Doku
FLUX.1-Schnell neu Bildgenerierung aus Text Doku
CLIP-ViT-L-14 neu Vision-Embeddings, Bildsuche, Zero-Shot-Klassifikation Doku
BGE-Reranker-Large neu Re-Ranking von Suchergebnissen Doku
XTTS-v2 neu Text-to-Speech, Sprachsynthese, Voice-Cloning Doku