AI-Hosting

Aktuelles Paket:

Allgemein Tarife buchen Schulungen & Consulting Integrationen Reselling

AI-Zugang

Nutze die folgende URL, um mit deinem API-Key die zur Verfügung stehenden Modelle nutzen zu können und mit deinen Applikationen zu verbinden.

Base-URL

Whitelabel

Eigene Base-URL für deine Marke

Nutze deine eigene Domain als API-Endpunkt – professionell, vertrauenswürdig und zu 100 % unter deinem Dach. Perfekt für Agenturen und Unternehmen: Deine Kunden sehen deine URL, nicht die von mittwald. Einrichtung in wenigen Minuten, CNAME-Eintrag auf unseren Server – fertig.

Whitelabel Base-URL

Noch keine Whitelabel-URL eingerichtet? Jetzt konfigurieren →

Debugging

API-Fehlerprotokoll

Wie bei OpenAI: Fehlgeschlagene API-Requests werden protokolliert. Du siehst hier, wann welche Anfrage welchen Fehler zurückgegeben hat – Status-Code, Endpoint, API-Key und Fehlermeldung. Hilfreich für Debugging und Monitoring.

Zeit	API-Key	Endpoint	Status	Fehlermeldung
28.01.2025 14:32:11	chat-prod	`/v1/chat/completions`	429	Rate limit exceeded
28.01.2025 13:18:42	portal-dev	`/v1/models`	401	Invalid API key
28.01.2025 12:05:03	projekt-muster	`/v1/chat/completions`	200	—

Vollständiges Fehlerprotokoll anzeigen →

API-Keys

< />

portal-dev

Kundenseite A

Kein Container·

< 0,1 Mio.
< />

demo

Entwicklung & Tests

n8n Open WebUI · 2 Container laufen

0 Mio.
< />

projekt-muster

Testprojekt

Kein Container·

0,5 Mio.
< />

voice-demo

Stimmtest

Kein Container·

< 0,1 Mio.
< />

agentur-x

Kundenprojekt

Kein Container·

< 0,1 Mio.
< />

webui-prod

Chat-Oberfläche

Open WebUI · Container läuft

< 0,1 Mio.
< />

chat-prod

Produktiver Chat

LibreChat Perplexica · 2 Container laufen

0,8 Mio.
< />

dev-sandbox

—

Kein Container·

< 0,1 Mio.
< />

cms-key

CMS-Integration

Kein Container·

0 Mio.

Tokenverbrauch

Auto-Reload Zuletzt aktualisiert: —

Token / Monat 1,5 / 5 Mio.

chat-prod (0,8 Mio.) projekt-muster (0,5 Mio.) dev-sandbox (< 0,1 Mio.) agentur-x (< 0,1 Mio.) portal-dev (< 0,1 Mio.) Weitere (< 0,1 Mio.)

Überschreitung: Pay-per-Token

Wenn dein Tarif-Kontingent aufgebraucht ist, kannst du ein Budget für Pay-per-Token festlegen – Anfragen laufen weiter, du zahlst nur für den Verbrauch darüber hinaus. Ohne Budget werden Anfragen bei Überschreitung blockiert.

Max. Budget pro Monat

Beispielpreise pro 1 Mio. Token (Pay-per-Token)

Modell	€ / 1 Mio.
Ministral-3-14B-Instruct-2512	0,80 €
Devstral-Small-2-24B-Instruct-2512	1,20 €
gpt-oss-120b	2,50 €
Qwen3-Embedding-8B	0,35 €
Whisper-Large-V3-Turbo	1,50 €

Warnstufen bei Token-Verbrauch

Du wirst per E-Mail informiert, wenn dein Kontingent bestimmte Schwellen erreicht:

Stufe 1 80 % verbraucht – Erste Hinweis-Mail. Kontingent noch ausreichend.
Stufe 2 95 % verbraucht – Dringende Warnung. Bald Überschreitung – Budget prüfen oder erhöhen.
Stufe 3 100 % erreicht – Kontingent aufgebraucht. Pay-per-Token greift (falls Budget gesetzt) oder Anfragen werden blockiert.

Tokenverbrauch pro Key und Modell

Übersicht, welcher API-Key wie viele Tokens verbraucht und welches Modell über welchen Key genutzt wird.

Pro Key

API-Key	Tokens (Mio.)
chat-prod	0,80
projekt-muster	0,50
dev-sandbox	0,08
agentur-x	0,05
portal-dev	0,04
webui-prod	0,02
demo	0,01
Summe	1,50

Pro Key & Modell

API-Key	Modell	Tokens (Mio.)
chat-prod	Ministral-3-14B-Instruct-2512	0,35
chat-prod	gpt-oss-120b	0,30
chat-prod	Whisper-Large-V3-Turbo	0,15
projekt-muster	Devstral-Small-2-24B-Instruct-2512	0,25
projekt-muster	Qwen3-Embedding-8B	0,15
projekt-muster	Ministral-3-14B-Instruct-2512	0,10
dev-sandbox	Ministral-3-14B-Instruct-2512	0,08
agentur-x	gpt-oss-120b	0,05
portal-dev	Ministral-3-14B-Instruct-2512	0,03
portal-dev	Devstral-Small-2-24B-Instruct-2512	0,01
webui-prod	Ministral-3-14B-Instruct-2512	0,02
demo	Whisper-Large-V3-Turbo	0,01
Summe		1,50

Aus diesen Modellen kannst du wählen:

Modell	Kann / Einsatz	Dokumentation
Ministral-3-14B-Instruct-2512	Text, Chat, Vision; Webprojekte	Doku
Devstral-Small-2-24B-Instruct-2512	Code-Generierung, Debugging, agentische Aufgaben	Doku
Qwen3-Embedding-8B	Suche, Empfehlungen, Embeddings	Doku
gpt-oss-120b	Reasoning, agentische Fähigkeiten	Doku
Whisper-Large-V3-Turbo	Speech-to-Text, Transkription (Meetings, Podcasts, Support)	Doku
FLUX.1-Schnell neu	Bildgenerierung aus Text	Doku
CLIP-ViT-L-14 neu	Vision-Embeddings, Bildsuche, Zero-Shot-Klassifikation	Doku
BGE-Reranker-Large neu	Re-Ranking von Suchergebnissen	Doku
XTTS-v2 neu	Text-to-Speech, Sprachsynthese, Voice-Cloning	Doku

Du kannst mehrere Tarife buchen, z. B. sauber getrennt pro Endkunde. Jedes AI-Hosting hat eigene API-Keys und Kontingente.

Gebuchte Tarife

AI-Hosting Starter

Notiz Endkunde Müller

Neues Kontingent am 13.2.2026

API-Keys unbegrenzt

Anfragen / Minute (RPM) 30

Token / Monat 1,5 / 5 Mio.

AI-Hosting Pro

Notiz Agentur-Projekt X

Neues Kontingent am 13.2.2026

API-Keys unbegrenzt

Anfragen / Minute (RPM) 60

Token / Monat 12 / 75 Mio.

30 Tage testen

Notiz Testlauf Kunde Y

Läuft bis 15.3.2026

API-Keys unbegrenzt

Anfragen / Minute (RPM) 30

Token / Monat 0,3 / 3 Mio.

Verfügbare Modelle

Folgende Modelle stehen dir aktuell zur Verfügung. Bei deinem API-Key sind die RateLimits fest definiert.

Modell	Kann / Einsatz	Dokumentation
gpt-oss-120b	Reasoning, agentische Fähigkeiten	Doku
Devstral-Small-2-24B-Instruct-2512	Code-Generierung, Debugging, agentische Aufgaben	Doku
Mistral-3-14B-Instruct-2512	Text, Chat, Vision; Webprojekte	Doku
whisper-large-v3-turbo	Speech-to-Text, Transkription	Doku
Qwen3-Embedding-8B	Suche, Empfehlungen, Embeddings	Doku
FLUX.1-Schnell neu	Bildgenerierung aus Text	Doku
CLIP-ViT-L-14 neu	Vision-Embeddings, Bildsuche, Zero-Shot-Klassifikation	Doku
BGE-Reranker-Large neu	Re-Ranking von Suchergebnissen	Doku
XTTS-v2 neu	Text-to-Speech, Sprachsynthese, Voice-Cloning	Doku

AI-Hosting

AI-Zugang

Eigene Base-URL für deine Marke

API-Fehlerprotokoll

API-Keys

Tokenverbrauch

Überschreitung: Pay-per-Token

Warnstufen bei Token-Verbrauch

Tokenverbrauch pro Key und Modell

Pro Key

Pro Key & Modell

Aus diesen Modellen kannst du wählen:

Gebuchte Tarife

AI-Hosting Starter

AI-Hosting Pro

30 Tage testen

Verfügbare Modelle

N8N & Automation (mittwald)

KI-Geschäftsmodelle für Agenturen

AI Hosting & Container-Stack

Von der API zum Kundenprojekt

Videotutorials

AI Hosting in 15 Minuten

N8N mit mittwald AI Hosting verbinden

mittwald_ai_hosting

TYPO3 CMS 14.0.0-dev

Modules

mittwald_ai_hosting

Page

View