Inference API

Jedes Modell nutzen. Deine Daten bleiben in Europa.

OpenAI-kompatibler Zugang zu 60+ Open-Weight-Modellen auf souveräner europäischer Infrastruktur. Ein API-Key, automatisches Failover und volle Transparenz.

Request
{
  "model": "deepseek-v3.2",
  "messages": [
    { "role": "user",
      "content": "Explain how GDPR applies to AI." }
  ]
}
Response
{
  "id": "chatcmpl-meli_7f3a...",
  "model": "deepseek-v3.2",
  "choices": [{
    "message": {
      "content": "The GDPR applies to..."
    },
    "finish_reason": "stop"
  }],
  "environment_impact": {
    "energy_kwh": 0.00057,
    "carbon_g_co2": 0.33,
    "water_liters": 0.00057,
    "location": "NL"
  }
}
Meta (Llama)
DeepSeek
Mistral AI
Qwen
Gemma
Nous Research
KIMI
OpenAI

Funktioniert mit allem, was mit OpenAI funktioniert.

Ändere deine Base-URL. Behalte deinen Code.

main.py
from openai import OpenAI

client = OpenAI(
    base_url="https://api.melious.ai/v1",
    api_key="your-api-key"
)

Setz die Melious Base-URL ein und fertig. Jedes SDK, Framework und Tool, das OpenAI spricht, funktioniert sofort.

Gleiches Modell. Andere Prioritäten.

Hänge einen Routing-Modus an jede Modell-ID. Der Router optimiert auf dein gewähltes Ziel.

Standard. Optimiert über Preis, Geschwindigkeit und Umweltbelastung.

Einfach ein Suffix anhängen
model: "deepseek-v3.2"

60+ Modelle. Eine API.

Von Chat bis Bildgenerierung, Embeddings bis Sprache. Alles über eine einzige, souveräne, konsistente API.

Alle Modelle ansehen

Sprachmodelle

Chat Completions mit Streaming, Function Calling, Vision und JSON-Modus.

Embeddings

Vektor-Embeddings für Suche, RAG und Clustering.

Bildgenerierung

Bilder aus Text generieren mit Modellen wie Flux.

Sprache & Audio

Speech-to-Text und Text-to-Speech, produktionsbereit.

Reranking

Suchergebnisse neu bewerten und sortieren für bessere Relevanz.

9+ Anbieter. Automatisches Failover.

Wir haben auf einem Netzwerk gebaut, nicht auf einem einzelnen Server. Wenn ein Anbieter ausfällt, laufen deine Anfragen weiter.

Multi-Provider-Netzwerk

9+ europäische Inference-Anbieter in 8 Ländern. Kein Single Point of Failure.

Automatisches Failover

Wenn ein Anbieter langsam oder ausgefallen ist, routen Anfragen automatisch zum nächsten gesunden.

Echtzeit-Health-Monitoring

Jeder Anbieter wird kontinuierlich auf Latenz, Fehler und Verfügbarkeit überwacht.

CO₂-Tracking pro Anfrage. Weil du es wissen solltest.

0.57 Wh Energie
0.33g CO₂
0.57 ml Wasser

Jede API-Antwort enthält optional Umweltdaten. Route mit :eco, um den Impact zu minimieren.

Gebaut für Entwickler.

Eine vertraute API, gute Docs und die Tools, die du schon kennst.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.melious.ai/v1",
    api_key="your-api-key"
)

response = client.chat.completions.create(
    model="deepseek-v3.2",
    messages=[
        {"role": "user",
         "content": "Hello from Europe!"}
    ]
)

print(response.choices[0].message.content)

Streaming

Echtzeit-Ausgabe Token für Token via Server-Sent Events.

Function Calling

OpenAI-kompatible Tool-Nutzung für Agents und Workflows.

Vision

Sende Bilder zusammen mit Text für multimodales Verständnis.

JSON Mode

Strukturierte Ausgabe mit garantiert validem JSON.

Batch API

Tausende Anfragen asynchron zu niedrigeren Kosten verarbeiten.

Starte kostenlos. Keine Kreditkarte nötig.

Leg los.