Inference API

Jedes Modell nutzen. Deine Daten bleiben in Europa.

OpenAI- und Anthropic-kompatibler Zugang zu 60+ Open-Weight-Modellen auf souveräner europäischer Infrastruktur. Ein API-Key, automatisches Failover und volle Transparenz.

API-Key erhalten Zur Dokumentation

Request

{
  "model": "gpt-oss-120b",
  "messages": [
    { "role": "user",
      "content": "Explain how GDPR applies to AI." }
  ]
}

Response

{
  "id": "chatcmpl-meli_7f3a...",
  "model": "gpt-oss-120b",
  "choices": [{
    "message": {
      "content": "The GDPR applies to..."
    },
    "finish_reason": "stop"
  }],
  "environment_impact": {
    "energy_kwh": 0.00057,
    "carbon_g_co2": 0.33,
    "water_liters": 0.001,
    "location": "NL"
  }
}

Funktioniert mit allem, was OpenAI oder Anthropic spricht.

Ändere deine Base-URL. Behalte deinen Code.

main.py

from openai import OpenAI

client = OpenAI(
    base_url="https://api.melious.ai/v1",
    api_key="your-api-key"
)

Setz die Melious Base-URL ein und fertig. Jedes SDK, Framework und Tool, das OpenAI oder Anthropic spricht, funktioniert sofort.

Gleiches Modell. Andere Prioritäten.

Hänge einen Routing-Modus an jede Modell-ID. Der Router optimiert auf dein gewähltes Ziel.

Standard. Optimiert über Preis, Geschwindigkeit und Umweltbelastung.

Einfach ein Suffix anhängen

model: "gpt-oss-120b"

60+ Modelle. Eine API.

Von Chat bis Bildgenerierung, Embeddings bis Sprache. Alles über eine einzige, souveräne, konsistente API.

Alle Modelle ansehen

Sprachmodelle

Chat Completions mit Streaming, Function Calling, Vision und JSON-Modus.

Embeddings

Vektor-Embeddings für Suche, RAG und Clustering.

Bildgenerierung

Bilder aus Text generieren mit Modellen wie Flux.

Sprache & Audio

Speech-to-Text und Text-to-Speech, produktionsbereit.

Reranking

Suchergebnisse neu bewerten und sortieren für bessere Relevanz.

11 Anbieter. Automatisches Failover.

Wir haben auf einem Netzwerk gebaut, nicht auf einem einzelnen Server. Wenn ein Anbieter ausfällt, laufen deine Anfragen weiter.

Multi-Provider-Netzwerk

11 europäische Inference-Anbieter in 8 Ländern. Kein Single Point of Failure.

Automatisches Failover

Wenn ein Anbieter langsam oder ausgefallen ist, routen Anfragen automatisch zum nächsten gesunden.

Echtzeit-Health-Monitoring

Jeder Anbieter wird kontinuierlich auf Latenz, Fehler und Verfügbarkeit überwacht.

Jede API-Antwort enthält optional Umweltdaten. Route mit :eco, um den Impact zu minimieren.

Gebaut für Entwickler.

Eine vertraute API, gute Docs und die Tools, die du schon kennst.

from openai import OpenAI

client = OpenAI(
    base_url="https://api.melious.ai/v1",
    api_key="your-api-key"
)

response = client.chat.completions.create(
    model="gpt-oss-120b",
    messages=[
        {"role": "user",
         "content": "Hello from Europe!"}
    ]
)

print(response.choices[0].message.content)

Streaming

Echtzeit-Ausgabe Token für Token via Server-Sent Events.

Function Calling

OpenAI- und Anthropic-kompatible Tool-Nutzung für Agents und Workflows.

Vision

Sende Bilder zusammen mit Text für multimodales Verständnis.

JSON Mode

Strukturierte Ausgabe mit garantiert validem JSON.

Batch API

Tausende Anfragen asynchron zu niedrigeren Kosten verarbeiten.

Starte kostenlos. Keine Kreditkarte nötig.

Leg los.

API-Key erhalten Preise ansehen