GTE Qwen2

von Qwen

Specifications

Input
Output
Context window: 8K tokens
Veröffentlicht: Jun 2024

Performance

Speed: 1175 t/s
TTFT: —
Latency: 187 ms
Intelligence: —

Pricing

Eingabe: €0.05
Ausgabe: €0.00

Über dieses Modell

Qwen2-based text embedding model optimized for semantic similarity and retrieval tasks.

Technische Daten

Fähigkeiten
Eingabe-Modalitäten
Ausgabe-Modalitäten
Reasoning: No

Knowledge horizon

Veröffentlicht Jun 2024

Today

Since release 24 mo

See also

DeepSeek V4 Flash

von Deepseek

MiniMax M2.5

von MiniMax

Mistral Medium 3.5 128B

von Mistral