GTE Qwen2
Specifications
- Input
- Output
- Context window
- 8K tokens
- Veröffentlicht
- Jun 2024
Performance
- Speed
- 1175 t/s
- TTFT
- —
- Latency
- 187 ms
- Intelligence
- —
Pricing
- Eingabe
- €0.05 per 1M tokens
- Ausgabe
- €0.00 per 1M tokens
Über dieses Modell
Qwen2-based text embedding model optimized for semantic similarity and retrieval tasks.
Technische Daten
- Fähigkeiten
- Eingabe-Modalitäten
- Ausgabe-Modalitäten
- Reasoning
- No
Knowledge horizon
Veröffentlicht Jun 2024
Today
Since release 24 mo
See also
Modell zum Vergleich hinzufügen
Nach einem Modell suchen