Qwen3 Embedding 8B

by Qwen

Specifications

Input
Output
Context window: 41K tokens
Released: Jun 2025

Performance

Speed: 1862 t/s
TTFT: —
Latency: 474 ms
Intelligence: —

Pricing

Input: €0.01
Output: €0.00

About this model

Qwen3 Embedding 8B is a dense retrieval embedding model with 8 billion parameters, optimized for semantic search, text similarity, and feature extraction. Trained on diverse multilingual data providing strong cross-lingual retrieval capabilities. Supports 262K context for embedding long documents and extensive text passages. Excels at document retrieval, semantic search, clustering, and recommendation systems. Compatible with standard embedding frameworks and optimized for production deployment with efficient inference.

Technical specifications

Capabilities
Input modalities
Output modalities
Reasoning: No

Knowledge horizon

Released Jun 2025

Today

Since release 12 mo

Qwen3 Embedding 8B

Specifications

Performance

Pricing

About this model

Technical specifications

Knowledge horizon

See also

Kimi K2.5

Qwen 3.6 27B

Gemma 4 31B