Qwen2.5

The "18-trillion token" series. Released sizes: 0.5B, 1.5B, 3B, 7B, 14B, 32B, and 72B, plus a proprietary MoE model (Qwen2.5-Max).

Outputs 3

model

Architecture DENSE

paper 2024-12-19

Full Qwen2.5 series technical report. Pre-trained on 18T tokens.

arXiv: 2412.15115

model 2025-01-29

Proprietary-grade MoE model served via API, competing with GPT-4o.

Architecture MOE

open-weightnlpmoe