Hunyuan Turbo S

"Fast-thinking" model using a Hybrid-Mamba-Transformer architecture for near-instant replies with complex reasoning. 56B activated / 560B total hybrid MoE. 256K context, 16T pre-training tokens.

Announcement Website Paper (arXiv)

Outputs 2

model

Announcement Website

Architecture MOE

Parameters 560B

Active params 56B

Hunyuan-TurboS: Mamba-Transformer Synergy

paper 2025-05-21

56B activated / 560B total hybrid MoE with Mamba-Transformer architecture. 256K context, 16T pre-training tokens.

Paper (arXiv)

arXiv HTML

reasoningefficiencymambamoe