
通义千问Qwen2.5-Max超大规模MoE模型号称优于DeepseekV3等竞品,暂未开源
据IT之家1月29日消息,新年之际,阿里云公布了其全新的通义千问Qwen2.5-Max超大规模MoE模型,大家可以通过 API 的方式进行访问,也可以登录 QwenChat 进行体验,例如直接与模型对话,或者使用artifacts、搜索等功能。 据介绍,通义千问Qwen2.5-Max使用超过20万亿token的预训练数据及精心设计的后训练方案进行训练。 性能 阿里云直接对比了指令模型的...