阿里巴巴正式推出最强大的钱文模型,总参数超万亿

据阿里云官方账号消息,阿里巴巴(BABA.US)(09988.HK)于1月26日正式上线钱问旗舰推理模型Qwen3-Max-Thinking。该模型参数总数超过万亿(1T),预训练数据量为36T代币。这是目前阿里巴巴最大、最强大的钱文推理模型。目前,开发者可以在QwenChat上免费测试Qwen3-Max-Thinking模型,企业可以通过阿里云白链获取新模型的API服务,普通用户也可以通过钱文PC和网页来测试模型。此外,钱文APP即将接入新机型,所有用户都可以免费体验最强大的钱文机型。此前,Qwen3-Max-Thinking的预览版就拥有惊人的推理性能,在日本首次在数值推理AIME 25和HMMT 25中取得了双倍成绩。基于此,阿里巴巴同益茶m进行了大量的强化学习后训练,全面提升Qwen3-Max-Thinking正式版的性能。在模型推理能力的显着提升中,Qianwen的新模型采用了新的测试时间缩放机制,在提高推理性能的同时也使其更加经济。业界常见的推理时间计算只会增加并行推理次数,通常会重复得出已知结论,导致冗余推理效率低下。钱问采用的机制可以对之前的推理结果进行“经验提取”细化,并在此基础上进行多次自迭代,从而在相同上下文下实现更高的推理计算效率,获得更智能的推理结果。在这一推理技术创新的基础上,钱文的推理性能和效率得到了显着提升。例如,在 HLE 中“Hum“Last Test”工具启用后,Qwen3-Max-Thinking 的得分为 58.3,GPT-5.2-Thinking 的得分为 45.5,这是目前所有机型中的最高分,明显高于 Gemini 3 Pro 的 45.8 分。对于下一代智能代理,Qwen3-Max-Thinking 也显着提高了原生代理自主调用工具的能力。关于Qwen3-Max-Thinking 的最新发展,在“星计算智联”上2026年1月26日,在中国信息通信研究院举办的空间算力研讨会上,国星航天执行副总裁王亚波先生表示,2025年11月,国星航天将在“星计算”计划空间计算中心01组部署黔文Qwen3大型模型,并透露其已成功引入卫星,这将是全球首次将大型通用模型植入卫星。从地球轨道运行并部署在n 轨道。随后,Qianwen的大型模型成功在太空中执行了多个端到端推理任务。这些问题从地球上传到卫星,大模型在轨道上完成推理,并将结果数据传输到地球。整个过程不到2分钟。此前,根据全球最大AI开源社区HuggingFace的最新数据,阿里巴巴钱文衍生的模型数量超过20万个,成为全球首个实现这一目标的开发者。买一个大模型。同时,Qianwen模型系列下载量已超过10亿次,平均每天下载次数达110万次,完全超越美国Llama,作为大型开源模型绝对稳居全球第一。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。仅限此平台提供信息存储服务。
请注意:以上内容(包括图片和视频,如有)可能无法在社交媒体平台上找到,由网易号用户上传和发布,网易号仅提供信息存储服务。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注