时间: 2025-04-18 17:22:25 | 作者: 客户案例
2025年1月29日清晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式对外发布。新模型展现出极微弱的归纳功能,在多项揭露干流模型评测基准上录得高分,全面逾越了现在全球抢先的开源MoE模型以及最大的开源稠密模型。与此同时,阿里巴巴美股股价在当天收盘前半小时呈现明显上涨,涨幅1%快速拉升至6.7%。
1月29日清晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式对外发布。据微信大众号“阿里云”音讯,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新效果,预练习数据逾越20万亿tokens。新模型展现出极微弱的归纳功能,在多项揭露干流模型评测基准上录得高分,全面逾越了现在全球抢先的开源MoE模型以及最大的开源稠密模型。
当天,阿里巴巴美股股价在收盘前半小时呈现明显上涨,涨幅由1%快速拉升至6.7%。按市值核算,阿里巴巴市值单日市值增加143.62亿美元。
日前,我国AI企业深度求索(DeepSeek)发布其最新开源模型DeepSeek-R1,用较低的本钱达到了接近于美国敞开人工智能研讨中心(OpenAI)开发的GPT-o1的功能。这一发展破解了全球AI工业长时间以来“堆算力”的途径依靠,其影响涉及了长时间资金商场。就我国A股商场来看,1月27日,WindDeepSeek协作商指数大涨了10.96%,多只成分个股涨幅逾越10%。
当下,国内外厂商在开闭源道路上各有偏重。比方OpenAI的GPT-4模型选用闭源形式,而Meta挑选彻底开源。而DeepSeek和阿里云通义团队都是开源道路的坚持者。
DeepSeek的成功也被认为是开源模型的成功。图灵奖获得者、Meta 首席AI科学家 Yann LeCun此前表明,关于DeepSeek的成功,其正确的了解应该是:开源模型正在逾越专有模型。
LeCun 表明,DeepSeek 之所以这次一举成名,是由于他们从敞开研讨和开源(如 Meta 的 PyTorch 和 Llama)中获益。DeepSeek 提出了新主意,并在别人作业的基础上构建。由于他们的作业是揭露发布和开源的,任何一个人都可以从中获益,这便是敞开研讨和开源的力气。
阿里集团CEO吴泳铭也曾表明,“通义的开源模型在中文国际的开发者运用广泛,当开发者运用阿里云的开源模型,需要把使用布置到线上的时分,就会自然而然地选用阿里云的服务。”
而继DeepSeek之后,Qwen2.5-Max的发布无疑是我国AI阵营在高功能、低本钱技能道路上的又一重要打破。有商场人士剖析称,此前过度聚集DeepSeek,却忽视了包含阿里通义在内的我国AI整体性追逐。
值得一提的是,就阿里云而言,其还有强壮模型+足够算力+完好云渠道的组合优势,或有望引发DeepSeek之后的我国AI财物新一轮重估。