该轮到梁文锋出手了

李迎
2025-04-29 21:02

 新一轮中美科技大战迫在眉睫。

一、大模型扎堆更新,AI大战风暴将至

最近这段时间,大模型领域又出现了爆发式更新。

各大科技巨头纷纷亮出自己的王牌,大模型的更新如同雨后春笋般涌现,一场关于智能、效率和成本的较量即将拉开帷幕。

百度在上周的Create 2025大会上可谓是动作频频,风头无两。

百度创始人李彦宏高调宣布开源文心4.5系列,并毫不避讳地直指DeepSeek“慢又贵”。在他的介绍下,百度的新模型在性能和成本上才是真正实现了质的飞跃。

图片

图源:微博

事实上,在过去的一个月中,百度已经连续发布了多款大模型,例如文心大模型4.5 Turbo、深度思考模型X1 Turbo……

其中,文心4.5 Turbo模型在多模态基准测试成绩上已经追平了DeepSeek,并且还在API调用价格方面做到了DeepSeek的40%,详细的介绍可以去看上一篇《李彦宏炮轰DeepSeek,百度AI才是未来》。

图片

图源:小红书

而就在今天凌晨,阿里巴巴紧随其后,发布了新一代通义千问模型Qwen3

阿里云方面宣称,Qwen3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,参数量仅为DeepSeek-R1的三分之一,但性能却全面超越了R1以及OpenAI的o1等全球顶尖模型。这一消息无疑再次让科技圈为之震动。

据官方介绍,Qwen3采用了混合专家(MoE)架构,总参数量达到235B,但激活仅需22B,预训练数据量高达36T。

通过多轮强化学习,Qwen3将非思考模式无缝整合到思考模型中,实现了简单需求的低算力“秒回”和复杂问题的多步骤“深度思考”。

这种“推理/非推理”二合一的设计,不仅提升了模型的智能水平,还大幅降低了算力资源消耗。

图片

图源:观察者网

并且在性能方面,Qwen3在推理指令遵循工具调用多语言能力等多个维度都创下了新的纪录。

例如,在奥数水平的AIME25测评中,Qwen3斩获81.5分,刷新了开源纪录;在代码能力测试中,Qwen3也表现不俗,突破了70分大关……

此外,如前文所说,Qwen3的部署成本极低,仅需4张H20显卡即可部署满血版,显存占用仅为性能相近模型的三分之一。

阿里云还提供了丰富的模型版本,从30B到235B的MoE模型,再到0.6B到32B的密集模型,每款模型都实现了同尺寸开源模型的最佳性能。

图片

图源:观察者网

与此同时,OpenAI也在悄然发力。

近日,OpenAI又一次更新了GPT-4o模型,其CEO奥特曼亲自介绍,更新后的GPT-4o在智力个性方面有了显著提升。

更新后的模型不仅优化了记忆保存时间,还增强了在STEM领域的问题解决能力。新GPT-4o还在响应方式上进行了改进,能够更主动地引导对话,输出更有效的结果。

图片

图源:X平台

另一方面,根据数据显示,目前GPT-4o在LMArena排行榜上已经上升至第二名,而DeepSeek上一次更新的V3新模型,已经下滑至第7名。

图片

图源:X平台

种种背景的加持下,许多从业者的目光已经不自觉地聚焦在了一个人身上——梁文锋

作为DeepSeek的创始人,梁文锋在过去的一年中凭借多款模型在全球AI市场中一鸣惊人。然而,随着国内外科技巨头的相继发力,圈内外都在期待梁文锋的下一次出手,期待DeepSeek又将会带来一个怎样“惊天动地”的更新。

从目前的消息来看,梁文锋应该不会让大家失望。

二、“旧世界分崩离析,新时代正在光速到来”

在AI领域,梁文锋的名字已经成为了一个传奇。

2025年开年,DeepSeek“燃爆”了整个AI圈,其发布的R1模型凭借超低的训练成本和卓越的性能,迅速在全球范围内引起了轰动。

而迄今为止,距离R1模型正式发布已经过去了整整99天,马上就要超百日。这99天,对于DeepSeek来说,是辉煌的起点,也是新的挑战的预热。

图片

图源:中国企业家杂志

2025年1月20日,DeepSeek R1大模型正式发布。而在R1发布之前,DeepSeek团队已经经历了无数次的实验和优化。梁文锋和他的团队深知,要在这个竞争激烈的AI市场中脱颖而出,必须要有独特的优势和创新的技术。

在招人过程中,梁文锋的团队展现了极高的标准和独特的理念。梁文锋对人才没有标签,不论学历背景,不论过往业绩,他只看这个人的个人能力和个人素质。

这种人才观,让DeepSeek的团队成员不仅具备强大的技术能力,更有着对AI的热情和创新精神。

梁文锋曾经说过:“我们招人的原则是看能力,而不是看经验。如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性与热爱等更重要。”

此外,梁文锋对AI和公司的思考,也贯穿了整个R1模型的研发过程。

他认为,语言大模型是通往通用人工智能(AGI)的关键路径。因此,DeepSeek专注于基础研究,而不是急于开展应用开发。

梁文锋坚信,通过不断优化和创新,语言大模型可以逐步实现类人的人工智能。这或许也是DeepSeek如今仍在语言类大模型这条路上走到黑的原因。

但无论怎样,随着时间的推移,距离DeepSeek上一次推理模型的更新时间越来越长,外界对R2模型的期待也越来越高。

图片

图源:微信

此前,DeepSeek曾表示R2模型会在今年年内推出,但否认了前段时间宣称5月甚至4月底会上线的传言。尽管如此,外界对R2的期待并未减少。

许多业内人士认为,R2模型将是DeepSeek的又一力作,有望在性能和功能上实现更大的突破。

据了解,DeepSeek公司目前对外界的各种传言采取不予理睬的态度,更多的是专注于自己的研究当中。梁文锋和他的团队深知,只有通过不断的技术创新和优化,才能在激烈的市场竞争中保持领先地位。

在DeepSeek的崛起过程中,OpenAI一直是其主要竞争对手之一。

然而,国外多家媒体近期却纷纷表示,OpenAI给梁文锋的压力还不够,所以梁文锋才能一直高枕无忧地做自己的事,而不用考虑过多的去对外宣传自己的新模型。

他们认为,OpenAI在面对DeepSeek的快速崛起时,似乎显得有些力不从心,这种感觉美国的AI公司此前几乎从未有过。

不过,OpenAI并未如他们口中所说的那么不堪,可能正应了那句话“瞧不起的往往是自家人”

实际上,OpenAI近期只是换了打法,更专注于DeepSeek从未涉及的文生图领域。

目前,OpenAI的GPT-4模型在文生图领域可谓是一马当先,其能力也得到了国外众多用户的验证,并且还能驾驭格式各样的风格。

图片

图源:ChatGPT生成图片

随着ChatGPT带来更多的震撼,美国硅谷已经出现一些“文生图和文生视频领域将是未来AI发展的新方向”类似的声音。

因此,外界同样在期望DeepSeek文生图、文生视频大模型的出现。但这个愿望可能不太容易被实现。

梁文锋曾经表示:“我们不会过早设计基于模型的一些应用,会专注在大模型上。从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。”

如今,摆在梁文锋面前的现实是,美国政府正在限制英伟达H20芯片等高端芯片向中国出口,而这正是绝大部分AI公司发展的“地基”。

此外,伴随着关税政策不断变化,贸易全球化的大势正在遭受美国单方面的削弱,这也很可能增加DeepSeek团队的研发成本。

因此,在重重压力的考验下,聚光灯下的梁文锋能否带领团队冲破枷锁,让中国AI再次对世界发出震耳欲聋的咆哮,成为了国内外不少人心中的挂念。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月19日消息,在腾讯年报沟通会中,腾讯CEO马化腾表示,AI的智能化程度相比往年有大幅度提升,对于腾讯来说经过慎重思考,云业务和元宝都拥抱了DeepSeek。未来应用大发展的机会已经到来,各家都在采用AI落地,也看到AI Agent(智能体)的发展,背后有很多AI相关工具的想象空间。目前AI生态还在早期,各行各业都会受益于AI普及,相信每个行业都会拥抱这个机会。
6月14日消息,昨日上午,携程集团与AR公司台正式签署战略合作协议,部署旅行业在元宇宙中的运用与创新,共同打造智慧旅游新产品、新模式,挖掘旅游元宇宙价值与应用。携程集团副总裁王韦、台联合创始人&董事长兼CEO廖春元出席签约仪式并圆满完成签约。据悉,此次双方加深合作,将充分释放各自优势,开发旅游数字化产品,发展强交互、强沉浸的新型旅游服务,让AR/AI创新技术深度赋能旅游产业。
7月25日消息,“全球好生意,AI外贸新商机”阿里巴巴国际站暨临沂商城新商家培训会近日举行,培训会旨在推动临沂商城的国际化进程,提升商家的外贸能力和市场竞争力。培训会的第二阶段由阿里巴巴国际站讲师季国和北方大区全行业招商负责人刘主讲。他们分别从外贸流程、外贸行业趋势解读等方面为参会者带来了精彩分享。据了解,临沂市2023年跨境电商进出口额达216亿元,市场交易额与物流总额亦创新高。
12月5日消息,百度副总裁、AI创新业务负责人薛苏在2024百度热AI营销大会表示,百度旗下新搜索小言计划接入更多生活服务类功能,预计明年可覆盖法律、票务、电商等30余行业。小言具备富媒体搜索、多模态输入、文本与图片创作、高拟真数字人、记忆和自由订阅等能力,累计调用超35亿次,月活用户破千万。目前,仅法律、票务、电商相关,小言每月就有超5000万次的用户问询。
9月4日消息,百度今日官宣文心一言App正式升级为小言,定位百度旗下“新搜索”智能助手。在媒体沟通会上,百度副总裁、AI创新业务负责人薛苏透露,小言MAU已超千万,2024年Q2累计调用达到20亿次,季环比增速超过70%。
4月10日消息,在2023春季发布会上,有赞上线了数据集成平台有赞iPaaS,以及由大模型驱动的首个AI产品“加我智能”。据介绍,加我智能目前主要支持图文推广和活动策划大场景,它可以生成推广推,能够清晰理解活动目的并自动跨产品和功能生成营销活动。有赞创始人兼CEO白鸦表示,未来,加我智能还将陆续具备报告分析、销售加强、售后客服、商品制作、店铺设计等能力。
3月12日消息,天眼查官网显示,北京硅基流动科技有限公司近日发生工商变更,北京智谱华章科技有限公司退出股东行列,新增美团旗下天津三快科技有限公司以及北京星鼎森股权投资基金合伙企业(有限合伙)、南京绿涌锦航股权投资管理合伙企业(有限合伙)、中小企业发展基金普华(杭州)创业投资合伙企业(有限合伙)为股东,注册资本由约1375.8万人民币增至约1512.4万人民币,同时,部分主要人员也发生变更。硅基流动是一家生成式AI计算基础设施平台提供商,产品涵盖大语言模型推理引擎、高性能生图/视频等产品。
今日,有用户发现携程APP首页上线了“携程星期三”专题页面,AI人物“小章”作为官方代言人将于今晚10点正式出道。
6月15日消息,据品橙旅游消息,今日,有用户发现携程APP首页上线了“携程星期三”专题页面,覆盖BOSS直播、超级品牌日、超级周边游等多个板块。同时,以萌趣形象出现的AI人物“小章”成为了“携程星期三”官方代言人。未来每周三,“携程星期三”将以持续的BOSS直播推荐、跟着榜单买等内容和产品输出,限时秒杀、硬核补贴、限时低价等活动产出,为用户种草旅游尖货。
携程集团联合创始人兼董事局主席建章昨日晚上携新书《人口战略》做客《老俞闲话·致远见者》直播间。
李迎
你好,我是李迎