淘宝首次透露全模态大模型进展,并公布AIGX技术体系多项技术突破

电商派
2025-10-24 15:01

10月24日,阿里巴巴中国电商事业群首席科学家、技术总裁郑波在CNCC2025大会上,首次透露淘宝全模态大模型最新进展,并系统介绍了多模态智能在淘宝AIGX技术体系的研究和应用,包括多模态生成、生成式推荐(AIGR)、AI Agent等多项最新技术突破。

郑波指出,从过去两年多的发展来看,AI处理问题的复杂度每年以5-10倍速度增加,而AI的错误率每年降低50%,模型inference(推理)的成本每年也降低一个数量级,按照这一发展趋势,狭义AGI(在多数开放环境任务完成度超过95%的人类)将在未来5至10年之间实现。淘宝自2003年上线以来,始终坚持技术发展和商业变革双向驱动,在新的AI时代,多模态智能将是“万能的淘宝”最重要的技术域。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

据介绍,淘宝的全模态大模型“TStars-Omni”,支持输入文本、图像、视频、音频,输出文本和音频,极大程度的对齐了人类感官。该模型在模型基座、视觉编码器、音频理解、语音合成等方面进行了深度优化,实现体量小、吞吐快的显著优势显著,性能处于领域第一梯队,并通过全面的商品理解,满足用户深层次推理需求。比如,用户输入冰箱和厨房平面图两张图片后提问:“我可以把这个冰箱放进我的厨房吗?”TStars-Omni模型对图片进行分析推理后回答:“无法直接嵌入”,并给出建议和提醒。

在多模态生成方面,淘宝推出视频生成模型的升级版——淘宝星辰·视频生成模型3.0。该模型采用了更紧凑的16x16x4时空压缩VAE,在大幅增加DIT参数的情况下,保持推理的高效。高品质、类别平衡的训练数据,搭配大幅提升的语义理解模块,使得模型动作更加灵动,语义更精确,画面更原生。

郑波现场演示了多模态生成技术在电商场景中的应用。商家只需提供一件连衣裙的平铺照片,系统将匹配生成一个虚拟模特,之后生成多张模特穿着此连衣裙的、在不同场景的摆拍照片;进一步的,视频生成模型可将照片生成为视频片段,并根据首尾帧生成视频转场,再生成虚拟模特讲解视频之后,多模态剧本生成和自动剪辑技术将全自动的制作出一条完整的带货视频,大幅降低了商家的内容制作成本。

据悉,多模态智能已经在淘宝AIGX技术体系发挥着越来越重要的作用。淘宝自研的推荐大模型“RecGPT”已全面接入手机淘宝首屏“猜你喜欢”信息流。这款百亿参数的多模态大模型,能对10万量级的上下文进行总结,理解长达十年的用户信息,全模态认知数亿商品,并结合世界知识进行推理。数据显示,搭载RecGPT的推荐信息流实现用户点击量增长超16%,用户加购次数和停留时长均提升超5%。

此外,郑波还介绍了近期发布的AI Agent——iFlow CLI。iFlow CLI支持命令行、IDE插件和Agent SDK等多种使用方式,提供完全免费的国产模型市场,涵盖编程、广告创意、学术写作、攻略制定、流程图绘制等多个应用场景,面向个人用户永久免费开放。

特别值得一提的是,为向业界共享AIGX技术体系创新能力,淘宝近期陆续开源了强化学习训练框架ROLL和生成式预估训练框架RecIS,通过强化学习和深度学习的大模型训练完整框架,打通从小模型到超大模型的训练落地路径,为推荐系统结合多模态大模型训练提供技术支撑。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
10月25日消息,阿里巴巴中国电商事业群首席科学家、技术总裁郑波在CNCC2025大会上,首次透露淘宝模态模型最新进展,并系统介绍了多模态智能在淘宝AIGX技术体系的研究和应用,包括多模态生成、生成式推荐 、AI Agent等多项最新技术突破。郑波指出,淘宝自2003年上线以来,始终坚持技术发展和商业变革双向驱动,在新的AI时代,多模态智能将是“万能的淘宝”最重要的技术域。
9月12日消息,淘宝今日正式面向所有淘宝天猫商家量上线退货宝服务。据悉,“退货宝”将为商家至少降低10%的退货成本,最高甚至可实现30%的成本直降。此外,据淘宝测算,退货宝上线后,全年预计为商家降本规模至少为20亿元,商家的综合平均降幅将达20%,困扰商家的退换货成本压力有望迎来系统性缓解。今年以来,淘宝天猫已经推出了多项惠商降本举措,优化营商环境。
3月27日消息,淘天集团发文称,从今天开始,淘宝平台启动AI假图治理,严厉打击利用AI假图欺骗消费者、侵害原创品牌商家的违规行为。淘宝规定,商品图片应以商品实拍图作为核心的效果体现,修饰行为应当适度,避免失真。严禁利用AI等技术合成方式,呈现显著失真的与实际不符的商品信息效果图。
8月8日消息,阿里妈妈全新一站式营销投放系统——万相台无界版今日正式发布。据介绍,该产品打通淘宝渠道资源,合并多平台账户和资金,同时结合全域AI和模型能力为品牌商家在人群、货品和内容经营上带来全新的投放体验和经营思路。未来,品牌商家可以通过该产品实现全域视角简单经营,目前该产品已开放迁移报名。
一位接近淘宝业务的人士透露,“半年的测试情况显示,接入微信支付对于淘宝获取低线城市用户是有效的。”
近日,淘宝直播推出了托管服务,为有意入淘开播的明星、KOL、MCN机构提供从账号冷启动、官方货盘支持到营销策划的“保姆式”运营服务。而淘宝直播此时推出的托管,将成为2024年行业最大的红利。对MCN机构来说,对于头部主播的腾挪空间已经有限,因此,他们开始把目光从第一梯队转向第二、第三梯队的中腰部主播。近日有观点认为,淘宝做直播托管,有既做裁判又做运动员之嫌。
又有顶流入淘,这次是“雪姨”王琳。今年2月,淘宝成立电商直播公司,为新入淘主播提供为期半年的“托管”服务,帮助新主播适应平台规则玩法。托管服务已吸引超过三千名明星、达人加入淘宝直播;过去两个月,新入淘主播数量同比增长近10倍。4-5月之间,将有更多“托管”主播迎来首播。