1. 3月27日消息,通义千问发布并开源首个端到端模态模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,维度远超Google的Gemini-1.5-Pro等同类模型
  2. 腾讯自研大模型“混元”要发力“模态”。
  3. 5月25日消息,据钛媒体,基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice,最快今年6月上线腾讯元宝App,从而与豆包AI视频通话功能对抗。而且,腾讯已规划多模态模态路线,最快今年将推出全球首个“模态模型”,代号为混元-O,瞄向“世界模型”。
  4. 快手基于自研大语言模型的「快手AI对话」已经于8月8日开启内测。
  5. 4月2日消息,全球最大的AI开源社区Hugging Face更新了大模型榜单,阿里通义千问近期开源的端到端模态模型Qwen2.5-Omni登上总榜榜首,DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后,杭州公司霸榜全球开源模型榜单三。
  6. 8月23日消息,程一笑在快手二季度财报电话会上表示,研发团队正在按计划推进大模型的开发和训练。目前,快手自研的大语言模型“快意”已开启内测,并为业务团队提供了标准API和定制化项目合作方案。基于目前在大模型方面的技术积累,快手已经实现了多个应用场景的落地。快手打造了模态模型AIGC的解决方案。
  7. 8月10日消息,在快手光合创作者大会上,快手AI、用户增长业务负责人王仲远展示了模态、大模型AIGC解决方案和AIGC数字人产品快手智播,还首次正式公布了大模型方面的进展。
  8. 8月10日消息,据报道,在快手光合创作者大会上,快手今日首次正式公布大模型方面的进展,快手AI、用户增长业务负责人王仲远展示了模态、大模型AIGC解决方案和AIGC数字人产品“快手智播”。此外,该公司“快手智播系统”软件著作权已于今年2月获得登记批准,当前版本号为V1.0。
  9. 2月29日消息,在阿里云2024年战略发布会上,阿里云资深副总裁、公共云业务总裁刘伟光表示,今天阿里云能够为大模型AI创新提供三方面能力,一是建模型,帮助客户实现大模型的推理和训练,二是凋模型,通过阿里云百炼定制行业大模型,三是用模型,通义大模型家族凭借模态等能力可以适用不用场景。
  10. 11月21日消息,在世界互联网大会乌镇峰会上,阿里云“模态尺寸的通义开源大模型”被评为2024中国互联网企业创新发展典型案例,成为唯一入选的开源大模型成果案例。据悉,通义Qwen是全球领先的大模型,多次登顶国内外权威大模型榜单,全球范围内基于Qwen的衍生模型数逾7.8万个,Qwen已成为全球规模最大的生成式模型群。
  11. 6月21日消息,华为盘古大模型5.0发布,提供三个方面升级:提供场景全系列大模型;升级多模态能力,比如增加10K分辨率图像理解能力;强思维能力。
  12. 6月20日消息,中金公司日前发布研究报告表示,微盟已发布基于第三方大模型和自有模型研发的AI应用产品WAI,该产品可提供多交互形态、经营场景覆盖和兼具多模态能力的商业化智能方案。此外随着微盟经营质量稳步提升,广告业务恢复强劲,业务布局全面升级。中金公司认为微盟业务经营及财务结构趋于健康,中长期配置价值渐显,中金公司给予微盟跑赢行业评级。
  13. 4月1日消息,顺丰同城宣布在业务的各个环节推进运营数字化和AI决策智能化,建立起更适配即时配送领域的大模型基座,应用大模型技术面向场景业务和生态链参与者。据介绍,依托DeepSeek的开源生态及多模态AI能力,顺丰同城实现快速定制化开发,精准匹配不同客户的差异化需求,显著缩短项目落地周期。目前,除了DeepSeek,顺丰同城已与火山豆包、腾讯混元等国内多个厂商达成合作,通过多个大模型对比验证,持续优化AI应用效果。
  14. 2月26日消息,Gartner®发布GenAI新兴市场象限Emerging Market Quadrants (eMQ),阿里云获评全部GenAI 4大细分市场新兴领导者。阿里云称,此次入选代表着阿里云覆盖尺寸、多模态、自研、开源的丰富模型供给以及完善的模型及应用开发工具链获得了认可。
  15. 10月25日消息,京东云事业部总裁曹鹏在“2023京东供应链金融科技大会”上表示,今年京东80%的系统都完成了国产化替代。曹鹏称,“我们认为大模型不应该只是一个玩具,应该创造更多的产业价值,应该在营销、投放、交互等各方面提升”。其介绍道,如今的言犀多模态数字人可以覆盖场景的产品服务,也开发了计算平台,是为了让大模型更普惠。
  16. 6月24日消息,饿了么骑手AI助手“小饿”已在全国上线。也就是说,即日起,全国数百万众包蓝骑士都有了自己的智能AI助手。AI“小饿”是国内首个面向外卖小哥的AI服务工具,今年4月开始在四个城市试点。AI“小饿”基于大模型技术,依托自然语言处理、多模态交互及实时数据分析能力,通过语音交互与智能响应,为骑手提供阶段、多维度的系统陪伴和辅助服务,从接单到完单全面覆盖骑手的外卖配送场景。
  17. 据“AI科技评论”公众号,胡瀚不久前加入腾讯,接替已离职的腾讯混元大模型技术负责人之一的刘威,负责多模态模型的研发工作。
  18. 京东集团副总裁梅涛成立生成式AI公司HiDream.ai,方向是生成式视觉多模态基础模型与应用。
  19. 据36氪从多个独立信源处获悉,快手MMU负责人李岩在2022年下半年成立了AI公司“元石科技”,主要进行多模态模型的研发。
  20. 12月18日消息,在火山引擎Force大会上,字节跳动正式发布豆包视觉理解模型,为企业提供极具性价比的多模态模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。