1. 阿里巴巴达摩院公开一项“训练服务系统及基于训练服务系统服务提供方法”专利。
  2. 8月8日消息,天眼查App显示,近日,网之易信息技术 有限公司申请注册“网易言”商标,国际分类为网站服务,当前商标进度为申请中。据此前媒体报道,“言”为网易伏羲实验室推出的中文训练大模型,其相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
  3. 7月7日消息,近日,国际权威研究机构Gartner公布《云AI开发者服务关键能力报告》,围绕语言AI、计算机视觉、机器学习平台三大维度,对全球云AI服务厂商进行评估排名。最终,阿里总分位居第二。Gartner报告显示,阿里云在该领域为开发者提供了1600多种模型服务,在大规模训练语言模型的实力强劲,并在数字人、手语翻译等领域取得了一系列进展。
  4. 混元大模型参数规模超干亿,训练语料超2万亿tokens,已经在腾讯云、腾讯广告、微信搜一搜等多个腾讯内部业务和产品经过测试,同时也服务产业场景。
  5. 6月23日消息,高盛发布研究报告称,给予腾讯控股“买入”评级,目标价443港元。该行指出,腾讯推出大规模模型即服务产品,提供涵盖模型训练、微调和智能应用开发的一站式行业大模型解决方案。该产品是中国大型互联网公司迈出关键的一步,相信通用模型和行业模型将相互补充,使企业客户能够针对每个特定场景选择最佳选择,能够跨场景执行各种复杂任务或采用组合方法的参数。
  6. 6月30日消息,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现训练权重和推理代码的完全开源。目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。
  7. 5月14日消息,天眼查资料显示,近日,小米科技有限责任公司申请注册多枚“XIAOMI MIMO”商标,国际分类为运输工具、科学仪器、通讯服务等,当前商标状态均为等待实质审查。公开信息显示,Xiaomi MiMo是小米首个推理大模型,联动训练到后训练,全面提升推理能力,于2025年4月30日开源。
  8. 4月19日消息,北京市朝阳区卫健委日前与阿里云签署战略合作协议,将依托阿里云百炼平台,开展高质量医疗大模型训练,打造朝阳区专属医疗大模型,致力于实现区域智能分诊分流、AI问诊、诊前就诊等新医疗服务模式,并通过开放API接口,加速AI医疗应用开发与部署。基于这一合作,双方将打造4大“AI+”医疗场景创新:AI+医疗服务、AI+数字运营、AI+管理协同、AI+医学影像。
  9. 1月18日消息,天眼查资料显示,1月17日,百度智行科技 有限公司成立,法定代表人为聂仁,注册资本1000万人民币,经营范围含通信设备销售、移动终端设备销售、人工智能基础软件开发、物联网应用服务、小微型客车租赁经营服务、新能源汽车整车销售、充电桩销售、集成电路芯片设计及服务等。股东信息显示,该公司由北京百度智行科技有限公司全资持股。
  10. 8月31日消息,企查查信息显示,近日,苏州太微电子有限公司发生工商变更,新增股东湖北小米长江产业基金合伙企业 ,同时公司注册资本由778.13万元人民币增加至812.24万元人民币。资料显示,太微电子是一家车载核心通讯芯片研发商,致力于有线通讯物理层芯片的研发。该公司成立于2017年,法定代表人为欧阳宇飞,经营范围包含:电子、汽车、工业自动化、计算机领域的技术开发、技术咨询、技术服务、技术转让等。
  11. 今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入训练对话模型,在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果。
  12. 阿里巴巴达摩院公开一项“训练语言模型的训练方法、装置、计算机设备和介质”专利。
  13. 6月14日消息,腾讯RoboticsX机器人实验室公布了智能体研究的最新进展,通过将前沿的训练AI模型和强化学习技术应用到机器人控制领域,让腾讯机器狗Max的灵活性和自主决策能力得到大幅提升。
  14. 6月15日消息,搜狗创始人王小川创立的百川智能公司,宣布推出了70亿参数量的中英文训练大模型——baichuan-7B。目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。据介绍,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。
  15. 3月3日消息,阿里巴巴与清华大学联合发布中文多模态训练AI模型M6。据介绍,训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
  16. 滴滴关联公司北京嘀嘀无限科技发展有限公司9月3日公开一项“音频数据的训练、模型训练方法、装置、设备及介质”专利。
  17. 今天,阿里巴巴达摩院深度语言模型体系AliceMind发布中文社区首个表格训练模型SDCUP。
  18. 11月8日消息,今日,阿里巴巴达摩院公布多模态大模型M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI训练模型。同时,M6做到了业内极致的低碳高效,使用512 GPU在10天内即可训练出具有可用水平的10万亿模型。相比去年发布的大模型GPT-3,M6实现同等参数规模的能耗仅为其1%。
  19. 6月10日消息,据通义大模型微信公众号,阿里巴巴通义实验室发布并开源了MaskSearch训练框架,让AI学会“主动搜索+多步推理”,从而更准确、更智能地回答复杂问题。
  20. 1月12日消息,日前,阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型训练模型“文汇”,旨在探索解决当前大规模自监督训练模型不具有认知能力的问题。“文汇”也是目前我国规模最大的训练模型。据了解,该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。