- 字节跳动开源大模型训练框架veGiantModel近日,字节跳动应用机器学习团队开源名为veGiantModel的大模型训练框架,主要应用于自然语言处理领域的大模型训练。2022-03-17 17:59:00
- 阿里通义实验室开源检索增强预训练框架MaskSearch6月10日消息,据通义大模型微信公众号,阿里巴巴通义实验室发布并开源了MaskSearch预训练框架,让AI学会“主动搜索+多步推理”,从而更准确、更智能地回答复杂问题。2025-06-10 14:11:50
- 蚂蚁集团成立天象安全实验室天象安全实验室重点针对大模型供应链安全,包括模型训练、微调、部署、运维的完整生命周期内涉及到的三方库、插件、框架等问题。2024-06-24 16:17:20
- 淘宝“星辰”大模型亮相 布局电商和生活服务场景3月21日消息,淘宝天猫集团自研大模型“淘宝星辰”官网已经上线,这也是淘天集团公开的首个自研大模型。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录/注册”入口,或将在不久对外开放。据悉,星辰大模型基于Transformer架构,采用半自研的Megatron-ama框架进行训练,从海量电商消费数据和公开数据中持续学习,提供电商和生活服务场景增强的文案生成、多轮会话、知识问答、智能决策等能力。2024-03-21 14:22:12
- 华为胡厚崑:支持中国移动九天大模型的适配和迭代开发10月12日消息,在今日举办的2023中国移动全球合作伙伴大会上,华为轮值董事长胡厚崑表示,将与中国移动进行深入合作,一是共同构建领先的算力基础设施,华为将发挥云计算、存储、网络能源的综合优势,助力中国移动打造世界领先算力超强、绿色低碳的制造公司。另一方面,将积极打造自主的计算生态,华为将与中国移动一起,通过芯片异构计算架构、AI框架、开发平台等技术持续做突破创新,支持中国移动九天大模型的适配和迭代开发。2023-10-12 12:02:34
- 百度:文心一言尚未注册社交账号,将在3月上线2月9日消息,百度官方发文称,旗下智能聊天机器人“文心一言”尚未注册社交账号,各大平台号称“文心一言”相关的账号均为假冒,将在3月和大家正式见面。近日,百度官宣推出类ChatGPT应用文心一言。百度官方表示,在人工智能四层架构中,有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。知情人士透露,百度旗下的类ChatGPT应用“文心一言”上线后,首站将直接接入百度搜索,包括多答案回复、智能生成等。2023-02-09 22:00:27
- 百度计划3月16日召开发布会 主题围绕文心一言2月28日消息,百度官方宣布,计划于3月16日在北京总部召开新闻发布会,主题围绕文心一言。值得注意的是,这是百度首次明确该产品发布具体日期。届时,百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰将出席。此前2月7日,百度宣布推出类ChatGPT应用文心一言。百度官方表示,在人工智能四层架构中,有全栈布局,包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言位于模型层。2023-02-28 20:34:58
- 腾讯将发布面向大模型训练的自研向量数据库腾讯云将在今日下午正式发布自研向量数据库(Tencent Cloud VectorDB),该数据库面向大模型训练。2023-07-04 10:14:08
- 华为:盘古大模型训练效能已达业界主流GPU的1.1倍7月31日消息,华为云数字文娱AI创新峰会2023日前在上海举行。会上,华为云全球Marketing与销售服务总裁石冀琳表示,今年以来,华为基于大模型的AIGC技术在影视、游戏、音频、动漫等多个领域落地应用,给数字文娱产业带来了可预见的巨大价值。在AI算力层面,华为云以昇腾AI云服务的方式提供给行业客户,单集群2000P Flops澎湃算力。石冀琳表示,华为云能够为客户提供全栈AI服务,盘古大模型3.0包括三层架构,完全契合行业应用大模型需求。2023-07-31 09:09:44
- 字节旗下火山引擎发布大模型训练云平台火山引擎总裁谭待表示,“国内大模型领域的数十家企业,超过七成已经在火山引擎云上”。2023-04-19 04:30:48
- 百度:文生图功能大模型训练使用的是互联网公开数据,符合行业惯例3月23日消息,百度官博发文称,注意到对文心一言文生图功能的相关反馈。在大模型训练中,我们使用的是互联网公开数据,符合行业惯例。2023-03-23 11:15:02
- 字节旗下火山引擎发布大模型训练云平台4月18日消息,火山引擎发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本。同时,火山引擎宣布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。火山引擎总裁谭待透露,“国内大模型领域的数十家企业,超过七成已经在火山引擎云上”。2023-04-18 11:41:00
- 快手在GTC大会发布大模型训练解决方案3月22日消息,近日英伟达GTC大会上,快手公布了大模型训练解决方案。据悉,通过计算通信重叠、异构存储利用、通信资源管控、算子优化等手段,该方案可支持百万级别超长文本训练,并且在训练性能上比sota开源方案快30%以上。2024-03-22 14:04:58
- 字节跳动回应实习生破坏大模型训练:不涉及大模型等业务10月19日消息,字节跳动发布关于“实习生破坏大模型训练”的事实澄清:近期有媒体称“字节跳动大模型训练被实习生攻击”,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为,该实习生已被辞退,公司也将其行为同步给行业联盟和所在学校,交由校方处理。2024-10-19 16:15:48
- 有赞CEO白鸦:将发布基于大模型和垂直模型训练后相关产品白鸦坚信,有了AI的SaaS,就会是十倍以上的效率提升,十倍以上的效果提升。2023-03-29 17:24:55
- 阿里云为地平线端到端智驾大模型训练提供算力支持据了解,地平线的研发数据规模已达到数千PB。为满足海量数据的处理需求,地平线基于阿里云EMR、OSS等技术打造湖仓一体架构,构建“数据流入-存储-挖掘”全链路。依托阿里云万卡智算集群,地平线正在训练端到端智驾模型。2025-04-09 15:27:51
- 阿里云周靖人:阿里云已建立完善的AI大模型训练平台在2023云栖大会现场,阿里云首席技术官周靖人发言指出,除了传统的基础设施服务,正在到来的智能时代,阿里云也再一次在这个时代引领了云计算的发展。2023-10-31 11:46:26
- 阿里云周靖人:阿里云已建立完善的AI大模型训练平台10月31日消息,2023云栖大会现场,阿里云首席技术官周靖人发言指出,“今天整个AI的技术变革正在一个快速的节奏中发展,影响我们社会的方方面面。随着AI变革的发生,智能时代里面云计算的价格、体系也正在发生一系列的变化和创新”。2023-10-31 10:55:53
- 阿里云与昆仑万维将在智算中心建设、大模型训练等领域展开合作在2023阿里云峰会上,阿里云与昆仑万维共同发布战略合作。2023-04-13 15:10:54
- 腾讯云发布大模型算力集群4月14日消息,腾讯云发布面向大模型训练的新一代HCC 高性能计算集群,整体性能比过去提升了3倍。据了解,该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800 GPU,服务器之间采用3.2T互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。2023-04-14 14:05:54