首页
快讯
观察
Toggle theme
阿里达摩院公开“基于
预
训练
服务系统的服务提供方法”专利
2022-05-07 11:47:49
阿里巴巴达摩院公开一项“
预
训练
服务系统及基于
预
训练
服务系统的服务提供方法”专利。
腾讯RoboticsX用
预
训练
模型
和强化学习提升机器狗控制
2023-06-14 15:18:59
6月14日消息,腾讯RoboticsX机器人实验室公布了智能体研究的最新进展,通过将前沿的
预
训练
AI
模型
和强化学习技术应用到机器人控制领域,让腾讯机器狗Max的灵活性和自主决策能力得到大幅提升。
百川智能发布中英文
预
训练
大
模型
baichuan-7B
2023-06-15 17:39:13
6月15日消息,搜狗创始人王小川创立的百川智能公司,宣布推出了70亿参数量的中英文
预
训练
大
模型
——baichuan-7B。目前baichuan-7B大
模型
已在Hugging Face、Github以及Model Scope平台发布。据介绍,baichuan-7B代码采用Apache-2.0协议,
模型
权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用baichuan-7B
模型
推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B
模型
的应用和发展。
滴滴公开“音频数据的
预
训练
、
模型
训练方法”专利
2021-09-06 14:20:14
滴滴关联公司北京嘀嘀无限科技发展有限公司9月3日公开一项“音频数据的
预
训练
、
模型
训练方法、装置、设备及介质”专利。
阿里达摩院实现全球最大AI
预
训练
模型
2021-11-08 15:45:18
11月8日消息,今日,阿里巴巴达摩院公布多模态大
模型
M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级
模型
,成为全球最大的AI
预
训练
模型
。同时,M6做到了业内极致的低碳高效,使用512 GPU在10天内即可
训练
出具有可用水平的10万亿
模型
。相比去年发布的大
模型
GPT-3,M6实现同等参数规模的能耗仅为其1%。
阿里巴巴、智源研究院等联合发布
预
训练
AI
模型
“文汇”
2021-01-12 11:58:42
1月12日消息,日前,阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型
预
训练
模型
“文汇”,旨在探索解决当前大规模自监督
预
训练
模型
不具有认知能力的问题。“文汇”也是目前我国规模最大的
预
训练
模型
。据了解,该
模型
不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
网易申请AI大
模型
玉
言商标
2023-08-08 10:22:03
8月8日消息,天眼查App显示,近日,网之易信息技术 有限公司申请注册“网易
玉
言”商标,国际分类为网站服务,当前商标进度为申请中。据此前媒体报道,“
玉
言”为网易伏羲实验室推出的中文
预
训练
大
模型
,其相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
网易CEO丁磊:人工智能价值已经被引导到了社会生产第一线
2023-04-27 14:30:25
网易目前已自研数十个超大规模
预
训练
模型
,覆盖自然语言等多种
模型
领域。
阿里巴巴发布“通义”大
模型
系列,推动AI从单一智能向通用智能进化
2022-09-02 14:47:13
9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模
预
训练
模型
”主题论坛。
腾讯混元大
模型
正式亮相
2023-09-07 10:01:41
混元大
模型
参数规模超干亿,
预
训练
语料超2万亿tokens,已经在腾讯云、腾讯广告、微信搜一搜等多个腾讯内部业务和产品经过测试,同时也服务产业场景。
阿里推出“通义”大
模型
系列
2022-09-02 14:26:50
9月2日消息,阿里巴巴达摩院今日主办世界人工智能大会“大规模
预
训练
模型
”主题论坛。会上,达摩院副院长周靖人发布阿里巴巴最新“通义”大
模型
系列,并宣布相关核心
模型
向全球开发者开源开放。面向大
模型
通用性与易用性仍欠缺的难题,通义打造了业界首个AI统一底座,并构建了大小
模型
协同的层次化人工智能体系,将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。
阿里云曾震宇:大
模型
等新技术让智能制造场景更加可期
2023-04-28 17:29:55
曾震宇认为,未来在云技术、多模态
预
训练
大
模型
、生成式AI等创新技术的加持之下,智能制造的场景将会愈加清晰和可期。
小米开源首个推理大
模型
Xiaomi MiMo
2025-04-30 11:47:12
4月30日消息,小米开源首个为推理(Reasoning)而生的大
模型
“Xiaomi MiMo”,联动
预
训练
到后
训练
,全面提升推理能力。
拉勾招聘上线AI智能招聘助手产品“HRMind”
2023-07-20 10:02:34
7月20日消息,拉勾招聘宣布上线AI智能招聘助手产品“HRMind”,这是在招聘行业内首个基于
预
训练
大
模型
实现广泛应用的招聘场景产品。据介绍,HRMind可处理对话聊天、智能问答等多轮交互沟通。未来,该产品还将实现帮助HR模拟面试、分析求职者简历等功能。
阿里云宣布启动全球最大智算中心
2022-08-30 15:35:01
8月30日消息,阿里云宣布全面开放旗下智能计算平台“飞天智算”,并正式启动张北、乌兰察布两座超大规模智算中心。在云端,张北智算中心支撑AI
预
训练
大
模型
、AI Earth、数字人等前沿AI应用,将成为全球最大的智算中心。通过先进的技术架构,飞天智算平台实现了90%的千卡并行计算效率,可将算力资源利用率提高3倍以上,AI
训练
效率提升11倍,推理效率提升6倍。
阿里达摩院人工智能科学家杨红霞离职
2022-10-11 14:32:26
10月11日消息,Tech星球独家消息称,阿里达摩院大
模型
带头人杨红霞已于9月初离职,杨红霞是人工智能科学家,也是超大规模多模态
预
训练
模型
M6的技术负责人。此次杨红霞离职,被认为是达摩院对一些难以落地的商业化项目进行调整。据了解,杨红霞曾带领团队获2019世界人工智能大会最高奖卓越人工智能引领者,2020年国家科学技术进步奖二等奖。在今年,杨红霞也获得2022年福布斯中国科技女性50强的荣誉。
猎聘ChatGPT相关领域报告:人工智能职位平均年薪33.15万元
2023-02-20 15:15:09
2月20日消息,猎聘大数据研究院推出《ChatGPT相关领域就业洞察报告》,解析人工智能领域的就业趋势,以及与ChatGPT密切相关的三个分支领域——
预
训练
模型
、对话机器人和AIGC 的人才需求情况。数据显示,猎聘大数据研究院以2018一季度为参照点(基数),此后至2022年,以各季度的人工智能、互联网新发职位数与2018一季度新发职位数相除得到结果:五年来,互联网人才需求增长趋势平缓,人工智能人才需求在2020年之后整体迅速上升。
高盛:予腾讯控股“买入”评级 目标价443港元
2023-06-23 15:39:53
6月23日消息,高盛发布研究报告称,给予腾讯控股“买入”评级,目标价443港元。该行指出,腾讯推出大规模
模型
即服务产品,提供涵盖
模型
预
训练
、微调和智能应用开发的一站式行业大
模型
解决方案。该产品是中国大型互联网公司迈出关键的一步,相信通用
模型
和行业
模型
将相互补充,使企业客户能够针对每个特定场景选择最佳选择,能够跨场景执行各种复杂任务或采用组合方法的参数。
度小满发布“轩辕70B”金融大
模型
2023-09-22 16:55:20
9月22日消息,度小满今日宣布“轩辕70B”金融大
模型
开源,所有用户均可自由下载和试用。据介绍,本次发布的新版大
模型
相较上一个版本能力全面提升:在增量
预
训练
和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在
预
训练
阶段,“轩辕70B”的
模型
上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
阿里云开源通义千问720亿参数
模型
2023-12-01 10:36:04
12月1日消息,在通义千问发布会上,阿里云开源通义千问720亿参数
模型
Qwen-72B、18亿参数
模型
Qwen-1.8B及音频大
模型
Qwen-Audio。据悉,阿里云本次开源的
模型
中除
预
训练
模型
外,还同步推出了对应的对话
模型
,面向72B、1.8B对话
模型
提供了4bit/8bit量化版
模型
,便于开发者们推理
训练
。
‹‹
‹
1
2
3
›
››