达摩院推出新型预训练对话模型 首次利用半监督学习注入知识

宋妤
2022-04-12 16:43

4月12日消息,据天下网商消息,今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入预训练对话模型,在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果,为知识和数据融合探索出新路径。

format-jpg

(融合知识后,AI会进行思考)

据了解,一个模型只能解决一项任务,通用性差是AI的一大问题。而预训练模型可能是破解之道,因此近些年备受关注,已迅速发展出万亿参数的大模型。不少研究者认为,数据量只是一方面,如果能将人类知识有机注入预训练模型, AI有望像人类一样思考。

但知识注入并不容易,简单混合容易导致知识被淹没,或者出现严重的过拟合。达摩院研究人员此次利用半监督学习来对预训练对话模型注入知识,在人机对话领域尚属首次。

format-jpg

(图为半监督使用示意图)

据介绍,预训练对话模型有别于常见的预训练语言模型,需更多考虑对话轮次、上下文情境、对话人员的角色等,以便理解对方意图并做出恰当回复。也就是说,这类模型必须考虑对话过程中的策略,他们属于特定场景下的人类知识。业界通常用对话动作标签(dialog act)来刻画对话策略,比如模糊澄清、信息问询和信息告知等。

为此,达摩院研究人员构建了目前最大的对话动作标签知识库,总量达97万轮次,将其注入新设计的预训练对话模型SPACE 1.0中,随后在下游任务进行验证。新模型在斯坦福 In-Car,剑桥MultiWOZ2.0和亚马逊 MultiWOZ2.1这三个国际主流对话数据集上均实现了SOTA(最佳效果),部分提升超过5%,幅度较大。在具体案例中,新模型能够更准确预测出对话动作,能够更好和人类进行对话,避免答非所问。

format-jpg

(图为达摩院新模型在三大国际数据集上的表现)

值得一提的是,在AI应用方面,此前,全国特大型钢企南京钢铁上线了AI质检系统,借助阿里达摩院先进算法,钢板表面缺陷检出率从原来人工的90%提升至98%,钢板出厂质量明显提升,质量异议金额从0.06元/吨降至0.02元/吨。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
12月26日消息,亚马逊日本近日公布其在2025年围绕物流与配送基础设施、服务能力扩展的整体进展,重点包括物流中心和配送站点的扩建,以及进一步完善商品接收方式和配送网络。在配送网络建设方面,亚马逊于日本全国新设了6个配送站点,随着新站点投入使用,亚马逊在日本的配送网络覆盖范围和配送速度进一步扩大,为当日达和次日达服务提供支撑。
12月25日消息,亚马逊在过去一年中显著加快了在南非电商市场的推进节奏,平台规模、订单量和消费者渗透度均出现明显提升,逐步成长为当地重要的线上购物平台之一。2025年黑五大促,亚马逊将该活动称为南非站点上线以来规模最大的销售节点。第三方机构FNB和Discovery Bank的数据显示,在其客户群体中,亚马逊在交易金额排名中位列第三,仅次于Takealot和Checkers Sixty60;在Discovery Bank统计的交易笔数中,亚马逊排名第四。
12月24日消息,美国国家公路交通安全管理局(NHTSA)表示,亚马逊旗下自动驾驶公司Zoox因自动驾驶系统软件错误,将在美国召回332辆汽车。
12月23日消息,亚马逊墨西哥宣布,为应对2025年节庆购物季带来的订单高峰,已招聘8,000名临时员工,使季节性用工规模增至超过23,000人,相关人员将服务于墨西哥全国500多个城市,重点保障高峰期包裹按时送达。亚马逊表示,此举是其在物流基础设施和人力资源方面持续扩张的一部分,旨在提升节日期间的配送效率与稳定性。
商场如战场,胜负亦是平常。
12月18日消息,亚马逊据称正在与人工智能公司OpenAI就一笔潜在投资展开磋商,投资规模约为100亿美元。OpenAI计划使用亚马逊自研的Trainium芯片,该产品将直接与英伟达及谷歌的芯片方案形成竞争。此外,OpenAI还在评估向亚马逊出售企业级ChatGPT产品的可能性。知情人士透露,相关谈判仍处于高度不确定状态,但若交易达成,OpenAI的整体估值可能超过5000亿美元。截至发稿,OpenAI、亚马逊及微软均未作出公开回应。