达摩院推出新型预训练对话模型 首次利用半监督学习注入知识

宋妤
2022-04-12 16:43

4月12日消息,据天下网商消息,今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入预训练对话模型,在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果,为知识和数据融合探索出新路径。

format-jpg

(融合知识后,AI会进行思考)

据了解,一个模型只能解决一项任务,通用性差是AI的一大问题。而预训练模型可能是破解之道,因此近些年备受关注,已迅速发展出万亿参数的大模型。不少研究者认为,数据量只是一方面,如果能将人类知识有机注入预训练模型, AI有望像人类一样思考。

但知识注入并不容易,简单混合容易导致知识被淹没,或者出现严重的过拟合。达摩院研究人员此次利用半监督学习来对预训练对话模型注入知识,在人机对话领域尚属首次。

format-jpg

(图为半监督使用示意图)

据介绍,预训练对话模型有别于常见的预训练语言模型,需更多考虑对话轮次、上下文情境、对话人员的角色等,以便理解对方意图并做出恰当回复。也就是说,这类模型必须考虑对话过程中的策略,他们属于特定场景下的人类知识。业界通常用对话动作标签(dialog act)来刻画对话策略,比如模糊澄清、信息问询和信息告知等。

为此,达摩院研究人员构建了目前最大的对话动作标签知识库,总量达97万轮次,将其注入新设计的预训练对话模型SPACE 1.0中,随后在下游任务进行验证。新模型在斯坦福 In-Car,剑桥MultiWOZ2.0和亚马逊 MultiWOZ2.1这三个国际主流对话数据集上均实现了SOTA(最佳效果),部分提升超过5%,幅度较大。在具体案例中,新模型能够更准确预测出对话动作,能够更好和人类进行对话,避免答非所问。

format-jpg

(图为达摩院新模型在三大国际数据集上的表现)

值得一提的是,在AI应用方面,此前,全国特大型钢企南京钢铁上线了AI质检系统,借助阿里达摩院先进算法,钢板表面缺陷检出率从原来人工的90%提升至98%,钢板出厂质量明显提升,质量异议金额从0.06元/吨降至0.02元/吨。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
2月7日消息,亚马逊宣布,自2026年2月12日起,亚马逊将会对在变体商品间共享评论的方式实施变更。变更后,亚马逊将仅在具有细微差异且不会影响功能的变体间共享评论。对于可能会影响商品整体星级评定和评论数量的较大差异变体,将不再显示共享评论。此举是为了帮助顾客在购买前更准确地了解特定商品的反馈,从而增加信任并降低退货率。
亚马逊最新财报出炉。
2月6日消息,亚马逊发布2025年第四季度及全年财务业绩,总裁兼CEO安迪·杰西表示:“鉴于市场对现有产品和服务的强劲需求,以及人工智能、芯片、机器人和近地轨道卫星等前沿领域的机遇,我们预计2026年亚马逊将在资本支出方面投入约2000亿美元,并期待获得强劲的长期投资回报。”
2月6日消息,亚马逊发布2025年第四季度及全年财务业绩。财报显示,亚马逊2025年第四季度净销售额增长14%至2134亿美元,而2024年第四季度为1878亿美元。若不计入本季度汇率同比变动带来的28亿美元有利影响,净销售额较2024年第四季度增长12%。2025年全年营收增长12%,达到7169亿美元,而2024年为6380亿美元。
亚马逊发布2025年第四季度及全年财务业绩。
加速将快速配送服务向更广区域延伸。
Alexa+可同时处理多个请求,并作为“智能代理”为用户执行操作。
2月5日消息,亚马逊宣布,已在美国向所有用户开放升级版人工智能语音助手Alexa+。Alexa+自去年3月起便处于“早期访问”阶段,用户需要加入等待名单或购买较新的设备才能使用。此次全面开放,标志着亚马逊对Alexa的AI改造进入新阶段。
在美国市场,亚马逊2025年当日达和次日达配送的商品数量同比增长超过30%,达到80亿件。
2月4日消息,荷兰互联网投资公司Prosus宣布与亚马逊云科技(AWS)达成一项为期三年的全面协议,旨在将其人工智能应用扩展至拉丁美洲、欧洲和印度的技术生态系统。