1. 12月29日消息,在人民网举办的“2024人民财经论坛”上,京东集团副总裁、京东探索研究院院长何晓冬表示,如同新能源车一样,随着人工智能(AI)正从判别式向生成式转变,这意味着AI已跨越关键技术拐点。何晓冬介绍,以大模型为基础的生成式AI在文字、语音、图像和视频等领域已超越普通人水平,逐渐进入专业级别。这意味着AI不仅能够快速发展,还能在各行业中发挥巨大价值。
  2. 6月12日消息,阿根廷电商独角兽Tiendanube宣布推出基于人工智能的客户服务工具Chat Nube,正式进军对话式商务领域。该工具深度整合WhatsApp Business平台,可为阿根廷、巴西等拉美五国商家提供24小时智能客服服务,支持文字、图像、语音等多模态交互,并能学习品牌调性实现个性化回复。
  3. 6月15日消息,2026届“AIDU计划”,百度最大规模的顶尖AI人才招聘,正式启动。本届AIDU计划的岗位招聘扩增超60%,覆盖百度23个核心业务和11类研究方向,包含大模型算法、大模型基础架构、机器学习、语音技术、智能体等。
  4. 7月3日消息,荣耀全新年度折叠旗舰手机荣耀Magic V5正式发布,该机型搭载了阿里巴巴基于通义千问打造的高德、飞猪旅行两个智能体(Agent),让荣耀用户体验更智能化、个人化的AI智能体手机。在模型层,全新荣耀Magic V5还搭载了通义千问3、VL等大模型,支持手机文档深度思考问答,更好挖掘知识,帮助荣耀用户更好地进行AI问答。接下来,双方还将基于通义大模型探索语音、视频模式下的实时互动。
  5. 4月3日消息,百度地图下一代版本V18于今日发布,由文心交通大模型和生成式AI提供底层支撑,可面向实时交通实现刻画、感知、预测、调度的端到端优化。据悉,百度地图还上线了领航数字人叶悠悠,是基于多模态交互、3D数字人建模、自然语言处理和大模型等技术开发的数字人,将与车主实现拟人级语音交互。
  6. 8月1日消息,国际数据公司 发布2022年中国AI公有云服务市场份额报告,阿里云语言AI市场份额连续四年排名第一,领跑中国市场。IDC将AI公有云服务市场定义为“部署在公有云服务上的AI能力”,其细分市场包括计算机视觉、对话式AI、智能语音、自然语言处理、机器学习平台等五大类。
  7. 1月13日消息,腾讯集团年会在深圳举行,腾讯董事会主席兼首席执行官马化腾表示,TEG(技术工程事业群)方面,期望做腾讯混元的端到端语音交互落地。TEG进行了架构调整,将更聚焦做技术底座,产品化则希望其他事业群一起推进。去年全球都在加大大模型投资,没有千亿利润的公司很难做大模型,但小公司做大模型产品有机会。腾讯混元已经在跟腾讯会议、输入法、浏览器等结合,微信、QQ都在推进智能体落地了,游戏也要全方位拥抱AI
  8. 3月18日消息,智己汽车联合阿里巴巴旗下斑马智行、饿了么等板块发布“IM AIOS生态座舱”,并将于4月正式进入落地阶段。据介绍,该座舱首次将阿里生态服务以AI Agent形式落地上车。即将于4月发布的新款智己L6将上车AI外卖智能体,可实现语音点餐、车到餐至。
  9. 亚马逊智能语音系统Alexa前负责人,对话式AI科技公司LivePerson前首席技术专家亚历克斯·斯皮内利(Alex Spinelli)近期加入谷歌,任副总裁。
  10. 亚马逊智能语音系统Alexa前负责人,对话式AI科技公司LivePerson前首席技术专家亚历克斯·斯皮内利(Alex Spinelli)近期加入谷歌,任副总裁。
  11. 4月1日消息,新一期百度AI Day上,文小言正式宣布完成品牌焕新与功能升级:支持多模型调度,升级全新语音大模型、图片问答能力。升级后的文小言,整合了最新的文心大模型X1、文心大模型4.5等模型能力,尤其擅长推理计算,推理后不仅能输出图文混合内容,还能调用工具完成连续任务的处理。
  12. 据了解,夏华夏曾在2020世界人工智能大会上表示,美团AI已经在骑手调度、外呼机器人以及语音对话完成服务获取等方面进行了实践。据悉,这是美团推出的新一代L4级别自动驾驶能力的车型。该车的发布标志着美团无人配送自研产品开始拥有标准化量产能力。同时,美团预计未来3年,将在北京顺义、亦庄以及深圳等多地区和城市落地,实现外卖、买菜、闪购等业务场景的无人配送服务。
  13. 3月22日消息,阿里达摩院已在AI模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍,整体模型参数约17亿,目前只支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。据了解,“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的AI模型社区,首批开源模型超过300个,包括视觉、语音、自然语言处理、多模态等AI主要方向。
  14. 5月25日消息,据钛媒体,基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice,最快今年6月上线腾讯元宝App,从而与豆包AI视频通话功能对抗。而且,腾讯已规划多模态和全模态路线,最快今年将推出全球首个“全模态模型”,代号为混元-O,瞄向“世界模型”。
  15. 11月12日消息,科大讯飞消费者业务今日发布双11终极战报:销售额同比增长76%,其中AI学习硬件销售额同比增长300%。今年双11,讯飞智能录音笔系列产品获得京东&天猫双平台录音笔品类销售额冠军;讯飞智能办公本系列获得京东&天猫双平台电纸书品类和单品销售额冠军;讯飞智能鼠标拿下京东&天猫双平台智能语音鼠标品类销售额冠军。
  16. 11月17日消息,国际权威研究机构IDC近日发布报告《IDC中国新一代智能客服厂商评估Marketscape》,阿里云再次进入领导者象限,并在市场份额和战略愿景两大维度斩获第一,这是云计算企业的对话式AI市场份额首次超过传统语音公司。报告显示,以阿里通义大模型体系为基础的自然语言对话技术在任务型对话、表格型对话、文档型对话、多模态情感感知、多模态对话等方向取得了关键突破。
  17. 小米手机整体出货量亦连续13个季度居全球第三,随着2024年消费电子周期回暖出货量有望持续提升。此外,公司在语音体系和自研大模型上取得突破,积极探索混合AI的发展路径,致力于实现“深耕底层技术、长期持续投入、软硬深度融合、AI全面赋能”的战略目标。
  18. 1月18日消息,由粤澳工商联会和百度联合主办的“百度澳门AI战略合作签署仪式暨文心一言App澳门智慧城市发布会”日前在澳门举办,此次百度与澳门的合作主要围绕智慧旅游展开,通过文心一言APP强大的个性化推荐、智能客服、语音交互、资料分析等功能,赋能澳门智慧旅游建设。
  19. 3月19日消息,阿里推出“通义听悟高校公益计划”,所有中国大陆高校师生通过教育邮箱认证后,均可直接免费获赠500小时音视频转写时长,存储空间从20G拓展至200G。AI转写可通过语音识别技术将音视频快速转为文本,是许多高校学生日常学习科研的刚需功能。作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有上百万用户,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。
  20. 4月19日消息,阿里巴巴达摩院今日发布超大规模语言模型PLUG,该模型参数规模达270亿,是目前全球规模最大的中文纯文本预训练语言模型。通过训练AI模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,AI将为该声音找到“主人”。据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。