首页
快讯
观察
Toggle theme
百度搜索整合文心一言新进展:已注册Searchat等商标
2023-03-02 17:20:49
3月2日消息,百度近期已提交注册Searchat、百度百晓生、百度晓搜、Chatflow等多个商标名称,疑似与百度搜索产品整合文心一言的计划相关。据接近百度相关人士透露,百度搜索全线整合文心一言后,或可能提供文本、语音、图像等
多
模态
的搜索能力和AI生成能力。另外,根据注册名称推断,此次产品升级或有可能搭载百度APP此前推出的数字人度晓晓,提供更智能的AI
对话
式搜索。
滴滴公开“基于
多
模态
数据的驾驶预警
方法
、设备”专利
2021-07-02 11:56:02
滴滴关联公司北京嘀嘀无限科技发展有限公司7月2日公开一项“基于
多
模态
数据的驾驶预警
方法
、设备、介质及程序产品”专利。
蚂蚁集团推出20亿参数
多
模态
遥感基础模型SkySense
2024-02-28 12:05:55
蚂蚁集团
多
模态
研究成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
京东云:长期布局
多
模态
领域,自研知识大模型生成商品文案覆盖超3000个品类
2023-03-17 16:56:36
3月17日消息,谈到近日大热的GPT-4,京东云相关负责人告诉澎湃新闻编辑,相较于GPT-3.5及ChatGPT主要处理文本数据,GPT-4是一个大型的
多
模态
模型,提高了大模型的
多
模态
处理能力。从算法层面,GPT-4使用对抗性测试和基于ChatGPT的经验教训对GPT-4进行迭代优化。京东方面表示,京东云长期布局
多
模态
领域。在文本生成领域,一直以来是通过图片信息+文本信息生成的营销文案。
蚂蚁集团推出
多
模态
遥感模型SkySense
2024-02-28 09:55:34
2月28日消息,蚂蚁集团推出20亿参数
多
模态
遥感基础模型SkySense。官方数据显示,SkySense在17项测试场景中指标均超过国际同类产品。SkySense可用于地貌、农作物观测和解译等,辅助农业生产和经营。目前该成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
字节跳动开源
多
模态
AI Agent—UI-TARS-1.5
2025-04-23 10:21:12
4月23日消息,字节跳动开源了
多
模态
AI Agent UI-TARS的最新1.5版本。与上一代相比,1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。
阿里联合清华大学发布中文
多
模态
预训练AI模型M6
2021-03-03 10:06:52
3月3日消息,阿里巴巴与清华大学联合发布中文
多
模态
预训练AI模型M6。据介绍,预训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
京东言犀携手NLPCC 2022举办
多
模态
商品摘要挑战赛
2022-03-22 10:19:48
京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办
多
模态
商品摘要挑战赛。
360孙浩:结合物联网的
多
模态
大模型将是下一个风口
2023-06-05 11:43:53
针对360智慧生活的相关话题,360视觉云业务线总经理孙浩发表了自己的观点。
余承东:华为P60引入
多
模态
大模型技术 可实现智慧搜图
2023-03-23 17:46:55
3月23日消息,华为任余承东介绍,华为带来全新智慧搜图功能,基于
多
模态
大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。智慧搜图功能将于2023年5月陆续上线,支持搭载HarmonyOS 3.1及以上版本的手机或平板电脑。
齐心集团:公司目前暂未投入
多
模态
技术研发
2023-12-13 09:37:19
12月13日消息,齐心集团近日在互动平台表示:公司目前暂未投入
多
模态
技术研发,公司十分注重前沿技术的发展及应用,将密切关注新技术、新趋势的发展。
消息称字节跳动正秘密研发
多
模态
数字人等多个AI产品
2024-02-29 09:18:13
2月29日消息,据报道,字节跳动正在AI大模型领域秘密研发多个产品,其中包括
多
模态
数字人产品以及AI生图、AI生视频产品等。一位知情人士透露,其在去年下半年见到了字节跳动
多
模态
数字人产品的demo,整体感觉还不错。另据了解,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。对此消息,字节跳动方面尚未回应。
钉钉AI助理升级 加入
多
模态
、工作流等能力
2024-03-28 14:17:58
3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索
多
模态
、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
字节跳动将上线全新
多
模态
视频生成模型
2025-02-07 18:00:20
2月7日消息,字节跳动旗下一站式AI创作平台即梦AI将上线
多
模态
视频生成模型OmniHuman,仅需一张图片与一段音频便可生成一条AI视频,该模型为字节自研闭源模型。即梦AI相关负责人透露,该模型未来会进行小范围内测,官方也会对这一功能设置严格的安全审核机制,并对输出的视频标注水印以作提醒。
李彦宏:DeepSeek不是万能的,
多
模态
才是未来基础模型的标配
2025-04-26 11:43:49
李彦宏称,DeepSeek只能处理单一的文本,还不能理解声音、图片、视频等多媒体内容。
李彦宏:DeepSeek不是万能的,
多
模态
才是未来基础模型的标配
2025-04-26 11:44:46
4月26日消息,Create2025百度AI开发者大会日前在武汉举办,百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。谈到DeepSeek,李彦宏称,百度各个业务线第一时间接入了DeepSeek,但DeepSeek也不是万能的,它只能处理单一的文本,还不能理解声音、图片、视频等多媒体内容,同时幻觉率比较高,很多场合不能放心使用。“它最大的问题是慢和贵,中国市场上绝大多数大模型API的价格都更低,而且反应速度更快。”
腾讯混元宣布开源首个
多
模态
统一CoT奖励模型
2025-05-14 09:31:26
5月14日消息,腾讯混元近日与上海AI Lab、复旦大学、上海创智学院联合提出全新研究工作UnifiedReward-Think,构建出首个具备长链式推理能力的统一
多
模态
奖励模型,首次让奖励模型在各视觉任务上真正“学会思考”,实现对复杂视觉生成与理解任务的准确评估、跨任务泛化与推理可解释性的大幅提升。目前,该项目已全面开源,包括模型、数据集、训练脚本与评测工具。
值得买科技CTO王云峰:还在同步开展
多
模态
工作,如直播数字人等
2023-08-31 10:45:49
8月31日消息,在“什么值得买”上线多款AIGC应用之际,值得买科技CTO王云峰接受媒体采访,他谈到除了已上线的应用,值得买科技还在同步开展
多
模态
的工作,具体包括:包括“图生图”和“文生图”的模型,短视频脚本的生成,短视频的自动生成,以及直播数字人等,包括可供内容创作者使用的创作辅助工具也在推进研发之中。
上海钢联:“小钢”数字智能助手已具备简单
多
模态
能力
2023-12-19 11:14:16
12月19日消息,上海钢联近期接受投资者调研时称,“小钢”数字智能助手已经具备简单的
多
模态
能力,主要处理文字和语言类
多
模态
数据,难度相对较低。未来公司计划进入工业场景,
多
模态
将更
多
应用于视觉方面,如钢厂制造中的全方位数据流监控。在工业生产过程中,公司将实时转换
多
模态
数据流为结构化数据,输入大模型进行分析和判断,提供生产意见,如良品和质检等场景。
京东副总裁何晓冬:大模型下一步必将会从语言模型走向
多
模态
模型
2023-05-26 15:22:41
在2023小蛮腰科技大会上,京东集团副总裁何晓冬表示,ChatGPT代表了未来大模型的走向,下一步必将会从语言模型走向
多
模态
模型。
‹‹
‹
1
2
3
›
››