首页
快讯
观察
Toggle theme
亚马逊推出六项
视觉
搜索工具 测试搜索购物功能
2025-03-07 15:31:23
3月7日消息,亚马逊测试基于搜索的移动购物功能,并推出六项可视化搜索工具,提升用户购物体验和搜索效率。数据显示,全球
视觉
搜索量同比增长70%,表明用户对该类功能的接受度和使用率正在上升。
阿里达摩院在机器
视觉
问答VQA榜单中首次超越人类
2021-08-12 11:00:33
8月12日消息,在国际权威机器
视觉
问答榜单VQA Leaderboard上,阿里巴巴达摩院以81.26%的准确率创造了新纪录,让AI在“读图会意”上首次超越人类基准。
美团公开“车载
视觉
采集模组及无人车”专利
2021-11-10 11:27:52
美团关联公司北京三快在线科技有限公司11月9日公开一项“车载
视觉
采集模组及无人车”专利。
美团公开“车载
视觉
采集装置和无人车”专利
2022-01-12 11:18:51
美团公开一项“车载
视觉
采集装置和无人车”专利。
人类的另一套“
视觉
系统”,被忽视多年之后迎来进化良机
2022-11-08 16:31:36
“消费
是
一切生产的终点和唯一目标,生产者存在的唯一价值,就是提升消费者的权益。”
阿里云推出大规模
视觉
语言模型Qwen-VL
2023-08-26 17:42:30
阿里云推出大规模
视觉
语言模型Qwen-VL。
美图自研
视觉
大模型3.0发布 将落地电商等五大行业
2023-10-10 09:34:04
美图公司发布自研AI
视觉
大模型MiracleVision(奇想智能)3.0版本,将落地电商、广告、游戏、动漫、影视五大行业。
消息称字节跳动
视觉
技术负责人王长虎离职
2021-10-11 09:23:24
10月11日消息,据Tech星球报道,字节跳动的
视觉
技术负责人王长虎已于近期离职。据悉,王长虎于2017年加入字节跳动人工智能实验室,任科学家、技术总监。其主要研究方向包括计算机
视觉
、视频理解、多媒体检索和机器学习等。今年1月,王长虎担任字节跳动的
视觉
技术负责人。
视觉
技术团队的业务包含:通用与垂直业务的多模态内容理解、内容生态、热点理解与挖掘等。
阿里云推出大规模
视觉
语言模型Qwen-VL
2023-08-25 20:20:22
8月25日消息,阿里云推出大规模
视觉
语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问调用Qwen-VL和Qwen-VL-Chat,阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
阿里云推出大规模
视觉
语言模型Qwen-VL
2023-08-26 17:43:22
8月26日消息,阿里云推出大规模
视觉
语言模型Qwen-VL,一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。Qwen-VL
是
支持中英文等多种语言的
视觉
语言模型,相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了
视觉
定位、图像中文字理解等能力。
百度Apollo发布纯
视觉
城市领航辅助驾驶产品ANP3 Pro
2024-04-23 09:16:00
4月23日消息,百度Apollo发布了纯
视觉
城市领航辅助驾驶产品ANP3 Pro,将高阶城市智驾的硬件成本拉至万元,支持15-25万元价格区间的新能源车型搭载。百度表示,ANP3 Pro可做到“开箱即用”,2024年上半年将覆盖360城,年底可实现全国都能开。
字节跳动发布豆包
视觉
理解模型
2024-12-18 14:56:48
12月18日消息,在火山引擎Force大会上,字节跳动正式发布豆包
视觉
理解模型,为企业提供极具性价比的多模态大模型能力。豆包
视觉
理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动AI技术普惠和应用发展。继大语言模型价格以厘计算之后,
视觉
理解模型也宣告进入“厘时代”。
支付宝推出新一代AI
视觉
搜索产品“探一下”
2024-12-30 12:05:22
12月30日消息,支付宝推出新一代AI
视觉
搜索产品“探一下”,基于自研的多模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物,就能让AI通过摄像头,识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等,还能趣味解读萌宠照、宝宝照等,晒图不愁配文案。目前该产品已上线支付宝,在首页点击“扫一扫”后左划即可找到它,在支小宝App也能快速访问。
小米参投法国AI
视觉
公司普诺飞思C轮融资
2021-07-06 17:06:33
7月6日消息,据报道,法国神经拟态
视觉
公司普诺飞思 近期宣布完成数千万美元C轮融资。该轮融资由创新工场领投,小米及上海韦豪创芯参投,数家老股东继续加码。本轮融资资金将用于加速下一代神经拟态
视觉
传感技术的硬件和软件产品的开发与商业化;针对新兴市场规划产品路线;完善基础设施,支持运营及规模扩张。
华为洪方明:华为机器
视觉
军团战略升级
2022-08-09 15:33:59
8月9日消息,日前,华为机器
视觉
产业峰会暨新品发布会2022在延安举办。会上,华为机器
视觉
军团CEO洪方明发表了“迈向新征程,共创感知+AI新未来”主题演讲。洪方明表示,成立军团后,华为机器
视觉
会迎来四大新升级:一
是
以短链条运作的模式来贴近市场,快速决策,更好地为客户数字化转型提供服务;二
是
围绕端边云协同的架构,提升感知产品竞争力,加大与其他产品线的协同合作,共同打造更有竞争力的解决方案。
三六零发布“360智脑-
视觉
大模型”
2023-06-01 09:37:25
6月1日消息,在5月31日举行的三六零智慧生活集团
视觉
大模型及AI硬件新品发布会上,周鸿祎宣布发布“360智脑-
视觉
大模型”。
视觉
大模型
是
“360智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。周鸿祎认为,目前大模型的能力主要体现在软件层,接入智能硬件后,会让大模型的能力从数字世界走向物理世界。
亚马逊云科技发起“智能
视觉
创新加速计划”
2023-07-02 11:31:12
7月2日消息,在“2023亚马逊云科技中国峰会”上,亚马逊云科技宣布发起“智能
视觉
创新加速计划”,该计划将联合产业链上、中、下游的客户和各类合作伙伴,帮助智能
视觉
企业拓展应用场景、构建行业解决方案、加速技术共创。作为全球云计算技术的引领者,亚马逊云科技将携手合作伙伴和智能
视觉
企业探索更多的智能
视觉
应用场景;并通过亚马逊云科技丰富的云服务赋能智能
视觉
企业进行业务模式创新,寻找新的业务增长点。
消息称美团AI平台
视觉
中心负责人魏晓林离职
2024-01-19 11:45:48
1月19日消息,据报道,现任美团AI平台
视觉
中心负责人魏晓林将离职,结束长达4年6个月的美团生涯。目前,其领英个人认证尚未做出更改。在魏晓林的带领下,美团AI平台
视觉
中心开发并部署了数千个AI API和SDK,目前广泛应用于美团App和大众点评App的内容审核、内容创建、搜索、广告、推荐系统和移动AR。他还组织研发了部署在美团自动配送车队、用于自动驾驶的高性能CV模型,以及美团地图街景自动处理和自动更新的管道。
阿里云通义千问
视觉
理解模型Qwen-VL再次升级
2024-01-26 10:46:07
1月26日消息,阿里云公布多模态大模型研究进展。通义千问
视觉
理解模型Qwen-VL再次升级,继Plus版本之后,再次推出Max版本,升级版模型拥有更强的
视觉
推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩。
小米汽车正式接入VLM
视觉
语言大模型
2024-12-23 17:37:30
12月23日消息,小米汽车宣布,小米SU7 1.4.5 OTA已开始推送,共13项新增功能,26项体验优化。本次更新正式接入VLM
视觉
语言大模型,系统可识别复杂道路环境和特殊交通规则区域,并通过文字和语音提示。此外,充电地图升级,与蔚来、小鹏、理想达成充电补能网络合作。
‹‹
‹
1
2
3
4
5
›
››