搜索

亚马逊推出六项视觉搜索工具测试搜索购物功能
2025-03-07 15:31:23
3月7日消息，亚马逊测试基于搜索的移动购物功能，并推出六项可视化搜索工具，提升用户购物体验和搜索效率。数据显示，全球视觉搜索量同比增长70%，表明用户对该类功能的接受度和使用率正在上升。
阿里达摩院在机器视觉问答VQA榜单中首次超越人类
2021-08-12 11:00:33
8月12日消息，在国际权威机器视觉问答榜单VQA Leaderboard上，阿里巴巴达摩院以81.26%的准确率创造了新纪录，让AI在“读图会意”上首次超越人类基准。
美团公开“车载视觉采集模组及无人车”专利
2021-11-10 11:27:52
美团关联公司北京三快在线科技有限公司11月9日公开一项“车载视觉采集模组及无人车”专利。
美团公开“车载视觉采集装置和无人车”专利
2022-01-12 11:18:51
美团公开一项“车载视觉采集装置和无人车”专利。
人类的另一套“视觉系统”，被忽视多年之后迎来进化良机
2022-11-08 16:31:36
“消费是一切生产的终点和唯一目标，生产者存在的唯一价值，就是提升消费者的权益。”
阿里云推出大规模视觉语言模型Qwen-VL
2023-08-26 17:42:30
阿里云推出大规模视觉语言模型Qwen-VL。
美图自研视觉大模型3.0发布将落地电商等五大行业
2023-10-10 09:34:04
美图公司发布自研AI视觉大模型MiracleVision（奇想智能）3.0版本，将落地电商、广告、游戏、动漫、影视五大行业。
消息称字节跳动视觉技术负责人王长虎离职
2021-10-11 09:23:24
10月11日消息，据Tech星球报道，字节跳动的视觉技术负责人王长虎已于近期离职。据悉，王长虎于2017年加入字节跳动人工智能实验室，任科学家、技术总监。其主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。今年1月，王长虎担任字节跳动的视觉技术负责人。视觉技术团队的业务包含：通用与垂直业务的多模态内容理解、内容生态、热点理解与挖掘等。
阿里云推出大规模视觉语言模型Qwen-VL
2023-08-25 20:20:22
8月25日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规模通用模型的表现。用户可从魔搭社区直接下载模型，也可通过阿里云灵积平台访问调用Qwen-VL和Qwen-VL-Chat，阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
阿里云推出大规模视觉语言模型Qwen-VL
2023-08-26 17:43:22
8月26日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入，具备多模态信息理解能力。在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规模通用模型的表现。Qwen-VL是支持中英文等多种语言的视觉语言模型，相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。
百度Apollo发布纯视觉城市领航辅助驾驶产品ANP3 Pro
2024-04-23 09:16:00
4月23日消息，百度Apollo发布了纯视觉城市领航辅助驾驶产品ANP3 Pro，将高阶城市智驾的硬件成本拉至万元，支持15-25万元价格区间的新能源车型搭载。百度表示，ANP3 Pro可做到“开箱即用”，2024年上半年将覆盖360城，年底可实现全国都能开。
字节跳动发布豆包视觉理解模型
2024-12-18 14:56:48
12月18日消息，在火山引擎Force大会上，字节跳动正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％，以更低成本推动AI技术普惠和应用发展。继大语言模型价格以厘计算之后，视觉理解模型也宣告进入“厘时代”。
支付宝推出新一代AI视觉搜索产品“探一下”
2024-12-30 12:05:22
12月30日消息，支付宝推出新一代AI视觉搜索产品“探一下”，基于自研的多模态大模型技术，可“用AI之眼探索万物”，提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物，就能让AI通过摄像头，识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等，还能趣味解读萌宠照、宝宝照等，晒图不愁配文案。目前该产品已上线支付宝，在首页点击“扫一扫”后左划即可找到它，在支小宝App也能快速访问。
小米参投法国AI视觉公司普诺飞思C轮融资
2021-07-06 17:06:33
7月6日消息，据报道，法国神经拟态视觉公司普诺飞思近期宣布完成数千万美元C轮融资。该轮融资由创新工场领投，小米及上海韦豪创芯参投，数家老股东继续加码。本轮融资资金将用于加速下一代神经拟态视觉传感技术的硬件和软件产品的开发与商业化；针对新兴市场规划产品路线；完善基础设施，支持运营及规模扩张。
华为洪方明：华为机器视觉军团战略升级
2022-08-09 15:33:59
8月9日消息，日前，华为机器视觉产业峰会暨新品发布会2022在延安举办。会上，华为机器视觉军团CEO洪方明发表了“迈向新征程，共创感知+AI新未来”主题演讲。洪方明表示，成立军团后，华为机器视觉会迎来四大新升级：一是以短链条运作的模式来贴近市场，快速决策，更好地为客户数字化转型提供服务；二是围绕端边云协同的架构，提升感知产品竞争力，加大与其他产品线的协同合作，共同打造更有竞争力的解决方案。
三六零发布“360智脑-视觉大模型”
2023-06-01 09:37:25
6月1日消息，在5月31日举行的三六零智慧生活集团视觉大模型及AI硬件新品发布会上，周鸿祎宣布发布“360智脑-视觉大模型”。视觉大模型是“360智脑”的重要能力组成，使其能看懂图片，未来看懂视频、听懂声音。周鸿祎认为，目前大模型的能力主要体现在软件层，接入智能硬件后，会让大模型的能力从数字世界走向物理世界。
亚马逊云科技发起“智能视觉创新加速计划”
2023-07-02 11:31:12
7月2日消息，在“2023亚马逊云科技中国峰会”上，亚马逊云科技宣布发起“智能视觉创新加速计划”，该计划将联合产业链上、中、下游的客户和各类合作伙伴，帮助智能视觉企业拓展应用场景、构建行业解决方案、加速技术共创。作为全球云计算技术的引领者，亚马逊云科技将携手合作伙伴和智能视觉企业探索更多的智能视觉应用场景；并通过亚马逊云科技丰富的云服务赋能智能视觉企业进行业务模式创新，寻找新的业务增长点。
消息称美团AI平台视觉中心负责人魏晓林离职
2024-01-19 11:45:48
1月19日消息，据报道，现任美团AI平台视觉中心负责人魏晓林将离职，结束长达4年6个月的美团生涯。目前，其领英个人认证尚未做出更改。在魏晓林的带领下，美团AI平台视觉中心开发并部署了数千个AI API和SDK，目前广泛应用于美团App和大众点评App的内容审核、内容创建、搜索、广告、推荐系统和移动AR。他还组织研发了部署在美团自动配送车队、用于自动驾驶的高性能CV模型，以及美团地图街景自动处理和自动更新的管道。
阿里云通义千问视觉理解模型Qwen-VL再次升级
2024-01-26 10:46:07
1月26日消息，阿里云公布多模态大模型研究进展。通义千问视觉理解模型Qwen-VL再次升级，继Plus版本之后，再次推出Max版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题、创作、写代码，并在多个权威测评中获得佳绩。
小米汽车正式接入VLM视觉语言大模型
2024-12-23 17:37:30
12月23日消息，小米汽车宣布，小米SU7 1.4.5 OTA已开始推送，共13项新增功能，26项体验优化。本次更新正式接入VLM视觉语言大模型，系统可识别复杂道路环境和特殊交通规则区域，并通过文字和语音提示。此外，充电地图升级，与蔚来、小鹏、理想达成充电补能网络合作。