首页
快讯
观察
Toggle theme
美图自研
视觉
大
模型
3.0发布 将落地电商等五大行业
2023-10-10 09:34:04
美图公司发布自研
AI
视觉
大
模型
MiracleVision(奇想智能)3.0版本,将落地电商、广告、游戏、动漫、影视五大行业。
美图港股涨超10%创阶段高价 自研
视觉
大
模型
3.0将落地电商等五大行业
2023-10-10 11:38:32
10月10日消息,美图港股盘中
大
涨逾10%,最高报3.82港元创2021年3月以来新高。消息上,10月9日,美图发布
AI
视觉
大
模型
MiracleVision3.0版本。面世100天后,美图
AI
视觉
大
模型
MiracleVision3.0将全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业。
PhotoStudio®
AI
智能商拍摄影云工作室上线,虹软
视觉
大
模型
首发落地!
2023-10-23 10:36:12
10月23日消息,虹软
AI
创新产品——PhotoStudio®
AI
智能商拍摄影云工作室(Beta)上线,首发开放PhotoStudio®
AI
CL(服装版)与PhotoStudio®
AI
MC(商品版)图像生成服务,免费注册即可试用!
三六零发布“360智脑-
视觉
大
模型
”
2023-06-01 09:37:25
6月1日消息,在5月31日举行的三六零智慧生活集团
视觉
大
模型
及
AI
硬件新品发布会上,周鸿祎宣布发布“360智脑-
视觉
大
模型
”。
视觉
大
模型
是“360智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。周鸿祎认为,目前
大
模型
的能力主要体现在软件层,接入智能硬件后,会让
大
模型
的能力从数字世界走向物理世界。
美图影像节发布7款影像生产力工具,推出国内首个懂美学的
视觉
大
模型
2023-06-19 15:33:12
6月19日,美图公司举办以“
AI
时代的影像生产力工具”为主题的第二届影像节,现场发布7款新品。
支付宝推出新一代
AI
视觉
搜索产品“探一下”
2024-12-30 12:05:22
12月30日消息,支付宝推出新一代
AI
视觉
搜索产品“探一下”,基于自研的多模态
大
模型
技术,可“用
AI
之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物,就能让
AI
通过摄像头,识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等,还能趣味解读萌宠照、宝宝照等,晒图不愁配文案。目前该产品已上线支付宝,在首页点击“扫一扫”后左划即可找到它,在支小宝App也能快速访问。
快手张迪:可灵让每一个人都能够用
AI
讲出一个好故事
2025-04-20 14:39:51
4月20日消息,2025(第十七届)商界木兰年会近日在北京举办。围绕可灵
AI
的技术进展和实际应用,快手科技副总裁、
大
模型
团队负责人张迪发表了主题演讲。他提到,可灵
AI
这个业务的愿景是建设全球领先的
AI
视觉
与表达平台,让每一个人都能够用
AI
讲出一个好故事,“这是我们做这件事情的初衷,我们想让每一个人都可以把自己的创意转化成一个好的
视觉
的故事”。
百度萝卜快跑累计提供超过400万次服务
2023-10-17 17:03:43
10月17日消息,百度创始人、董事长兼首席执行官李彦宏表示,未来的
AI
原生应用一定是多模态的,自动驾驶是
视觉
大
模型
重构物理世界的典型应用。目前,百度萝卜快跑已经是全球最大的自动驾驶出行服务商,累计提供了超过400万次服务。
程一笑:快手将坚定执行
AI
战略,进一步升级可灵
大
模型
2024-08-21 09:34:57
8月21日消息, 在快手业绩电话会上,快手联合创始人、董事长兼CEO程一笑介绍,快手已在
AI
领域展开全面布局,目前快手已经构建了一套支持万亿参数
大
模型
训练和推理的基础设施,并基于此,先后研发了快意语言
大
模型
、
视觉
生成
大
模型
和推荐
大
模型
。程一笑表示,程一笑表示,未来,快手将坚定执行
AI
战略,进一步升级可灵
大
模型
。针对可灵
AI
的商业化,除了加强C端会员付费的全球运营外,也将寻求更多与B端合作变现的可能性,力争尽快实现可观的商业化变现规模。
消息称腾讯混元
大
模型
技术负责人刘威离职
2024-11-19 17:28:46
11月19日消息,有媒体称,原腾讯混元
大
模型
技术负责人之一、前
AI
Lab计算机
视觉
中心负责人刘威于近日离职。对上述信息,截至发稿前,腾讯官方暂无回应。
前微软亚研院
视觉
专家胡瀚加入腾讯 负责多模态
大
模型
研发
2025-01-08 15:08:35
据“
AI
科技评论”公众号,胡瀚不久前加入腾讯,接替已离职的前腾讯混元
大
模型
技术负责人之一的刘威,负责多模态
大
模型
的研发工作。
火山引擎谭待:豆包
大
模型
日均tokens使用量超12.7万亿
2025-04-17 14:23:09
4月17日消息,在火山引擎FORCE LINK
AI
创新巡展上,火山引擎总裁谭待公布豆包1.5深度思考
模型
,该
模型
将正式面向企业提供服务。谭待表示,豆包1.5深度思考
模型
能够结合
视觉
理解提供更多功能,例如根据照片分析地貌,或在旅行时辅助点餐、完成企业项目管理流程图。同时,新
模型
还具备了更强视频搜索能力,
模型
能够根据用户搜索问题在视频中寻找相应答案。谭待透露,豆包
大
模型
自发布以来日均tokens增长超过106倍,日均tokens使用量超过12.7万亿。
阿里达摩院上线“文本生成视频
大
模型
”
2023-03-22 16:46:02
3月22日消息,阿里达摩院已在
AI
模型
社区“魔搭”ModelScope上线了“文本生成视频
大
模型
”。根据介绍,整体
模型
参数约17亿,目前只支持英文输入。扩散
模型
采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。据了解,“魔搭”是阿里达摩院联手CCF开源发展委员会在2022云栖大会推出的
AI
模型
社区,首批开源
模型
超过300个,包括
视觉
、语音、自然语言处理、多模态等
AI
主要方向。
字节跳动发布豆包
视觉
理解
模型
2024-12-18 14:56:48
12月18日消息,在火山引擎Force大会上,字节跳动正式发布豆包
视觉
理解
模型
,为企业提供极具性价比的多模态
大
模型
能力。豆包
视觉
理解
模型
千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,以更低成本推动
AI
技术普惠和应用发展。继
大
语言
模型
价格以厘计算之后,
视觉
理解
模型
也宣告进入“厘时代”。
脉脉林凡:文字问答一定不是
大
模型
时代的产品形态
2023-12-13 10:30:56
12月13日消息,脉脉创始人兼CEO林凡出席中国企业领袖年会。林凡在演讲中表示,未来人才供应和需求之间的匹配会发生巨大变化,在机会减少的情况下,职场人会更加重视人脉的经营和个人品牌的打造,他还官宣即将上线全新社交产品。另外,他认为,随着
AI
大
模型
时代的到来,社交产品的交互界面逐渐被颠覆,文字问答一定不是
大
模型
时代的产品形态,未来的交互可能是对话或语音为基础,甚至是
视觉
形象的语音问答。
消息称罗福莉将加入小米 或领导小米
大
模型
团队
2024-12-21 16:12:59
12月21日消息,据第一财经《新皮层》消息,DeepSeek开源
大
模型
DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米
AI
实验室,领导小米
大
模型
团队。知情人士称,雷军认为小米在
大
模型
领域发力太晚,于是亲自挖人,重金招募能够领军小米
大
模型
的人才,支付的薪酬水平在千万元级别。小米
AI
实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括
视觉
、声学、语音、自然语言处理、知识图谱、机器学习和
大
模型
。
钉钉
AI
助理升级:上线图片理解、文档速读等功能
2024-03-29 01:30:23
基于阿里通义千问
大
模型
,升级后的钉钉
AI
助理拥有更强的
视觉
推理能力和长文本速读能力。
快手可灵
AI
用户超600万 累计生成超6500万个视频
2024-12-12 15:31:38
12月12日消息,快手副总裁、
大
模型
团队负责人张迪在“2024AIGC
视觉
应用论坛”上透露,可灵
AI
上线半年以来经历过16次迭代,目前已有超过600万用户,累计生成超6500万个视频和超1.75亿张图片。他表示,可灵
AI
将于近期推出全新的1.6版本
模型
,在文本遵循、动态表现、风格一致性等方面将有大幅提升。
百度入选Wedbush全球30
大
科技公司名单
2025-05-13 14:09:58
5月13日消息,百度入选Wedbush“定义
AI
未来的全球30
大
科技公司”名单。近日有消息称,苹果或将在iOS 18.6系统中首次在中国大陆启用
AI
功能,技术由百度和阿里共同提供支持。其中,百度文心
大
模型
将作为国行版苹果
AI
的云端智能引擎,深度整合至Siri及
视觉
智能功能中。这也标志着百度将在中国市场承接ChatGPT与谷歌的生态角色。有分析师认为,百度股票上行潜力高达25%。
钉钉
AI
助理升级 加入多模态、工作流等能力
2024-03-28 14:17:58
3月28日消息,钉钉
AI
助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在
AI
应用的落地。基于阿里通义千问
大
模型
,升级后的钉钉
AI
助理拥有更强的
视觉
推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
‹‹
‹
1
2
›
››