首页
快讯
观察
Toggle theme
百度公布
图像
生成
模型
专利
2025-03-25 10:28:03
亚马逊推出Titan系列AI
模型
支持文本、
图片
生成
2023-12-04 10:30:29
12月4日消息,亚马逊日前宣布,正式发布Titan系列AI
模型
,包括AI
模型
文本
生成
模型
Amazon Titan Text Express 及Titan Text Lite,还有
图像
生成
模型
Titan Image Generator。其中Titan Image Generator是亚马逊自研的最新Titan系列
模型
,除了可以根据文本
生成
图片
之外,还具备
图片
编辑和隐藏水印功能。
快手盖坤:可灵AI全系
模型
进入2.0时代
2025-04-15 15:58:14
盖坤宣布,基座
模型
再次升级,面向全球正式发布可灵2.0视频
生成
模型
及可图2.0
图像
生成
模型
。
快手盖坤:可灵AI全系
模型
进入2.0时代
2025-04-15 15:59:58
4月15日消息,在可灵AI 2.0发布会上,快手高级副总裁、快手社区科学线负责人盖坤发表演讲。盖坤宣布,基座
模型
再次升级,面向全球正式发布可灵2.0视频
生成
模型
及可图2.0
图像
生成
模型
。
东吴证券:快手可灵2.0
模型
能力好于预期,维持“买入”评级
2025-04-16 11:17:42
4月16日消息,东吴证券发布研报称,4月15日,快手-W举行“灵感成真”2.0
模型
发布会,宣布基座
模型
再次升级,面向全球正式发布可灵2.0视频
生成
模型
及可图2.0
图像
生成
模型
。可灵2.0
模型
能力好于该行预期,该行看好公司AI业务发展,维持公司2025-2027年经调整净利润预测200/245/296亿元,对应PE为10/8/7x,维持“买入”评级。
荣耀与阿里将在AI领域展开合作
2025-02-28 17:43:24
2月28日消息,荣耀已与阿里在AI领域展开合作。目前千问、万相等多款语言、视觉理解、
图像
生成
模型
已接入荣耀YOYO 智能体,用户可通过Magic7系列手机等终端体验AI功能。
跨境通:公司已接入openAI
2023-03-30 15:41:46
3月30日消息,跨境通3月30日在互动平台表示,公司已经接入openAI。同时,该公司还表示,CHATGPT在商品详情撰写,关键词提取,智能客服,小语种翻译等领域有大量应用场景。同时公司还积极探索用stable diffustion等
图像
生成
模型
在AI模特图
生成
和服装图案
生成
等领域的应用。
阿里巴巴公开“
图像
生成
方法、
模型
生成
方法及设备”专利
2022-04-18 15:46:22
阿里巴巴公开一项“
图像
生成
方法、
模型
生成
方法及设备”专利。
快手可灵大
模型
可续写
生成
最长约3分钟视频
2024-06-23 10:59:17
6月23日消息,快手的视频
生成
大
模型
“可灵”近日正式推出图生视频功能,支持用任意静态
图像
生成
5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。同时,可灵还发布了业内领先的视频续写功能,可为已
生成
的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长可延伸至约3分钟,充分显示了可灵强大的想象力与精细的可控性,极大地拓展了视频大
模型
的创作边界。
宝宝树母婴家庭领域大
模型
成功通过网信办算法备案
2024-02-19 17:03:48
2月19日消息,国家互联网信息办公室于2月18日发布第四批深度合成服务算法备案信息,此次备案涉及
图像
生成
、视频
生成
、数字人、智能对话等多个种类,应用范围涵盖教育、游戏、电商等多个行业,如网易元气
生成
合成算法、唯品会虚拟试衣算法、京东文生图
模型
算法等。宝宝树母婴家庭领域大
模型
也成功通过网信办算法备案。据悉,2023年宝宝树正式发布母婴行业垂域
模型
——Mika-Brain。
PhotoStudio® AI智能商拍摄影云工作室上线,虹软视觉大
模型
首发落地!
2023-10-23 10:36:12
10月23日消息,虹软AI创新产品——PhotoStudio® AI智能商拍摄影云工作室(Beta)上线,首发开放PhotoStudio® AI CL(服装版)与PhotoStudio® AI MC(商品版)
图像
生成
服务,免费注册即可试用!
快手AI玩评功能开启内测
2023-09-15 14:26:14
快手AI玩评是基于快手自研大
模型
的
图像
生成
能力,用户仅需点击一下图标即可为评论
生成
图片
。
快手可灵大
模型
发布图生视频及视频续写功能
2024-06-21 15:36:13
6月21日消息,快手视频
生成
大
模型
“可灵”再度进化,正式推出图生视频功能,支持将任意静态
图像
转化为生动的5s精彩视频,搭配创作者输入的不同文本,可
生成
多种多样的运动效果。可灵还同步发布了业内领先的视频续写功能,支持对已
生成
的视频一键续写和连续多次续写,单次可让视频延续约5秒,最长可
生成
约3分钟视频。
腾讯:混元大
模型
中文效果整体超过GPT3.5
2023-10-26 16:06:06
10月26日消息,腾讯宣布,腾讯混元大
模型
迎来全新升级,并正式对外开放“文生图”功能,展示了其在
图像
自动
生成
领域的领先能力。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
字节发布文生图开放
模型
SDXL-Lightning
2024-02-26 09:56:43
2月26日消息,字节发布文生图开放
模型
SDXL-Lightning。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的
生成
速度。该
模型
能够在2步或4步内
生成
极高质量和分辨率的
图像
,将
生成
速度加快十倍,是1024分辨率下速度最快的文生图
模型
,计算成本则降低为十分之一。
阿里云开源通义千问多模态大
模型
Qwen-VL
2023-08-25 11:47:09
8月25日消息,阿里云今日推出大规模视觉语言
模型
Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数
模型
Qwen-7B为基座语言
模型
研发,支持图文输入。相较于此前的VL
模型
,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、
图像
中文字理解等能力,可用于知识问答、
图像
标题
生成
、
图像
问答、文档问答、细粒度视觉定位等场景。
通义千问全模态
模型
Qwen2.5-Omni开源
2025-03-27 09:22:23
3月27日消息,通义千问发布并开源首个端到端全模态大
模型
通义千问Qwen2.5-Omni-7B,可同时处理文本、
图像
、音频和视频等多种输入,并实时
生成
文本与自然语音合成输出。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类
模型
。
阿里巴巴推出AI图生视频
模型
EMO
2024-02-29 08:35:44
2月28日消息,阿里巴巴集团智能计算研究院在近日上线了一款新的AI
图片
-音频-视频
模型
技术EMO,官方称其为“一种富有表现力的音频驱动的肖像视频
生成
框架”。目前,EMO框架上线到GitHub中,相关论文也在arxiv上公开。据悉,用户只需要提供一张照片和一段任意音频文件,EMO即可
生成
会说话唱歌的AI视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意
图像
都可以一一对应。
360正式发布AI新产品“360智脑大
模型
”
2023-06-13 15:29:26
6月13日消息,360正式发布AI新产品“360智脑大
模型
”。据了解,360大语言
模型
为360的自研千亿参数大
模型
,已具备跨模态
生成
能力,拥有文字、
图像
、语音、视频处理四大能力,可以应用于文生图、图生图、文生视频等场景。360创始人周鸿祎表示,大
模型
自身安全是未来大
模型
的核心竞争力,360也已经通过工信部信通院测评,成为国内首个可信AIGC大
模型
。
居然设计家海外平台上线AI建模师
2025-03-02 11:48:51
居然设计家基于大
模型
和AI技术打造了“
图片
生成
3D
模型
”与“文字
生成
3D
模型
”两大核心功能。
‹‹
‹
1
2
›
››