- 百度公布图像生成模型专利2025-03-25 10:28:03
- 亚马逊推出Titan系列AI模型 支持文本、图片生成12月4日消息,亚马逊日前宣布,正式发布Titan系列AI模型,包括AI模型文本生成模型Amazon Titan Text Express 及Titan Text Lite,还有图像生成模型Titan Image Generator。其中Titan Image Generator是亚马逊自研的最新Titan系列模型,除了可以根据文本生成图片之外,还具备图片编辑和隐藏水印功能。2023-12-04 10:30:29
- 快手盖坤:可灵AI全系模型进入2.0时代盖坤宣布,基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。2025-04-15 15:58:14
- 快手盖坤:可灵AI全系模型进入2.0时代4月15日消息,在可灵AI 2.0发布会上,快手高级副总裁、快手社区科学线负责人盖坤发表演讲。盖坤宣布,基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。2025-04-15 15:59:58
- 东吴证券:快手可灵2.0模型能力好于预期,维持“买入”评级4月16日消息,东吴证券发布研报称,4月15日,快手-W举行“灵感成真”2.0模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。可灵2.0模型能力好于该行预期,该行看好公司AI业务发展,维持公司2025-2027年经调整净利润预测200/245/296亿元,对应PE为10/8/7x,维持“买入”评级。2025-04-16 11:17:42
- 荣耀与阿里将在AI领域展开合作2月28日消息,荣耀已与阿里在AI领域展开合作。目前千问、万相等多款语言、视觉理解、图像生成模型已接入荣耀YOYO 智能体,用户可通过Magic7系列手机等终端体验AI功能。2025-02-28 17:43:24
- 跨境通:公司已接入openAI3月30日消息,跨境通3月30日在互动平台表示,公司已经接入openAI。同时,该公司还表示,CHATGPT在商品详情撰写,关键词提取,智能客服,小语种翻译等领域有大量应用场景。同时公司还积极探索用stable diffustion等图像生成模型在AI模特图生成和服装图案生成等领域的应用。2023-03-30 15:41:46
- 阿里巴巴公开“图像生成方法、模型生成方法及设备”专利阿里巴巴公开一项“图像生成方法、模型生成方法及设备”专利。2022-04-18 15:46:22
- 快手可灵大模型可续写生成最长约3分钟视频6月23日消息,快手的视频生成大模型“可灵”近日正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。同时,可灵还发布了业内领先的视频续写功能,可为已生成的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长可延伸至约3分钟,充分显示了可灵强大的想象力与精细的可控性,极大地拓展了视频大模型的创作边界。2024-06-23 10:59:17
- 宝宝树母婴家庭领域大模型成功通过网信办算法备案2月19日消息,国家互联网信息办公室于2月18日发布第四批深度合成服务算法备案信息,此次备案涉及图像生成、视频生成、数字人、智能对话等多个种类,应用范围涵盖教育、游戏、电商等多个行业,如网易元气生成合成算法、唯品会虚拟试衣算法、京东文生图模型算法等。宝宝树母婴家庭领域大模型也成功通过网信办算法备案。据悉,2023年宝宝树正式发布母婴行业垂域模型——Mika-Brain。2024-02-19 17:03:48
- PhotoStudio® AI智能商拍摄影云工作室上线,虹软视觉大模型首发落地!10月23日消息,虹软AI创新产品——PhotoStudio® AI智能商拍摄影云工作室(Beta)上线,首发开放PhotoStudio® AI CL(服装版)与PhotoStudio® AI MC(商品版)图像生成服务,免费注册即可试用!2023-10-23 10:36:12
- 快手AI玩评功能开启内测快手AI玩评是基于快手自研大模型的图像生成能力,用户仅需点击一下图标即可为评论生成图片。2023-09-15 14:26:14
- 快手可灵大模型发布图生视频及视频续写功能6月21日消息,快手视频生成大模型“可灵”再度进化,正式推出图生视频功能,支持将任意静态图像转化为生动的5s精彩视频,搭配创作者输入的不同文本,可生成多种多样的运动效果。可灵还同步发布了业内领先的视频续写功能,支持对已生成的视频一键续写和连续多次续写,单次可让视频延续约5秒,最长可生成约3分钟视频。2024-06-21 15:36:13
- 阿里开源全能视频大模型通义万相Wan2.1-VACE5月15日消息,阿里巴巴正式开源通义万相Wan2.1-VACE,这是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列生成和编辑能力。该模型拥有1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行,开发者可在GitHub、Huggingface及魔搭社区下载体验。该模型还将逐步在通义万相官网、阿里云百炼上线,可满足广告设计、影视制作及短视频创作等场景需求。2025-05-15 09:11:20
- 腾讯:混元大模型中文效果整体超过GPT3.510月26日消息,腾讯宣布,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能,展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。2023-10-26 16:06:06
- 字节发布文生图开放模型SDXL-Lightning2月26日消息,字节发布文生图开放模型SDXL-Lightning。据知情人士透露,字节跳动的SDXL-Lightning通过渐进式对抗蒸馏的技术,实现前所未有的生成速度。该模型能够在2步或4步内生成极高质量和分辨率的图像,将生成速度加快十倍,是1024分辨率下速度最快的文生图模型,计算成本则降低为十分之一。2024-02-26 09:56:43
- 阿里云开源通义千问多模态大模型Qwen-VL8月25日消息,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。2023-08-25 11:47:09
- 通义千问全模态模型Qwen2.5-Omni开源3月27日消息,通义千问发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。2025-03-27 09:22:23
- 字节跳动发布图像编辑模型SeedEdit 3.06月6日消息,字节跳动Seed团队今天正式发布图像编辑模型SeedEdit 3.0。该模型可处理并生成4K图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。未来,除进一步优化编辑性能外,团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。2025-06-06 17:37:28
- 阿里巴巴推出AI图生视频模型EMO2月28日消息,阿里巴巴集团智能计算研究院在近日上线了一款新的AI图片-音频-视频模型技术EMO,官方称其为“一种富有表现力的音频驱动的肖像视频生成框架”。目前,EMO框架上线到GitHub中,相关论文也在arxiv上公开。据悉,用户只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的AI视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意图像都可以一一对应。2024-02-29 08:35:44