1. 9月12日消息,亚马逊近日宣布了一项新政策,要求其Kindle Direct出版商必须披露他们在作品中使用人工智能生成的内容,包括文本、图像或翻译。这一政策的推出经过了数月与作家协会的讨论,旨在确保透明度和保护消费者。作家协会与亚马逊的讨论始于对AI生成图书泛滥的担忧,这可能会排挤人类作者,并可能使消费者无意中购买未经披露的AI生成文本。作家协会明确了AI生成和AI辅助的区别,并认为AI可以成为作家的有用工具。
  2. 9月19日消息,快手在 AIGC 领域的最新进展-自研文生图大模型“可图” 已在公司内部全面开启内测,据悉,“可图”文生图大模型有着三个突出特点,分别是强大的文本理解、丰富的细节刻画,以及多样的风格转化。目前,“可图”大模型在快手站内也落地到了评论区,9月15日开放内测的“AI 玩评”功能,便由“可图”提供技术支持。
  3. 11月1日消息,支付宝小程序云服务又升级了,全新推出文字识别、智能视觉和自然语言处理等3项智能应用功能。同时开放丰富的“自然语言处理”能力,提供对于文本、语音中意义和情感的挖掘理解,助力小程序智能升级,并为企业提供有价值的市场和产品策略分析。
  4. 11月15日消息,腾讯控股在财报中表示,公司扩展了广告人工智能模型的参数,以提高定向和归因的准确性。还开始向广告主提供生成式人工智能工具,使他们能够通过文本描述自动生成广告素材,并适配各广告库存生成多尺寸的素材。正在升级自研基础模型腾讯混元,并将其部署到内部产品中,同时向外部企业客户开放使用。
  5. 12月6日消息,腾讯安全玄武实验室近日披露了一项关于大模型隐私保护的安全脱敏与还原 技术。据介绍,HaS为业内首个支持信息还原的自由文本脱敏技术,通过对用户上传给大模型的prompt(提示词)进行隐私信息脱敏,并在大模型返回计算结果后进行恢复。这个模型主要适用于典型的NLP任务场景,例如机器翻译、文本摘要,文本润色、阅读理解、文本分类等。
  6. 12月6日消息,Shopify宣布,卖家现在可以通过直接输入工作流运行日志中的变量值,而无需在工作流中执行操作 来完成工作流实时监控。例如,当卖家想要查看产品的状态,可以在工作流中使用 {{ product.status }},输出文本Active。在本例中,输出的是元对象条目的值。日志输出可实时记录和追踪各项操作,无论是订单处理、库存管理还是营销活动,卖家都可以清晰地查看每一步的进展。
  7. 12月13日消息,Shopify Inbox近日升级,升级后,商家的邮箱能高效识别邮件信息,迅速拦截垃圾邮件,这样商家就能及时收到重要客户信息,与其建联推动销售进程。同时,聊天外观按钮支持定制化设置,商家可以自定义Shopify Inbox聊天小部件的图标和文本,这样商家在商店中为客户显示的聊天按钮将与自己的品牌更加一致,加深客户对品牌的印象,有助于提升客户转化留存率。
  8. 2月12日消息,eBay美国站近日宣布本月早些时候,平台对eBay移动应用程序进行了一项更改,在反馈页面上显示“已验证购买”一词。此更改将在接下来的几周内在桌面上实施。据了解,eBay添加此文本是为了消除对留下反馈的人参与交易的任何怀疑。
  9. 2月20日消息,今日有消息称,在Sora引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型—Boximator。与Gen-2、Pink1.0等模型不同的是,Boximator可以通过文本精准控制生成视频中人物或物体的动作。对此,字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。
  10. 3月6日消息,饿了么即将上线在线语音转文字功能,将在线聊天中语音消息实时转化为文本,帮助无声骑士及时“听到”商家和顾客的需求。为了帮助无声骑士表达更礼貌、更有温度,饿了么上线电子沟通卡,针对普通送达、超时送达、问路、取餐等不同场景,无声骑士可以向商家、路人、顾客直接面对面文字展示或语音播放设置内容。
  11. 3月19日消息,阿里推出“通义听悟高校公益计划”,所有中国大陆高校师生通过教育邮箱认证后,均可直接免费获赠500小时音视频转写时长,存储空间从20G拓展至200G。AI转写可通过语音识别技术将音视频快速转为文本,是许多高校学生日常学习科研的刚需功能。作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有上百万用户,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。
  12. 3月20日消息,苹果公司CEO蒂姆·库克今日现身上海。当被问及“iPhone在AI上有何进展时”,库克表示,AI已经运用在了苹果产品的各方面,例如Apple Watch的摔倒检测以及iPhone的预测性文本输入等功能,都是由AI来完成驱动的。这也是其首度在中国谈及AI话题。库克同时重申,“苹果的生成式AI,在今年晚些时候会有新闻宣布。”
  13. 3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
  14. 5月9日消息,通义千问2.5大模型今日发布。阿里云智能集团首席技术官周靖人称,在中文语境下,文本理解、文本生成、知识问答&生活建议、闲聊&对话,和安全风险等多项能力上赶超GPT-4。
  15. 5月21日消息,阿里云宣布,通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%,1块钱可以买200万tokens。据介绍,这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。
  16. 6月21日消息,快手视频生成大模型“可灵”再度进化,正式推出图生视频功能,支持将任意静态图像转化为生动的5s精彩视频,搭配创作者输入的不同文本,可生成多种多样的运动效果。可灵还同步发布了业内领先的视频续写功能,支持对已生成的视频一键续写和连续多次续写,单次可让视频延续约5秒,最长可生成约3分钟视频。
  17. 6月23日消息,快手的视频生成大模型“可灵”近日正式推出图生视频功能,支持用任意静态图像生成5s视频,并且可搭配不同的文本内容,实现丰富的视觉叙事 。同时,可灵还发布了业内领先的视频续写功能,可为已生成的视频(含文生视频及图生视频)提供便捷的一键续写和连续多次续写,将视频最长可延伸至约3分钟,充分显示了可灵强大的想象力与精细的可控性,极大地拓展了视频大模型的创作边界。
  18. 8月13日消息,阿里通义大模型继续开源,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。
  19. 9月4日消息,百度官宣文心一言APP正式升级为文小言,定位百度旗下“新搜索”智能助手。文小言推出了富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等“新搜索”能力,同时首发记忆和自由订阅等功能。此外,文小言即日起将免费开放文心4.0大模型能力,所有用户整个九月均可免费使用。
  20. 9月19日消息,可灵AI面向全球发布升级,视频生成新增可灵1.5模型,在画面质量、动态质量、文本响应度等方面均有大幅提升。同时,可灵AI还引入了全新的“运动笔刷”功能,进一步提升视频生成的精准控制能力。据介绍,自今年6月发布以来,这已经是可灵AI累计第9次迭代,目前已有超260万人使用过可灵AI,并累计生成超2700万个视频、5300万张图片。