当前位置: 首页 > 科技

告别“默片”:智谱发布新清影,可生成 10 秒 4K60 帧 / 自带音效视频

感谢IT之家网友 HH_KK 的线索投递!

IT之家 11 月 8 日消息,智谱技术团队今天发布并开源最新版本的视频模型 CogVideoX v1.5,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16 帧的视频生成能力,I2V 模型支持任意尺寸比例,大幅提升图生视频质量及复杂语义理解。

官方介绍,CogVideoX v1.5 也将同步上线到“清影”平台,并与新推出的 CogSound 音效模型结合,“新清影”将具备如下特性:

  • 质量提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力显著增强。

  • 超高清分辨率:支持生成 10s、4K、60 帧超高清视频。

  • 可变比例:支持任意比例,从而适应不同的播放场景。

  • 多通道输出:同一指令 / 图片可以一次性生成 4 个视频

  • 带声效的 AI 视频:新清影可以生成与画面匹配的音效

IT之家附开源地址如下:

代码:

  • https://github.com/thudm/cogvideo

模型:

  • https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

it之家 新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表西藏资讯网立场,转载请注明出处
转发到:
拓展阅读
阿里云服务器
腾讯云秒杀
Copyright 2003-2024 by 西藏资讯网 xz.zjxxinw.cn All Right Reserved.   版权所有