Sora,自2月16日OpenAI发布后一直被吐槽是“技术期货”,终于在12月10日,正式版Sora露面了,可以生成最高1080p 分辨率、最长20秒的视频。
OpenAI CEO奥特曼称,Sora正式版是视频生成领域的GPT-1时刻。
但国内AI企业,并没有像跟进GPT时期一样,在视频生成领域也与OpenAI保持同步,而是呈现出更复杂的态度。
有人选择跟进,比如Sora问世之后,互联网公司如阿里、字节跳动、快手、腾讯等,AI公司如智谱AI、MiniMax、爱诗科技、生数科技等,都陆续发布了视频生成模型,不少都表示达到或超越了预览版Sora。
也有人选择不跟进,包括互联网公司中的百度,李彦宏曾明确表示,“无论Sora多么火爆百度都不去做”。AI公司如百川智能,也明确表示不会做类Sora模型,月之暗面、商汤科技、零一万物虽然都有文生视频模型,但都不作为重点。
视频生成赛道,不再延续GPT时代的发展模式,即OpenAI打出一张王牌,国内科技企业抢着要跟。Sora之后,国内AI牌局开始有了自己的节奏,也呈现出更为复杂的局势。
有能力做通用基础大模型的国内科技公司,在技术路线、商业前景等判断上,开始出现明显分野。我们就从国内企业跟进Sora的选择与否,聊聊视频生成的中国牌局。
首先我们要明确一下,国内对标Sora模型的科技公司,到底在做什么?
简单来说,Sora视频生成模型的核心技术路线是Diffusion+Transformer相结合,通过文本(自然语言)、图片、视频作为提示词prompts进行视频生成。
对标Sora的模型,至少要具备几个特点:
1.通用性,不针对某一类风格、行业、角色等,任意内容的视频都可以生成。
2.高质量,画质精度高(达到1080p)、视频时间长(最长达一分钟)、画面一致性强(理解物理规律)。
面对Sora,国内科技企业不像ChatGPT推出时那样毫无准备。但到底跟or不跟,却不再像ChatGPT那样高度一致,而是分化成了三类