2022 年末,OpenAI 聊天机器人 ChatGPT 的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习,还是工作生产、医疗健康等领域,人工智能正以前所未有的速度渗透到我们生活的方方面面。
而就在 2 月 16 日,OpenAI 宣布推出全新的生成式人工智能模型 "Sora"。据了解,通过文本指令,Sora 可以直接输出长达 60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
这意味着,继文本、图像之后,OpenAI 将其先进的 AI 技术拓展到了视频领域。OpenAI 亦表示,Sora 是能够理解和模拟现实世界的模型的基础,这一能力将是实现 AGI(通用人工智能)的重要里程碑。
对此马斯克感叹“人类愿赌服输”,360集团创始人、董事长兼CEO周鸿祎预言“AGI实现将从10年缩短到1年”。身为竞争对手的AI文生视频创企Runway联合创始人兼CEO Cristóbal Valenzuela也被惊到发表感言。
Sora的独到之处在于哪里
而AI生成视频的软件在过去一年中其实也不断涌现,那么sora的独到之处在哪里呢?
以前的许多研究,都是通过各种技术对视频数据进行生成模型建模,比如循环网络、生成对抗网络、自回归Transformer和扩散模型等方法。它们往往只关注于特定类型的视觉数据、较短的视频或者固定尺寸的视频。
而Sora与它们不同,Sora是一种扩散模型,它能够通过从一开始看似静态噪声的视频出发,经过多步骤的噪声去除过程,逐渐生成视频。Sora不仅能够一次性生成完整的视频,还能延长已生成的视频。
OpenAI把视频和图像分解为较小的数据单元——patches,每个patches相当于GPT中的一个token。这种统一的数据表示方法能够在更广泛的视觉数据上训练扩散Transformer,覆盖了不同的持续时间、分辨率和纵横比。
据中国基金报,对比AI视频里Runway、Pika、Google和Meta这些主流玩家,Sora的特别之处在于:1、能够生成具有多个角色、特定类型动作和主题背景的复杂视频,时长可达到1分钟。
2、可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格。
3、最重要的是,它不仅理解用户在提示中要求的内容,还能自己理解这些事物在现实世界中的存在方式。
但从实用性来看,Sora只是展示了几十个精选作品,离落地还有相当的距离。而OpenAI的大语言模型大本营正在被对手偷塔——谷歌突破的100万tokens大招,能够给长文本问答、视频理解带来惊人的效率飞升,OpenAI必须尽快做出回击。
A股有哪些可能的炒作题材和概念股
而每每有新的事物出现,在A股市场上也往往会引发一轮题材概念炒作。那么Sora的出现可能对那些方向带来炒作动力呢?
首先是算力端。Sora依旧符合AI缩尺律(Scaling Law)OpenAI在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。
A股算力产业链包含AI服务器零部件、服务器整机、算力租赁、数据中心等环节。AI服务器零部件公司主要包括海光信息、寒武纪、龙芯中科、景嘉微等;服务器整机公司主要包括高新发展、神州数码、拓维信息、广电运通、烽火通信、同方股份等;算力租赁公司主要包括恒润股份、云赛智联、鸿博股份等;数据中心公司主要包括奥飞数据、光环新网、宝信软件、数据港等。
其次是视频生成方向。例如昆仑万维旗下Star Group和Opera都具备做短视频的土壤,其中Opera在海外已经推出了短视频功能;当虹科技拥有自研的AIGC工具集,于去年上半年发布以静态照片生成三维体积视频的方案。
据不完全统计,包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信、神思电子、因赛集团、拓尔思、国脉文化、佳都科技在内的超10家A股上市公司近三个月以来在互动平台披露视频生成模型领域的业务情况。
此外,数据要素方向也是可能的炒作方向。概念股上,国盛证券认为有运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。