半岛彩票美国时间2月15日,OpenAI公布了文字生成视频大模型Sora。通过输入简短说明文字,Sora就能输出一段时长1分钟、包含多镜头切换、画面元素互动符合真实物理规律的视频,相比起2023年亮相的其他人工智能视频演示,技术突破上了一个台阶。
自从2022年底OpenAI公布ChatGPT后,人工智能的技术突破已经达到可初步在大众日常领域应用的程度。如今Sora横空出世,进一步证明人工智能学习能力的进化,各行各业走进AI时代似乎为期不远。
作为一个数千亿美元级别的娱乐产业,体育界同样高度关注人工智能的应用前景。恰好一年前,2023年2月,中国之声决胜时刻联合体育大生意推出的体育商业主题对话节目《共同体》中讨论过人工智能颠覆体育的可能。节目嘉宾凯利时科技董事长、CEO刘建宏期间介绍了自动生成马拉松跑者视频、自动智能直播乒乓球赛事等已经成型的人工智能应用产品。一年后Sora亮相,又为体育界带来哪些全新的人工智能想象?
就Sora所指向的文字生成视频功能来看,体育界能应用的面相对不广。这是由于体育运动的特性与Sora的应用方向存在两大冲突。
第一,Sora生产的产品是虚构的视频素材,而体育行业提供的产品,则是由真实运动员参与的真实竞技对抗。 以视频媒介的视角来观察,观看体育视频的人想看的赛事精华、赛事转播,都是在客观现实中进行过的比赛的内容。以虚构形式创作的Sora无法提供同类的产品。
第二,Sora呈现出什么内容,主要由创作者提供的“提示词”(prompt)来控制,而体育运动具有不确定性和随机性。 以故事内容的视角来考察,Sora生成的内容受限于创作者的指引,提示词已经框定了内容大纲。而在体育运动中,作为“创作者”的运动员,其核心创作工具是本人的运动能力。没有一个预设的“大纲”,能左右运动员的实际发挥。不确定性是体育运动的经典魅力之一,Sora同样无法重现这种魅力。
Sora与ChatGPT背后的支持模型GPT,其底层技术都是“变换”(Transformer)模型;对于大众用户来说,两者的日常使用感受都类似于“发出指令-获得反馈”的过程。但是Sora与GPT的相似性并不意味着两者在体育领域应用的广泛性。GPT对于数据的整理、挖掘、分析帮助很大,而数据的呈现和分析又是体育行业的一个重要领域。无论是预测比赛胜率、挖掘有趣的比赛数据(例如某某球员是多少岁以下连续进球最多的球员)还是分析运动员/运动队表现,GPT的应用范围都颇为广泛。
GPT帮助分析德乙和小型网球赛事的数据 ,图源:StatsPerfrom
GPT以生成图文为主,因此还能帮助体育协会、体育赛事方节省一定工作,例如自动输出格式统一的赛后报告。媒体行业方面,GPT能帮助记者写稿、编辑起标题,体育媒体也可受惠。
而Sora可能只会在涉及体育视频方面的一些少数环节可以提供服务。笔者想到的场景有两个。一个是体育节目画面内容优化。除了文字之外,Sora还可以以图片、视频为提示词,所以具备强大的视频扩展能力。制作节目片头、过场效果自然不在话下,Sora还可以挑战一些更高阶的画面呈现。
例如,体育转播节目中常有一些氛围性镜头,如体育场外观、落日/飘雪等自然现象特写。Sora可以制作一些风格磅礴的画面补充到氛围性镜头中,渲染赛事的宏大气质。试想一下,比赛画面以星光璀璨的银河系效果图为起点,镜头快速收缩,将画面从银河系收窄到太阳系,再收窄到地球、收窄到比赛城市最后收窄到运动场,这种画面是否能进一步调动起观众对比赛的情绪?Sora也可以把运动员登场渲染为“超级英雄变身”,将一段自我生成的运动员被风火电等酷炫元素包围的动画,衔接到场地中运动员准备比赛的实际画面中。
又如,体育转播从十年前开始尝试加入360°全景画面。无论是比赛中的哪一个瞬间,都可以从前后左右的任意角度连贯性地调整视角来观察。此前,制作这种画面需要多台摄像机组成环绕式拍摄阵列,再通过后期算法综合加工每台摄像机提供的画面。摄像机成本高昂,制作全景画面价格不菲,只有头部大赛可承受。但是假如Sora加入进来,就有可能通过Sora的自我学习能力,在较少机位的支持下,自动根据不同机位中同一物件的形态差异,测出物件的真实轨迹,最终生成还原度高的连贯画面。这样较低的预算也能提供好的全景画面效果,加强赛事转播吸引力。
这个小狗玩雪的Sora示例体现出模型的真实物理还原能力,图源:OpenAI
Sora的第二个体育场景应用可能是粉丝互动。 赛事主办方、IP持有者可以提供一个视频生成工具,让粉丝上传自己照片就可以制作粉丝与明星运动员同台竞技的视频。得益于Sora的原创能力,相信每一段视频都将独一无二。
理论上当下版本的Sora已能制作类似的视频,不需要太多第三方插件搭配。不过目前业界对人工智能自我学习过程中的使用的信息源的版权有较大争论,真实运动员的肖像权和真实赛事的知识产权显然也不能随意使用。这意味着从规范化角度来说,粉丝与明星同台之类的虚拟视频制作服务,只有赛事方、经纪机构等组织和运动员本人能提供。
尽管单从Sora本身的功能来说,体育界对其功能的需求不是特别明显。不过Sora本来的意义就不局限于制作视频。它的突破性还是在于反映人工智能自我学习的进步程度,反映出AI对包罗万象的各种专业知识的吸收和理解。
也正因为Sora所体现出的人工智能技术突破,社会各界在思考人工智能的应用前景时,同时担忧机器取代人之后的行业。有的工作岗位可能会永远不再需要,甚至有一整个行业走向消亡。
体育界免不了有同类的思考。究竟人工智能会不会动摇体育的面貌?体育行业的岗位会不会被机器占据?答案可以是“会”,但最终很可能“不会”。
所谓的“会”,首先在于在可预期的近未来里,人工智能的利用程度和利用率一定会增加。以刘建宏在《共同体》节目中介绍的项目为例,自动生成马拉松跑者比赛视频,是以人工智能发展为前提而新增的服务。没有人工智能参与,任何赛事方都无法为数万人的跑步赛提供个人比赛视频,体现人工智能在体育界利用程度的加深。而乒乓球赛事自动化转播则是将原本需要工作值守的工作,转由人工智能承担,反映出人工智能利用率的提升,成为机器取代人的典型代表。
再从远未来的角度来看,假如人工智能成为一种全面普及的工具,应用于各类日常生活工作中,那么基于人工智能而开发的体育运动形式将会诞生。2023年笔者在一篇介绍中国香港电子竞技发展的文章中提出,运动和电子游戏都是“game”,都将因为生产力发生变化而衍生出丰富的亚型。当人工智能与VR、AR、全息技术等前沿科技一起、组成一套新的生产力工具箱后,未来的人将会发明出我们当前认知下想象不出的体育运动新形态,就正如两个世纪前的人无法理解赛车、电竞、无人机等运动。人工智能的颠覆性,届时将更加明显。想象一下,未来的运动场地,会不会正是由人工智能实时创作?
百年前的人无法想象结合灯光元素的无人机竞赛是什么运动,图源:游戏《看门狗2》
人工智能在近未来和远未来的不同发展程度,共同缔造了机器取代人、AI颠覆传统体育的可能。然而这并不意味着人类将缺席于未来的体育世界,更不意味着体育行业工作不复存在。
解释这句话可以从生物进化来聊起。人工智能界存在着一个经典思辨:是模拟大脑活动还是模拟肢体活动更难。GPT、Sora等模型的惊艳,说明了机器模拟大脑活动的研究进展一日千里。而仿生机器人的开发进度落后不少,机器人的行、跑、跳等动作笨拙生硬,更不要说像自然界动物那样本能性地能根据地形、状态变化适应性调整肢体,流畅完成日常运动。
对此,学界从进化的角度提出猜想:地球动物从草履虫之类单细胞动物进化成人类,用了数亿年。而大脑相对发达、能一定程度使用工具的灵长类动物的诞生只有数千万年。这意味着人类肢体功能的迭代规模,远超于大脑迭代,是一项高度困难、漫长的进程。当人类寻求用机器模拟自己时,模拟大脑的成果相应地比模拟肢体更容易出现。
基于这个猜想以及仿生机器人学发展缓慢的事实,可以进一步推论,人类的综合肢体运用是一种极其高端的运动形式。体育运动对身体协调性、柔韧性、稳定性、力量性的追求,更加是高端运动形式中的高层次艺术。假如机器模拟人类肢体活动发展缓慢,那么机器要呈现体育运动中人类肢体活动的美的极限,更加是力有不逮。在各行各业面临人工智能挑战时,体育运动存在在不会被机器完全架空的独一无二特性。
因此,体育界对待人工智能的基本态度,应该与科研工作者的初始态度一致——寻找一种提升效率、改善效益的新工具。科研工作者在开拓AI应用疆界的路上一定会遇到来自技术、伦理、法律等方面的障碍,体育行业也一定会因为AI的进化而在呈现方式、创作思路等方面有所改变。但科研人不会放弃技术突破,体育行业也会在拥抱人工智能之后,焕发更多新生机。