全球首位数字航天员小诤“玩”转太空现场报道,漂浮翻转“超能”采访
国社数字记者穿越时空讲述中国人自己的太空故事
9月17日,中国空间站首批航天员返航,在神舟十二号任务期间穿越人类三大空间站、见证中国航天员出舱的小诤,也将开启新的报道任务。
小诤是谁?
她是新华社数字记者,全球首位数字航天员。
她说:“我能带着你的向往,自由探索宇宙空间,见证属于中国人自己的太空故事。”
她确实是也这样做的。
神舟十二号3名航天员6月17日顺利进驻天和核心舱之后,小诤第一时间发出报道《穿越空间站》并首次亮相,迅速引发业内外关注。
在随后制作播出的空间站建设、航天员出舱、空间站科普、登陆火星等“现场报道”中,小诤更是展示出了多种“超能力”——在空间站、舱外、火星等多种环境中执行采访任务,做漂浮、翻转等大肢体动作,甚至穿越时空与航天员同框。
从受众反馈看,具有高仿真度人类外表的超写实数字人小诤,与年轻受众的审美取向、成长经历、知识背景高度契合。
为何数字航天员能有满满的科技感?原来,她是基于先进计算机图形技术、空间信息技术、人工智能技术、5G技术、云计算技术等前沿技术的创新实践,也是面向下一代沉浸式数字场景——“元宇宙”“超级数字场景”“3D互联网”——开展的前瞻探索。
其实,小诤重任在身,她肩负着新华社媒体融合生产技术与系统国家重点实验室(以下简称“实验室”)“打造具有中国特色的数字媒体发展路径和模式,在互联网的进化中掌握主动”的“光荣使命”。
IP:小诤究竟像谁
“我的皮肤充满细节,像你一样;我能感受光线的变化,像你一样;我的眼睛能观察世界,也能表达内心,伤感时会湿润,辛苦时会疲惫。我的脸由5000多个微表情驱动,能清晰表达喜怒哀乐,像你一样;我的头发有10万根发丝,轻柔飘逸,像你一样;我的一只手就有40个骨骼控制点,手指和躯体活动自如,也像你一样。人工智能驱动我的一切,声音、语言、表情、动作,我能不断成长。”
这是视频报道《全球首位数字航天员:你的好奇心带给我动力》中,小诤的自述。
中国的数字航天员应该是什么形象?新华社数字记者应该是什么形象?没有前车之鉴,只能摸着石头过河。
实验室研发小组首先排除了“网红脸”等方案,根据网络上女性新闻工作者、女性航天工作者的面部特征,由造型师、角色艺术家配合算法进行了美型设计。其中的关键,是在“大众脸”的基础上,更加突出数字航天员的双重身份标签和职业化特征——温和、坚定、专业。
以小诤的眼睛为例,研发小组进行了十几版优化,甚至屡次推翻重来,使其更具有东方特点,而不是又大又圆、睫毛明显卷翘的西方特点和“网红”感,这一设计受到了网友的一致称赞。
小诤视频一经推出就在微博、B站等多个年轻受众聚集的平台登上热榜,同时获得了专业人士的好评,还引发了网友的大量“二次创作”。
具有人类外形的人工智能是科幻、航天题材文化产品和“二次元”文化的要素,也与年轻人群的成长经历有诸多交集。数字航天员——航天场景中的高仿真数字人——唤醒了年轻人对于这些流行文化符号的记忆和情感。一条网友评论中写道:“星际争霸人族副官、星灵进化者族群、流浪地球MOSS主机、星际穿越塔斯(TARS)助手、OW禅雅塔、奥丽莎、堡垒等向你问好。”
另一个有趣的事实是,对数字航天员在空间站与真实航天员共存的情况,许多网友不约而同会心地给出解释:“三个人的小队难道不应该有四个人?”在他们熟知的经典科幻电视片《奥特曼》中,三个奥特曼组成的小队确实还有一名人类成员。
拥有“黑科技”的数字航天员还成为凝聚爱国主义情感的载体。
“未来的某一天,一位老爷爷轻拍着他孙子肩膀说,‘当年,我们的数字祖先可是旧地球联盟中,第一位遨游太空的中国数字航天员(Taikonaut)!我们中国那时候可厉害了!’”从评论看,相当多的网友在视频中挖“梗”,赞扬我国自力更生发展壮大的航天事业。
技术:更真、更快、更好
在外形的主要指标上,数字航天员使用了电影级、准电影级标准。
如制作了超过10万根发丝——而通常在CG制作(Computer Graphics的英文缩写,是通过计算机软件所绘制的一切图形的总称)中,头发都是做成若干片贴在头顶的。
更精细的还有分辨率。
数字航天员小诤使用的高精度材质贴图,达到了8192×8192的分辨率,是目前主流最高级别的8K超高清分辨率(7680×4320)的2倍之多。
配合面部肌肉运动制作的动态贴图,其皮肤色彩能够在表情、光线变化时实时产生相应变化,甚至可以看到面部细小的汗毛——这也是为了增强角色真实感,研发小组模拟皮肤的透光与次表面反射效果精心制作的。
其实,利用数字技术制作的高仿真人类形象,在电影工业中早有使用,比如被广大漫威迷们喜爱的《复仇者联盟》中的超级英雄们。
渲染是CG的最后一步,即将设计好的物体几何形状、表层材质、空间运动通过计算机运算呈现为最终画面。
以往超写实数字人的渲染时间每帧动辄几到几十小时,而可以在网络上使用的MP4视频一般为每秒30帧。这样看来,制作一个5分钟的高真实度视频,仅渲染时间就非常漫长。
而数字航天员利用最新的实时渲染技术,将同等质量和时长视频的生产时间,缩短到不足原来的千分之一。
在所有模型制作、动作表情绑定等全部完成后,数字人就可以达到“真直播”的效果,实时/准实时生成高品质图像,观看者可以与超写实数字人(如小诤)及其他高仿真数字资产,如火星环境等进行实时交互,包括虚拟现实、增强现实等方面的应用。
目标:打造互联网未来入口
一直以来,互联网都是以2D形式呈现,无论图片、文字、视频,还是整个互联网内容信息架构,都基于平面逻辑。但随着5G高带宽通讯技术开始应用,基于云计算的算力提升,以及人工智能技术在诸多领域的普及,未来互联网将以三维形式呈现已经成为共识。
很多人认为,这就是类似《头号玩家》中“绿洲”那样的沉浸式数字世界:人们并不仅仅是浏览、旁观,而是身在其中。
这将重新构筑数字技术框架内的人与环境的关系,包括数字人与数字环境、真实人与数字环境、数字人与真实环境。内容信息也将改变以往2D环境、平面扩张的方式,转向三维环境下的内容增长。
人们对于下一代沉浸式数字场景有一系列阐述,比如“元宇宙”“超级数字场景”等,其共同点都是建立虚拟世界与真实世界的密切关联,以及“开放性”“用户创造”等。
数字航天员项目探索的是“元宇宙”或“超级数字场景”中的关键元素——“数字化身”或“网络分身”,即真实人类在数字世界中用于交流、交互的高真实度虚拟形象。它在底层技术上与构筑整个数字世界的技术具有高度通用性,如实时渲染是创造三维环境的关键技术。
以小诤为核心,实验室也在尝试开展5G全技术链条支撑的下一代沉浸式场景研发。例如基于实时渲染、云计算、数字地球等空间信息技术的地外行星场景,即具有交互功能、高开放度的超大规模沉浸式环境。
数字航天员小诤已经实现了全程合成语音,情感丰富,并可以用人工智能语音演唱音域、节奏变化较大的单曲。同时,其交互还将创新应用情绪感知等技术,如基于先进计算机视觉技术的肌肉颤动监测。
当下,信息技术通过对社会生产生活的全方位渗透,在“临界点”前不断聚集能量。下一代沉浸式数字场景将不仅仅是一个三维世界,而是通过多种技术的复杂集成,实现人类活动线上化的“总迁移”。
这是一条漫长、充满挑战的道路,但是我们毕竟已经向未来派出了自己的第一位探索者——小诤。(记者钟昊熹、程瑛、山旭)