司晓:未来城市的构想与创造,需要科幻的参与

|业界动态 作者:腾讯研究院 2023-10-26

10月19日,第六届中国(成都)国际科幻大会在成都市拉开大幕,腾讯集团副总裁、腾讯研究院院长司晓在10月22日的“科幻与未来城市”主题会议上进行了《未来城市——科幻与现实交织的梦想》主题演讲。

以下是演讲全文:

尊敬的各位领导、各位科幻迷们、各位媒体朋友们,大家上午好。非常荣幸作为开场嘉宾给大家分享关于“科幻和未来城市”的话题。

首先,我跟我的同事们非常荣幸一起来参加这次世界科幻大会。从开幕式到昨天的科学与科幻等分论坛,都让我们觉得脑洞大开。

大会的主题是科幻,腾讯的业务和科幻其实有着非常强的关联。腾讯现象级的科幻大剧《三体》,因为忠于原著广受用户的好评。

游戏作为第九艺术,实际上也是科幻特别好的载体。它能够非常好地将丰富的科幻想象付诸于沉浸式的视听和互动体验之中。腾讯的知名科幻题材IP《逆战》的在研续作《逆战手游》,也在本次世界科幻大会上精彩亮相。而除了在世界观和游戏体验层面的科幻表达外,《逆战手游》还与腾讯内部机器人实验室Robotics X联合共研游戏及机器人领域的交叉前沿技术“智能体动作生成技术”,力求用游戏助推现实领域的人工智能发展创新,让“未来科幻”更近一步照进现实。

大家也许在媒体上看到过我们的机器狗穿越横杆的视频。同样的硬件和关节活动能力,在用基于游戏的方法训练之前,过杆的动作实际上是很机械地把身体降低,慢慢挪过去。但当用游戏数据,以及更多动作捕捉设备去捕捉真狗过杆的数据,然后再去训练,会发现机器狗的动作会更加丝滑,就像一个真狗在穿越杆子。这些都是游戏技术的应用。

最近很流行的《马斯克传》中提到,除了游戏对马斯克整个职业生涯有高度影响之外,科幻作品对他的影响也非常大。马斯克发现,科幻作品以宗教和单纯的科学做不到的方式,在青少年时期培养了他巨大的好奇心。科幻作者和他们的作品直接启发了他产生现在的移民火星,包括创造有益、而不是有害于人类的机器人等这些想法。

下面进入正题,我想用三个关键词来分享科幻和未来城市的关系。

 

生成:创造城市的全新方法

第一个关键词:生成。

去年以来,AIGC(生成式人工智能)技术的爆发,让人们感受到科幻与现实的距离从未如此之近。这是离我们最近的一个技术转折点。无论是做自然语言处理的科学家,还是科幻作家,很多人都惊叹于此。AIGC的出现,使现实某种意义上跑在了科幻前面。很多科幻作家说我还没发表的小说是不是要重写。

AIGC已经开始在渐进式改变各种行业。我们也在尝试用它参与未来城市的设计。这里既包括物理空间的设计,也包括和各种智能科技的结合,以及怎么样可以从软件层面优化我们城市的操作系统。

腾讯人工智能实验室自动生成城市的技术,可以让AI学习卫星图、航拍等真实数据,帮助其理解真实城市的道路与建筑特征,从而快速生成富有真实感的城市布局画面。城市规划师只需要简单画出城市主干道和海岸线,AI模型即可在1分钟内填充合理的路网细节。相比传统方案,用人工的方式可以做得更好更精细,但是AI可以把前面90%的工作迅速完成。

对非专业人士,也可以简单地通过对话方式生成未来城市的方案意向。这里我就是给出了大概1.2平方公里、鸟瞰视角这样的条件,它就可以生成这种对设计师有启发的图。

图1 AIGC可以通过文字描述生成未来城市的方案意向

甚至对于非专业人士来说,大模型的加持可以进一步突破知识和技能的门槛。例如日本漫画作品《Cyberpunk: Peach John》(赛博朋克:桃太郎John)创造者Rootport(笔名),此前从未画过漫画,他构思了故事框架和人物对话,画面部分则完全交由AI在线图像生成器生成。

交通的改变一定对未来城市非常重要,比如说如果是完全的无人驾驶,道路应该是非常窄的。因为我们现在的汽车是人类操作的,所以有安全冗余。未来的交通一定是空天一体的,飞行器是必不可少的一个环节,我们的未来城市也要充分考虑这一点。

这是个很有意思的例子,我尝试用大模型的文生图能力去设计了一个飞行器。这也是我第一次体验大模型多模态的能力。我跟它说,如果我们设计一个飞行器,需要什么样的工种?它马上就列举出来需要美术、概念设计师、空气动力学、电池和机电方面专家等近10个角色。我任命概念设计师为最终决策人,每一轮要求所有的专家都发言,之后用文生图生成一些方案,最后由概念设计师拍板选择最合适的一张图。在这个基础上,再去讨论、生成和审核下一轮,中间无需我再去发指令。到第5轮的时候生成了4张图(如下图左侧所示),概念设计师认为这是团队交给我的作业。

实际上,下图的右侧才是真正符合空气动力学,飞到天上的飞行器,是腾讯投资的一家德国公司Lilium生产的。它是垂直起降,用的矢量发动机。它起飞的时候引擎是往下喷的,飞起来之后就会往后面喷射,这样它的能量消耗会特别低。它具备城市间穿梭能力,大概有300公里的续航。而且它的噪音非常低,只比汽车的声音略高,因此可在小区里降落。同时它的养护成本只有传统直升机的1/10。这就是我们说的,科幻和现实是交织在一起的,甚至大家很难看出来哪个才是现实。

图2 DALL-E3生成飞行器(左), Lilium飞行汽车(右)

有人说大模型会进一步拉大数字鸿沟,把二八原则变为2%和98%,但上面的例子恰恰是把普通人变成了艺术家和设计师大模型的横空出世将创作和表达的能力变成了一种随时随地可调用的服务,看似是Model as Service (模型即服务),但仔细想想,这背后本质其实是Intelligence as Service (智力即服务)之前我们常说AI as Service,把AI变成I恰恰是这一波人工智能变革的本质,未来更强的人工智能实现不一定是Transformer,甚至也不一定非得是大模型,但通过云端提供类人甚至超人的智力才是真正的趋势和本质。

去年大家可能玩过一款《黑客帝国崛起》游戏,Epic用来演示它强大的虚幻5引擎。这是一个比较简单的互动游戏,用大概二十几个GB的文件去实现了一个融合了芝加哥、纽约、旧金山等美国的几大城市的地标建筑,大概有7000多栋建筑、16平方公里的城市。里面的行人都只能进行简单的交互,所以我觉得更像是一个模拟器,而并不是一个有非常强互动感的游戏。在这个游戏里,城市红绿灯等会按基本的规则自动化运行。更让人惊叹的是,这个城市里面以厘米精度呈现的细节。比如说我会把视角停留在一个下了雨的路面和车的夹角的位置,就可以看到车漆上面能够映射出来别的车辆的真实效果,很有意思。这么复杂的一个城市,只需要一台PS5的算力,在一个办公室里面就能够模拟出来。

我们也正在将类似方式应用在我们自己的实践中。腾讯正在深圳前海一个半岛上,大概是1.2平方公里范围内,建设腾讯的未来总部,大家亲切地叫它为企鹅岛。未来总部整个的建设周期可能要8-10年。以现在的科技发展速度,8年之后的世界我们无法预测。可能是完全自动驾驶,可能是飞行器满天飞。怎么样去建一个城市,使它建好的时候不落后,是一件非常有挑战性的事。

我们城市的设计,如果以建筑的生命周期去衡量的话,可能是几十年甚至于上百年的周期。而我们回顾历史,看到以马车为中心的时代,过渡到汽车为中心的时代,是经历了一个相当长的周期。如果不依赖想象,很难建成一个未来十年能够不落后的城市。所以这个时候我们建立了一个可扩展的数字孪生共创的平台,我们把它叫做WeCityX。通过这样一个探索性的项目,让在校的大学生、设计师、科幻作家们等一起参与到里面来,帮助我们去共同畅想一座面向未来的城市。

 

在场:虚实相生的沉浸体验

第二个关键词:在场。

在未来城市建设中,如何避免“建成即落后”?

让未来在场。

未来的城市体验中,非常重要的一点就是数字空间和物理空间虚实互动的体验。先从科幻开始,这是2015年我们看到的《王牌特工》里面的一个片段,大家可以看到一个非常便携式的AR眼镜,可以把虚拟在场的参会者投射到同一个空间里面。实际上微软第二代Hololens的效果至少是接近这个效果的。

腾讯会议上个月刚刚发布国内首个裸眼3D会议的功能,借助硬件或者是通过裸眼3D的方式能够产生沉浸或者半沉浸式的效果,让大家能够错觉感到正在同一个空间里互动,在提升体验的同时,进一步提高大家沟通的效率。举一个简单的例子,虽然在疫情期间大家都已经适应了在线会议。但是会有一个场景是,忽然有一个人说话,另外一个人也在说话,然后这个人停下来了,另外一个说话的人也停下来了,然后又同一时间抢着说话。就是因为大家没有在同一个物理空间里面。在一个屏幕里,你对着很多格子,如果仔细盯着每个人的表情也是可以的,但是不可能像我在现场这样扫视到所有的人,看到哪个人有表达欲望。这就是现场的感受还不能通过目前的技术充分的模拟,只是在降低了信息质量和通量的情况下进行压缩的传输,把3D空间压缩为一个2D画面,然后呈现出来,所以这里有大量的信息损耗。

通过在场的技术,包括VR、AR,苹果新出的Vison Pro,实际上都有类似的功能,能够通过视觉、空间音频,甚至触觉和嗅觉,欺骗我们的五感,让我们的大脑以为自己在一个物理空间里面。当然还有效率更高的方式,那就是脑机接口,现在看起来离我们还比较远。1024通道的脑机接口,只能以非常低分辨率的方式来去欺骗我们的大脑,但是他的方式比起欺骗五感的方式还是效率更高的,未来有很大的想象空间。

 

友好:人机友好的城市空间

第三个关键词:友好。

最近我们也看到很多人形机器人的发布,尤其特斯拉机器人的发布,获得非常广泛的关注。刚才说到的飞行器是交通的方式,其实自动驾驶汽车和飞行器本身就是机器人,而且是功能特别简单的机器人。未来我的身边还会有很多的机器人。机器人的保姆、保洁员、保安等等。大家未来到企鹅岛,可能会给你一台机器狗做导游,然后你牵着去游览。

让机器人去适应城市当然是一个方式。但是可以换个思路去考虑。我们以前说的无障碍城市是对残障人士友好、对老年人友好,同时是否也可以对机器人更友好?

比如我们机器人实验室这个机器人,适应能力还是很强的,通过双轮驱动的方式,可以走这种曲面路线和台阶都没问题。但是我们未来新建的城市,就像我刚才讲到的,适配马车的城市和适配汽车的城市。可以适配飞行汽车、自动驾驶的城市,它的物理结构和城市设计应该有一些更前瞻的理念。所以怎么样去建一个机器人友好园区,建一个无障碍城市,是很重要的。

最后,我想说我们讨论未来城市,本质上是在讨论AI的加持下,未来人类文明的一种形态,城市只是文明形态的载体之一。刚才讲到的它进化的速度是非常快的,我们如何能够跟得上,一定是有科幻的参与才可能做到。腾讯研究院也发起了一个叫AI&Society的项目,目前主要面对科学家群体和社会科学的研究者,希望每一个专家在群里能够提出三个你认为在大模型时代人类最应该回答的问题。靠这个方式不一定能够从根本上解决问题,但我认为我们当下需要去考虑,而并不是杞人忧天。

在AI&Society框架内,我们也提了一些关于人机友好、未来城市的系列问题。我参加这次科幻大会的一个非常重要的目的,也是希望科幻作家能够一起给我们提问,提出更加天马行空和脑洞大开的问题和挑战,使我们小到1.2平方公里的企鹅岛的建设,大到人机未来的关系,有更多的思想火花的碰撞,能够让科幻照进现实,让科幻能够指导现实。谢谢大家。

 

本文作者:司晓 腾讯集团副总裁、腾讯研究院院长

前沿杂志
互联网前沿61

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。

2023-05-12

全站精选