2023世界人工智能大会开幕式（现场文字稿）

作者：迷魂冰
2023-07-10

《》播出后的这些天，不管在抖音、微博还是B站等其他地方，都有关于它的内容与视频，特别是2023世界人工智能大会开幕式（现场文字稿）是最近观众们讨论的最多的，所以今天小编和广大朋友们一起来聊聊。

图片的一些模型，包括到2020年发布的GPT 3，到了2022年12月份才开始正式发布。让大家咱们现代数据的这种深层式的这个过程中，一方面是大家对这个整体的神经网络的一些运算，包括对一些信息的处理，逐渐的算法上的一些进步，算法就越来越高级，越来越这个算法的深度，包括处理一些事情的越来越厉害。另外一层其实是它的底层，其实就是现在我们比较火的这个芯片产业的一些发展，尤其是CPU的出现，CPU的整体的出现，它其实把整体的算力其实推到了一个非常高的一个制高点了。嗯，就能够让我们真正意义上能够把人类的这个就是他用了几年的时间，相对于说就把人类的很多知识一些融会消化就可以做到。而原来的话如果在我们算力不够的话，就是底层的硬件支撑是不够的时候，这个事情是无法做到的。所以是随着我们对算法包括对一些模型的认知逐渐迭代到现在的另外一方面，其实它的底层逻辑的到来让这些事情真正的变得可以为我们真正的服务了。我这个是不是又稍微有点可以理解的？可以。

理解，其实所以说所有的技术它没有什么横空出世的，对，它一定是经过了一个长时间的积累。对，还有这个技术的发展迭代的这个程度哈，导致这个，嗯，不能说导致哈，就使得这项技术突然间就让所有人都知道了，可能他在努力的这个过程是我们看不见的。对的，但是我们看见的是那个结果，是那个成果。嗯，那吴姥姥您呢？您对这个这些技术有没有一些了解？可以和我们来做一些补充的。

深层次向他们技术人员的了解我肯定达不到，但是怎么领域不一样？对，但都会关注。嗯，因为我觉得对于我搞科普或者搞科学教育的人来说，甚至是搞科创教育，因为我主要是这三样的工作，那么我一定会关注到这些技术的问题。但是我觉得这个技术的问题怎么掌握？怎么让孩子们能够了解掌握，我觉得对于我们所有的教师来说都是非常重要的。嗯，那如果教师不去了解他的话，我觉得那个教学当中就有就有遗憾的点在这个地方，所以我还是会关注一些，那么特别是刚才我就提过了那个深城市的这个这种机器人的那个发展训练，这种过程很多人在仔细的研究它机器到底是怎么学习的，那么它的那个神经网络怎么样的逐渐的健全起来？我。

想提一个小请求，您会用什么样的语言，浅显生动的语言来给不懂的青少年朋友或者年轻人来说这样一个概念？

这个好像很多的青少年能够说一说就他就理解的。嗯，因为他们在平时就是你比如我们家里有的人都会有一些小的，那个什么小度小的，小什么什么的，对对对，然后他们也有芯片，对吧？他们在学习的过程当中他就知道这个芯片，这个单片机我要他怎么工作？怎么我要教他，我要编程吗？就要倒进去的，所以这些东西他还是能够理解。

也天生有这个好奇心。对。

对对对，我觉得对青少年来说太容易讲了，如果要是跟一些老年人可能恐怕还比较累一天。是，嗯，这样你很容易讲的，他们很容易，但是关键就是让他们知道我们用这个东西是干什么的，我能解决什么实际问题。所以我在指导青少年做课题的时候，不是说学3D打印，要学数字切割或者是学点什么，你怎么造一个模型，而是要你要解决你自己的问题。是就希望他能够发现身边或者是学习上或者是生活中有什么问题值得他关注。嗯，他能够去敏锐地发现这个问题。

是，唉，大家都希望解决的，而且我可能会解决，我可能解决，那这样的话我就觉得这个是特别好的一个现象。所以他要解决他的问题，他就必须要去学习，那他的这个学习过程就特别的生动，而且特别的有意思，他自己也特别的强烈这个愿望，那么他在学习过程当中他就会掌握一些技术。

我觉得对青少年来讲最主要的是为什么要学这个技术？他要明确不是说一个班级我要教他们编程，大家就学，学完了以后盯着屏幕看了半天，最后还不知道用在什么地方就结束了，这一个学期的课就结束了。我觉得这一点不是特别重要的，重要的是他为了什么学技术，他有这个强烈的愿望才好，我给你举个例子好不好？好呀。

就有一位同学，他说他妈妈在回家的路上，就走进他的那个家里的门楼道里进来。嗯，进门的时候脚步声，他想听一些。妈妈的脚步声是沉重的还是轻快的，就说明妈妈今天是累了，还是在工作当中，会有什么样的一些那个不顺心的事情。还是很开心，她想了解妈妈的心情，她作为女儿，她关心妈妈，妈妈进来，我是不是要放下我的手中的那个作业，去给妈妈倒杯水，拿拖鞋等等。那有的时候他作业特别紧张，可能就忽略了妈妈的问题，那么他就要用人工智能了，他在这走廊里要装一个话筒，对吧？接受妈妈的脚步声音，而且妈妈他要做一些研究，妈妈什么样的脚步声音会会是反映他什么样的心情。嗯，那就在电脑里要输入采量，大量的数据采集下来，然后跟数据跟他的妈妈的一些表现来去做对照。这个就是一个很好的案例，就是也是用了人工智能，这个是算一些，对。

吧？对对对。

对对，算了，我看建国一直在笑，我想咱们俩是不是想的一样的，这是个体贴的姑娘，如果换做是我们，可能我们想的是。嗯，这会开小差呢？对的，听家长是不是回来了，我是不是赶紧。

把电视。

赶紧回到这个书桌前，开始写作业看书了。好的，我想您传达的就是这样一个，就是我们的生活和学习是不可割裂的。嗯，我们的生活可能处处都是一些科学道理，都是一些需要我们去观察，去看看能不能运用到生活当中来解答生活当中疑问的事情。不仅仅是为了考试，不仅仅是为了那个分数或者某一个节点，比如说上大学，或者不仅仅是为这些，而是为更远的一些用处。

对，嗯，其实学生会研究了以后，他学习不会考不好的，不会学不好的，学的好了，那也就考得好。因为我经常跟家长说，他们人家很多人质疑你要不刷题做研究，那怎么考得好？其实从两种的角度来说，第一，他在学习的过程当中，他如果努力的研究课外复习，不是不做题，而是也是对题目也要进行研究复习，把知识吃透了去做这题目。嗯，就比较简单了，那么到时候他已经有一个研究的习惯了，那么他到时候考试的时候，第一他不会这知识都掌握了吗？他肯定考得好。第二最重要的一点就是因为现在的考试也有改革，要考很多的情境题。

嗯，就是你这个考试的题目，不是简单的说已知什么什么什么一个给你画一个什么模型图，比如那个导线或者是什么一根棍子，它的受力等等，不是那么简单的，它就会告诉你可能是出现在一个什么场景中，嗯，甚至是什么什么北斗或者是什么什么。就一段描述现象，那已知条件里边一些数据都不一定是都用到，不像从前漏用一个数据，我都特别紧张，好像我这个解答不对了，但是有些现在需要你自己来建立模型了。那你说一直刷题的人看到这样没刷过的题目是不是很紧张？那他一紧张就影响他的发挥。那。而一直习惯做研究的人看到了这样的问题，马上就他的习惯就是，唉，再去研究这个题目，再怎么做好。唉，其实。

行为形成一种好的习惯，思维。

习惯。嗯，一个思维习惯是它的条件反射了变成。嗯嗯，那这样的它就肯定是很好的，能够解决一些问题。嗯，所以在考试的时候你平时一直是会研究的人，那肯定是核酸的。

嗯，所以说其实不是不刷题，我们刷的是生活当中的题。

嗯，刷的是，不要说刷这个字，刷这个字就有点激进。好。

我们不说刷。

这个字就可以说做题，研究题。

对。建国有没有关注？姥姥？

我昨天才开始关注的这个，从。

对，从昨天开始，从今天开始就应该我们，我已经。

看了姥姥终食小迷弟了，哈哈哈，你知。

不知道吴姥姥从这个视频开播以来哈半不超过半年的时间粉丝量就超过了500万，而且每个月都是50万60万粉丝这样的增长。对的，所以其实这是一个很可喜的现象。对，所以很多网友都在说，这才是我们这个时代真正该追的星。嗯，对，所以我们也是呼吁更多的人我们来关注到这个视频当中，所以其实对于吴姥姥来说也算是头一次创业，第一次创业就成功，哈哈哈，对的，您在做这个视频当中有没有什么就是感受？能和我们分享一下，会不会在一开始的时候会遇到一些，也会遇到一些困惑，或者也会遇到一些难题，还是一开始就很顺利。

其实大家都认为我怎么样，但是我自己觉得我还是本色的出演。但是我背后的那团队小伙伴们支持我，而且鼓励我。一开始我是觉得因为实际上我这个人是比较爱玩，就是不是那种玩，不是说去什么打球之类的玩，而是喜欢玩一些这个小玩意儿，那个它里边有物理道理，我觉得，唉很稀奇，好奇心也特别强。那么平时跟学生或者是跟我们周围的年轻老师就会，唉，拿了个玩具，大家就研究研究是不是可以变成那个物理的教具等等，就是玩这些东西，那有的时候不上手，或者是玩出什么洋相来都会有的。所以我平时是很开心的一个人，但是到镜头前我是会有拘束的，在全国人民面前我展现出我这种嘻嘻哈哈的东西，我就觉得有点不好意思，但是。

很可爱，哈哈哈，不是。

人家鼓励我嘛，鼓励了半天后来我想那就豁出去吧，因为还是要传播知识。另外我开心的事情，我希望周围的人都开心，但是如果用更多的人，这个成千上万的人也开心的话，也挺好的一件事情。嗯，另外我也有一个理想，梦想或者是幻想也可以了，就是我希望全民大学物理。物理是很重要的一门基础学科，如果这个全国好多人都觉得物理害怕，家长都觉得子女学物理的时候家家长先紧张起来，那孩子，特别是对女孩子来说，家长就觉得，唉呦，别学不好，我带着外边去先补一下。所以我们上海不是六年级进初中吗？有的六年级就要带着外边去补数，补物理，然后到了初一再补一下，然后到了这个八年级再开始学物理，他已经学了好几遍了，他就觉得自己都懂了，实际上他会刷题了。但是他不一定就是懂，不一定对物理不一定有感情，那在做的时候，对，然后就会觉得枯燥，或者一旦是做题目或者是考试有点挫折了，那个分数比不过人家的，他就会急。所以我希望大家是从小就喜欢求玩物理，其实这对于新生儿来说，他最早接触的就是一个物理的对他的启蒙，比如他摸摸妈妈的手，或者摸摸一些软软的东西，或者一些硬的东西，它的语言不是软和硬，但是它有这个概念。所以他就比如小孩两三岁、三四岁他会搭积木了，你会说这重力的问题，这是稳定性问题，这是什么重心要放在底座这个上面，这个他不听不懂的，但是他会摸索出来。唉，搭的高了，搭了高的家长说拍拍手，唉，太好了，你搭那么高啦，那小朋友高兴了，再高一点，再高一点他会琢磨的。

所以这些都是物理问题，很小都会学物理，所以我最近一直在想一个问题，因为我在想这个牛顿到爱因斯坦这个突变，然后当时的人就觉得爱因斯坦这个理论是想不通的，那么现在我们的人就觉得，唉，爱因斯坦理论要学也可以学得懂，因为他就运动学，不用高等数学就是基本的数学公式就可以解决了。

那么这一点来说，为什么当时都想不通的事情，自己现在都很想得通，初中生也可以听得懂，那为什么不小时候好好的学物理，让他在生活当中，在玩当中就把物理学会了，那么爷爷奶奶跟着也可以学，跟孩子们一起学。那么这么好玩的东西学会了，到了孩子初中高中在学物理的时候，真的就是深入研究了，对吧？比如微积分刚发明的时候那么难，那现在大家也就是高大学都学，也觉得还可以，但是所以我就觉得物理的教育是应该要有一个突破的时候了，在人工智能的社会可以更好的让物理教育突破。

嗯，对，这一点还想跟您来展开聊一下哈，其实刚才我们从姥姥身上能够看见的很多闪光点，当然除了这个本身的能力之外，对于学术的这个能力之外，我们还看见的就是好奇心，对和这个兴趣点怎么来保护，怎么来保持，一直能够持续很长时间，可能这才是我们能够学习好的一个原动力。

包括我们在看视频的时候，我们看见姥姥用非常脑洞大开的一些道具，还有一些这个生动的语言，来给我们把一些很生涩的技术词语说得非常通俗易懂。而且我们在很多生活当中大家习以为常的现象，或者大家不会去关注到的现象，姥姥能够提炼出来，告诉我们这背后的道理，这都是非常有趣，非常长知识的，所以您觉得在人工智能时代会不会是有更多的？这个您觉得会不会是有更多的助力来做好这个科普？或者您觉得在这个时代我们该怎么来做好给大家的科普呢？

首先这个人工智能社会，我希望有一个人工智能的姥姥。哈哈，那帮我做一个。

吗？对的。

为什么呢？我其实还是有一些自己有一些觉得吃力的。嗯，就是，嗯，为什么呢？就是一个是年纪大了，这体力问题事情还比较多。另外还有一点就是，嗯，很多的讲解，我希望，因为毕竟在镜头界讲解跟课堂上跟学生的交流是不一样的。嗯，学生交流，我看到学生我自己就是话就自己就出来了，很开心的跟学生的那个互动。对，或者互动讲一个物理的问题，但是对着镜头的时候我的感觉是没有那个舒服，那很多长篇的东西又要是让剪的人，就是不要把我的所有的语言，对吧？是不是再重复一遍，或者什么？不要让他把这些语言再一点一点的抠掉，那我就需要把语言精列出来。嗯，有的时候我就要用一些写好的稿子，但写好的稿子必须要眼睛看到，对不对？然后他现在有提示屏吗？但是我眼睛看不清楚，稍微远一点我就看不清楚。我现在两个眼睛是有点，就是左右两个眼睛看的不会重合，嗯，就是闪光的厉害。所以这一行字就中间那个全部是两行字，就是重叠起来的，根本看不清，所以我觉得还有很多话要说，还有很多的那个小视频、小实验要做。

嗯，来不及，因为网友提的问题也很多，我觉得网友是帮着我学习。嗯，他有的时候提的问题。唉，怎么更好的解决？或者是那个问题是。嗯，上天入地，我不一定了解的。那我去学习，所以我特别感谢网友。但是这个最好有一个人帮着，人工智能帮着我，那么我们就可以策划好了，让他帮我多说一点。

东西。嗯，其实您更应该开更多的直播。

凭啥？我？如果我写好的东西不要再让我去讲了，让一个姥姥代替我讲。哈哈哈，你帮忙。

吧。其实。

是可以的，建国要加油。

那必须的，哈哈哈。

你现在是在这个医疗康复？对对对，刚才也提到了物流是不是也有一些。

这个？我们做一些不是物流，是相当于说，也相当于说辅助出行。嗯，帮助，因为我们除了医疗康复之外的话，我们还做一些帮助这个老人、残疾人做一些出行的产品。

你是什么时候对这个科技产生兴趣？你是在哈工大？

对，学的计算机，我这个刚才其实听姥姥讲的时候，真的是我一直在勾起自己小时候的一些那个什么，因为姥姥我有我爸爸原来也是一个物理老师哦，哈哈哈哈，所以我其实从小就是。对，嗯，这些就是这个世界是有熏陶的。唉，对对对，感觉从小这个世界是可以被创造很多东西，就是一直从小就有这个这个思维，就觉得这个世界的很多东西是被创造出来。它并不是说这个世界就是这个样，你去接受它，你去适应它的问题，嗯，而是说有一个创造的思维在的。

好的，我们对于你的这个经历我们再找一个时间来展开说，因为我们的这个马上就要回到现场的这个嘉宾分享了，我们接下来就要来听一下现场的嘉宾是来，我们再稍微等一会就进入到现场去看我们这个演讲嘉宾的分享。稍微的来总结一下，刚才两位说的其实就是我们从孩童的时期起就要保护起大家的这个好奇心，嗯，怎么来保护他们的这个兴趣点，以及让他们来持续的能够对一样事物保持的这样一个探索的这个精神。那这些可能才是能够让我们新一代的这个年轻人走上这个科创道路，或者说能够在自己的这个职场道路上不断的提升自己的这样一种嗯，动力。

那接下来我们也会听到一些嘉宾来分享他们在这个，尤其是哈有一些大家也比较耳熟能详的这个著名的一些科技达人，科技极客，他们待会也会来给我们分享他们的这个成长过程当中的一些故事，还有一些思考，我们也可以从他们的身上能够提炼出很多能够传达给我们青少年的一些精髓。那现在就让我们一起去看一看。

好的领导，各位来宾，女士们，先生们，大家上午好，我是上海广播电视台第一财经的主持人黄伟。智联世界生成未来正如开场秀当中我们看到的深成式AI与艺术家共同演绎的那样，当前以深城市人工智能和大模型为代表的新一轮人工智能加速演进，引领了本轮席卷全球的科技革命和产业革命，人类前所未有的接近于一个全新的通用人工智能时代，这也引发了全球共同的关注和热议。

接下来我们要请出的是我们大会的一位老朋友，他一直以来都是处于全球科技探索潮流前沿，以超前的预判和执行力推动着科技进步和产业发展。接下来我们要有请特斯拉公司首席执行官埃隆马斯克先生，为我们带来他关于通用人工智能新时代的AI创建。请看大屏幕。

hello，everyone in。

Shanghai。大家好，上海的各位朋友们，尤其是陈书记，您好，我觉得人工智能将会在未来人类的眼睛中间扮演，包括对文明扮演非常深刻的作用和影响。我们也看到了数字计算能力的爆炸式的增长，最关键要考虑的一个指标是一个比例，就是这个这种数字计算的机器计算能力和生物算力的一个比率。什么意思？就是人类能够做多强的计算，然后计算机和机器能做多强的计算？那么人计算机和人类的这个算力的比率是多少？每年这个比率都在越来越高，也就意味着什么呢？就是机器和生物的算力之间的差距在进一步的扩大，那就意味着经过一段时间之后，人工的智能，它在全部的智能中间所占的比例会越来越低，相比于机器智能而言，这将是一个根本性的深度的变化带来的影响，现在也很难做出一个理解，但是可能说这是现在人类历史上最深刻的一个时期。那么特斯拉的Optimus人形机器人还在开发的一个阶段，还在比较早期的时候，但是在未来我们将会有非常多的机器人。那么马上需要考虑的也是又说到一个比例的问题，就是，机器人和人类的这个比率是什么？就是在现在看来，现在做一个阶段将会超过1:1，那也就是说地球上的机器人的数量将会超过人类的数量，他们的计算能力要强很多，那么这个似乎就是一个发展的趋势之所在，这就会有积极的影响，也会带来一些消极的影响。积极的影响就是我们将会进入到一个短缺后时代，不会再有短缺了，那么在这种情况，那么这个时代将会是一个富足的时代，只要你想要的立刻就能够获得了。因为这些未来的世界里面的非常多的机器人的情况下的话，它的生产效率将会比人类的一个展为主导的一个生产效率要高很多，所以这是非常大的深刻的变化，所以我们要很小心，以确保它最终的结果是有助于人类的。但现有的一个我们的发展趋势，就比如说在特斯拉的这个人形机器人的这个领域里面，我们看到现在未来这个机器人会越来越多。Optimus他这个人性基金就是能够帮人做一些工作，就是他他也不是说非常强的智能，但是有足够的智能来个做一些那些无聊的，重复的，而且危险的人类不愿意做的工作，这是我们的目的，所以Optimus人形机器人的一个目标就是做这些人类不想做的这些事，所以这可能会还是蛮有用的。我也不想现在过度的自信或者乐观于特斯拉，Optimus的一个角色就一定会很重要，但是他有个自动驾驶这一块，特斯拉也非常有兴趣于将自己自动驾驶的技术给其他的汽车制造商进行一个分享和许可。技术许可我们觉得这是一个非常有用的技术，我也觉得让大家驾驶的这种无聊的这个过程就彻底拜了，就是超越时代的，而且也会见到这个汽车的使用的率会大大增加，一般情况下一辆家用车一周大概那10个小时到20个小时的使用时间，多数的时间都是在停车场里趴着的，但是对于全自动驾驶的汽车来说，他可能会使用的时间会是一周50-60小时，一共一周就168个小时。所以它的使用率，全自动驾驶的汽车的话肯定是，比非全自动驾驶汽车的比例要快翻5倍了。在特斯拉我们也想提供这样的这种技术，这也是为什么愿意把这些全自动驾驶的这个技术许可给其他的汽车制造商来加以使用。那么当前我们自动驾驶的一个状态如何？特斯拉，嗯，我们觉得已经非常接近，嗯，就是没有人类干预的全自动驾驶的一个状态了，我们这已经在美国的道路上测试了，现在很少会需要人工干预了，所以我再开一辆特斯拉，使用最新的FSD全自动驾驶贝塔版的这个技术的系统的时候，基本上从点a到点b不需要摸什么控制器了。所以这个还是一个预测，一个猜测。但是我觉得要实现全自动驾驶，或者说这种4-5级的这个全自动驾驶这个阶段大概就今年晚一点时候就能实现了。我以前也做过预测，都错了，但是我觉得此刻做的这个预测比以往任何时候都更接近于现实。所以我们需要还有一个要很担心，就是对这种深度的、全面的人工智能要担心，要有点担心，尤其是全自动驾驶汽车。你比如说在这个例子里面就是对我们来说，对有限的、有局限的AI去做是有难度的全自动驾驶汽车的，但是我们觉得很快能够加以解决。我已经预测了，大概今年晚一点时候能够实现全自动驾驶，不能100%保证，但是趋势就是今年晚一点时候实现全自动驾驶。但是这个这种有局限的人工智能和一个全面的人工智能的情况完全不一样的。全面人工智能很难去定义全面人工智能，它是一个一种类型的人工智能，它比人类在任何一个方面做的都要聪明的多，任何一个领域那么都要更聪明。嗯，特斯拉没有做这方面的研究，其他公司在做全面人工智能的研究，但是我觉得这是我们需要去考虑的，现在很重要，需要有一些监管，对于他们进行监督，从而确保这种非常深度的人工智能。我说的这种人工智能就是有点接近于，几万台高性能计算机，或者几十万台高性能计算机，有的时候几百万台高性能计算机、最先进的计算机一起来合作，在一个数据中心里面进行协作，产生一个超级智能组合的超级智能，这样的超级智能有强大的能力，比人类要强大的，这是一种风险，一种担忧。那他可能会有很积极的未来，但也有概率会出现一些负面的未来。我们要尽自己的可能，确保这些负面的、消极的未来不会发生，然后积极的未来会发生。好的，我有非常多的，这中国有非常多的聪明的智慧的人们，我一直非常钦佩中国人民的这个智慧和干劲，中国一旦下定决心要做一件事的话，他一定都能把这个产业做得很好，各个经济领域各个产业都是这样的一，当然也包括人工智能这个产业，所以我相信中国会有很强的AI的能力，这是我的预测。非常感谢大家邀请我来出席今天的活动，线上的表达一些观点，我们希望大家觉得这些观点有意思。再次感谢上海的各位朋友们，感谢陈书记，我期待下一届能够线下参加。

好，谢谢掌声，谢谢马斯克先生今天为大会带来的分享内容创建展望明天，创新点燃未来，原始创新引领核心技术突破，上海始终走在全球的前列，接下来我们将掌声有请香港中文大学汤晓鸥教授来介绍他和团队在原始创新领域的最新进展。掌声有请。

这个就在一轮后面讲，这个压力非常大，这个我的儿子塞缪，这个特别想买一辆特斯拉，所以我想我这讲完我就给他买一辆。尊敬的陈吉宁书记，公正市长，尊敬的各位领导、嘉宾朋友们，早上好。你好，上海。这个虽然这个标题是我的心里话，但是这个并不是我的原创，这个标题的原创实际上是非常昂贵的，54个亿，它的这个成本。你好，李焕英，这个是我在21年春节的时候陪我爸妈。

这个嗯，看的一部东北人贾玲原创的电影的票房，这个中国的票房它是从1994年开始统计的，第一年的这个票房冠军是这FUGPT 2500万，那我想今天一部这个中国的这种家庭剧，能够创造这个54亿的这个票房，这个奇迹的一个最主要的原因就是我一直来讲的和30年前相比，我们大家都买票看电影了，盗版没有了，就是当原创的作者能够赚到钱也能吃饱饭，就有力气拍下一部电影。

中国的文艺作者要求并不高，就是希望给口饭吃，给点阳光就灿烂，那我感觉到中国的科技原创者也开始看到了曙光，正这个骑车走在去食堂的这个路上，希望也有口饭吃。那我今天这个显然不是来讲电影，我想大家最想听的肯定是人工智能和这个大模型，那索起大模型就肯定离不开这个Transformer，大家可能会问，这个变形金刚这张照片和Transformer有什么关系？一点关系都没有，就是因为他们英文名字是一样的，我把它放在这里主要是想吸引大家的注意力，因为这个用英文讲就是get your attention。因为谷歌在2017年发表的那篇Transformer的文章的题目就叫attention is all you need。

Transformer是一种新型的这个网络架构，通过这个基于注意力，也就是attention机制的这个计算方式，就在单个的计算层内捕捉非常长距离的关系，目前几乎被AI领域里的所有的大模型所采用，成为这个大模型的基石。我今天想简单回顾一下，就是在大模型中，中国学者到底做了哪些原创的贡献？因为时间关系，我就只想花大概几分钟时间简单回顾一下我三个学生在各自的岗位上，在过去十年对深度学习的原创贡献。我先回顾一下几个历史事件。2010年，三位图灵奖获得者Hinton亚拉控本9共同开启了他们花了很多年研究出来的深度学习的大门。而开启这扇大门的第一声门铃是辛田和微软的登立师兄在2011年在深度学习语音识别上划时代的突破。2012年今天和他的学生Alex Krzyvsky和Elia Suskever设计了Alex。net在这个图像识别image net比赛中取得了另一个划时代的突破。这个SARS改为就是今天这个OpenAI的这个联合创始人和他的这个首席科学家，那从2011年到2013年深度学习刚刚开始的时候，我们做了什么？这就是我想讲的第一个学生王小刚。

小刚是本科这个中国科大少年班和00班的第一名，然后硕士期间在我实验室读的博士，是在MIT私从MIT的前校长艾瑞克格瑞姆森教授。09年MIT毕业回到我在中国大学的实验室做教授。2011年到2013年，CVPR和ICC为两个视觉最重要的会议上，全球共有29篇文章做深度学习，其中有14篇出自我们的实验室，全世界其他的实验室做了15篇。我们有十八项工作在全世界第一次将深度学习用到视觉问题上，包括人脸识别，人脸检测、人脸重建、物体检测、人体姿态、图像超分、三维形状识别等计算机视觉最核心的问题。安卓任曾经评价说，你们颠覆了计算机视觉。在深度学习的大门上，我们按了18次门铃。

第2项工作，小刚第2项工作就是他是在这个人脸识别上，第一次在谷歌之前，在Facebook之前，让机器人做的人脸识别超过了人的眼睛做的DDPID系列。2015年第三项工作就是小刚带队取得了中国学者第一个image net世界冠军。就是前面讲的Hinton做的x net那项，那个参加那个竞赛。在image nice上，小刚当年的对手是谷歌。

我想讲的第2个学生是何凯明，本科是清华大学，2003年广东高考状元，本科读的是物理博士，是在我的中文大学实验室取得的。凯明在我的实验室读硕士期间就发表了第一篇文章，取得了西威PR最佳论文。这是西威PR2 25年历史上从亚洲出来的第一篇最佳论文，这是2009年。所以我就一直跟凯明开玩笑，我说你这一出手就到了巅峰，那从此以后你的学术生涯就只能往下走了。结果他去了微软和Facebook工作以后就一路走高。它的第一项工作我想提的是，Resnet是在MSR做的，在2015年之前，深度学习最多就只能训练到20多场。Resnet在网络的每一层引入了一个直连通道，从而解决了深度网络的这个梯度传递的问题，获得了2016年的最佳论文，是计算机视觉历史上被引用最多的轮，超过了17万次。那在那之后就可以有效的训练超过百成的深度神经网络，就他把网络打得非常非常的深。在大模型时代，以Transformer为核心的大模型，包括GPT系列也是普遍采用了Resnet结构，以支撑上百层的Transformer的堆叠。我想总结起来就是凯明把网络做深了，谷歌把网络的入口拉大了，那么又深又大才成为今天的大模型。

NPS第二项工作马斯克阿西因是在Facebook做的，首次提出了一个真正高性能的物体检测算法框架，获得了ICTV 2017年最佳论文。凯明应该是世界上唯一的一个在毕业不到十年内三次以第一作者的身份获得CVPRSCV最佳论文。mask的auto encoder是在Facebook做的，首次把基于掩码的自编码思想用于视觉领域的非监督学习，开启了计算机视觉领域自监督学习大门，并被推广到三维音频甚至是AFO science领域。今天早上我收到海明的一个Email，它会有一个比较更震撼的动作，以后大家会看到。第三个学生，我想讲的叫林达华，他本科是中国科大硕士是也是香港中文大学博士，在MIT是从也是从。error grim set，他在2010年在MIT读博士期间获得NIPS最佳学生论文，这是机器学习顶会这最高奖。2014年回到我的实验室做教授，他的第一项工作open mm lab在了2018年，从一个小团队开始，在没有推广投入的条件下，以口口相传的形式成为国际上最具影响力的视觉算法开源体系。在Git Hub上累计了8万多颗星标star，目前用户遍及全球140多个国家和地区，60%用户来自海外。它的新标其实已经超过了Pytorch。

国内第二个项工作，书声葡语国内首个将正式发布的千亿参数、语境长度8K的多语种大语言模型，具体评测细节今天下午会在科学前沿论坛正式发布，我这里就不剧透了。第三项工作，书生天际Landmark，Landmark在2021年12月，达华的团队首个提出。在2021年12月，达华的团队首个提出了CT NERF技术。早于谷歌，把NERF技术从物体级拓展到城市级，这个Landmark是全球首个城市级nerve实景，三位大模型，留有2000亿参数，覆盖100平方公里，今天下午会正式发布。我在这里就先剧透一下，请大家看一下这个屏幕的视频。

这是达华的三线工作，那么今天下午，这个达华和乔宇牵头的书生大模型体系，包括语言、视觉、多模态和三维，会在科学前沿论坛上正式发布。我想回头看这个，怎么不动？回头看这个小刚在深度学习兴起的最初几年，撒下了这个很多原创的种子，凯明将深度学习的根基打得非常牢，打得很深。达华通过开源和大模型让其枝繁叶望，让我非常欣慰的是，这棵大树已经开始开花结果。就在两周前，我们的自动驾驶大模型从9155篇文章中脱颖而出，获得了CVPR 2023年最佳论文奖。根据谷歌学术统计，在这是改革开放40多年来，第一篇全部由中国学者完成的国际计算机、视觉三大顶会的。

他是小刚带出来的博士，open mm lab是达华带出来的博士陈凯做出来的。当年我们实验室的另一篇做的超过人脸的超过人眼的人脸识别文章的作者陆超超，也从剑桥大学博士毕业回到了上海，正是正在和中国唯一的图灵奖获得者姚先生在上海的骑士研究院合作从事AI基础理论研究，新一代的学生已经在上海成功起步。

谢，最后我想对凯小刚，凯明达华，陈凯，弘扬超超以及所有我曾经合作过的学生老师们，还有今天上海在座的朋友们讲一句，最好的时光遇见了你们，而是遇见了你们，才有了这段最好的时光。这句话非常的优美，富有诗意，也发自我的内心，可惜它也不是我的原创。这句话是于谦老师他的原创，这是他在电影老师好中的一句经典台词。就每天晚上睡觉前，我都是一边听着这个于谦老师的相声，我就在想，机器怎么可能超过这样有趣的灵魂，我不信。谢谢大家，我们一起努力，上海加油。谢谢。

谢谢汤晓鸥教授，谢谢，谢谢您对于上海的认可，我们一起加油，再一次感谢，我们特别期待着汤教授和他的团队能够继续在原创性、引领性领域能够捷报频传。各位，新一轮人工智能领域的创新驱动，这是一个整体性的系统模型创新、算力制胜、相互促进和互相使能。接下来我们将会掌声有请华为轮值董事长胡厚坤先生带来关于共赢人工智能新时代的主题演讲。掌声有请。

尊敬的吉林书记、公正市长，尊敬的各位领导、专家来宾。大家早上好，非常荣幸能够再次代表华为受邀参加世界人工智能大会。我想今年的这个大会与往届相比，它有一个这个最大的这个不同，就是我们在一个新的背景之下，大家都知道去年底的时候这个ChatGPT的出现，把人工智能推到了一个新的风口上，可以说人工智能，尤其是通用人工智能在当前这个时期已经成为了我们人类社会最热门的一个话题，没有之一。

最热门的一个话题。那么昨天我下午的时候，我也跟往常一样，我就先到这个展馆去转了一圈，我看看大家都在忙些什么。我也看到了这个这一次的这个大会的展，展馆里面大家围绕这个一方面是大模型的研究，另一方面是大模型在不同行业的应用，大家都展出了非常多的这个成果。那我想这一切都说明了人工智能的发展正给我们带来这个新的期望。

未来人工智能发展的方向其实是很清楚了，我们大家都坚信在一个不太长的时间里面，人工智能，尤其是通用人工智能会帮助我们去改写我们身边的一切，那我认为当方向清晰了以后，很关键的就是路径的设计，我们究竟怎样走过去？所以今天我也想利用这次大会的机会向大家来汇报一下。华为目前站在当下这个时间，我们对于未来人工智能发展的一些思考，希望获得大家的批评和指正。

简单的来说，华为现在核心的考虑就是下一个阶段我们要全力去推进人工智能走深向实。所谓走深向实，我们有两个关键的举措，或者说两个抓手，一方面是生根算力，打造强有力的算力底座来支撑中国的人工事智能事业的发展。那么另一方面就是结合大模型，从通用大模型到行业大模型的研究创新，来真正让人工智能服务好千行百业，服务好科学研究。所以我们提出AI for industry，AI for science。那下面我向大家详细的汇报一下。

首先关于算力，大家都知道人工智能的发展，算力肯定是基础基础，而在当前中国的情况下，我们在算力的可获得，而在当前中国的情况下，我们在算力的可获得性和成本等等方面都面临着不小的挑战。多年来，华为是深耕算力的，我们聚焦在鲲鹏和昇腾，它的根基数上，我们取得了根基数的突破。那么当下我们正在做的就是通过架构创新，通过生态的发展以及灵活的共建的手段来支撑中国的算力底座的打造，我们希望通过和大家的共同努力，让算力不再成为人工智能发展的瓶颈。

首先我们通过架构的创新来提升计算的效率，比如说在计算节点层面，我们推出了革命性的对等评购架构，用这个架构来突破传统的以CPU总为中心的异构计算，它有可能带来的性能瓶颈，提升了整个计算的带宽，降低了时延，使得节点的性能可以得到30%的提升。

另一方面，在数据中心层面，我们在19年的时候就推出了昇腾的这个AI计算的集群，那么通过集群的方式，我们把计算、存储、网络、能源营等等的综合的优势把它聚集在一起，相当于是把AI的数据中心当作一台超级计算机来设计和进行管理，使得它的性能能够得到大幅度的提升。

当前我们在这个国内建设的这个规模最大的这个AI计算的集群是在深圳的这个鹏程云脑的二期，目前的算力是这个1000个p的规模，目前我们规划中到2024年我们这个到三期的时候，它的规模会达到16000 P的这个这么一个水平。那么同时我们也从华为自己在这个乌兰察布的这个计算中心，我们部署了几千卡的规模，那我们实测发现我们通过这种集群的方式，在同等算力的情况下，可以得到10%以上的效率提升。那么下面我想向大家报告一下生态，因为算力产业的发展的生态是一个关键的手段，同时也往往是一个这个难以攻克的瓶颈。

那么在四年之前，华为围绕整个这个计算产业的发展，我们就提出了硬件开放、软件开源使能伙伴发展人才这样的一个战略。那么四年下来，我们通过和各方合伙伴的这个合作，已经取得了一定的这个成绩。比如说在硬件方面我们坚持进一步的开放，今年我们已经推出了更多样化的模组、伙伴，目前基于昇腾的AI推出了上百款人工智能的硬件，可以满足不同行业的这个场景的需要。同时在软件方面，我们也坚持通过开源来做强基础软件，特别是当面向当前的大模型的创新。刚才这个小欧教授也特别谈到了我们在大模型创新上的一些这个成就，我们也提供了全流程的使能平台来更好的资源支持科研机构和企业的客户。目前我们的这个生态已经孵化了20多个基础的大模型，同时还适配了十多个这个业界主流的大模型。我们统计了一下，当前中国的大模型中有一半是由AI生腾的算力来支持的，所以在此我也特别对于使用了这个AI生腾算力的这些公司和机构，对大家表示感谢大家对我们的信任，这样让我们对未来进一步去发展我们的这个算力生态更有信心。当然我们也知道，虽然四年来我们取得了不少的成绩，但是生态的发展没有捷径可走，必须得一步一个脚印的往前走，我们也希望未来有更多的公司加入到我们的行列里面来，我们一起把这个生态做好。那么发展算力，我们还有一个考虑，就是我们的身段一定要灵活，这个手段和模式一定要多样化，这是基于中国的这个现状我们思考得到的结果。那么因此结合中国的实际情况，我们是采用多种模式来进行算力建设的。比如说在这个城市的这个算力基础设施建设方面，我们当前已经这个支持各地政府打造了25个城市级的人工智能计算中心，这里面也包括上海。

另一方面我们看到有相当多的大企业、头部企业，大家都有自建人工智能算力中心的诉求，所以那么我们就积极的去配合帮助这些企业去建立自己的人工智能算力中心。比如说当前中国移动、科大讯飞、南方电网等等，这些大的企业都在进行建设，我们也积极的参与到这个过程中。那么同时我们也看到这个人工智能对于中小企业来说需求是极其旺盛的。

那么对于这些中小企业在人工智能的发展中，当它有算力需求的时候，我们就用云服务的方式在华为云上为大家提供算力的服务，这样的话我们是多种手段能够结合到一起了，我们希望通过这种方式就真正实现刚才我向大家汇报的，我们希望最终算力不要成为我们人工智能发展的一个瓶颈，那华为在深耕算力的同时，我们还要做好的工作就是要真正让人工智能要走进线行百业，要服务科学研究。

在这方面我们认为一方面我们要这个持续的提升通用大模型的能力，但另一方面我们还要在这个基础上要建好行业的模型。那么在这里我想给大家看一个例子，大家可以看看大屏幕，我们可以看看这个通用大模型和行业大模型要怎样去结合。比如说我有一个问题，我住在福田区，家里这个有78岁老人，那政府能不能给我提供补贴？那我们看看我们如果用通用大模型，它会给出我们什么样的答案？

好，那么同时我们再看一看，如果我们用了这个行业的大模型，它能给我们什么样的答案。这个行业大模型是我们在深圳市帮助深圳市福田区做的政务大模型，那么很显然我们有了这个在行业大模型，实际上是在通用大模型的基础上，能够给出更精准的、更有价值的，这就是我们要努力的方向。那么华为我们推出了，我们推出了新的这个三层的大模型的结构，那么在最底层是对标的这个通用大模型，我们把它叫基础大模型，这一层我们形象的把它叫做读万卷书，它就是要做好海量的基础知识的学习。那么在这一层之上，我们还打造了这个行业模型和场景模型，我们把它叫做行万里路，那么从读案卷书到行万里路还有很多的挑战需要去克服，那么这里面很关键的一点就是要把各行各业的这个知识要与大模型要进行充分的匹配和融合，那么这方面华为正在和我们各个行业的这个伙伴一起来进行努力。

当前华为的这个盘古大模型，我们已经围绕金融、制造、政务、电力、煤矿、医疗、铁路等等十多个行业，支撑了这个400多个业务场景的AI应用的落地。那么未来我们还希望跟更多的行业大家一起携起手来，把这个面再进一步的扩开，深度还要更深，就是真正是要这个走神，要做事。

那么除了要让这个人工智能服务于千行百业，我们认为当下我们还有一个很重要的任务，就是要人工智能要服务于科学研究，我们提出AI for science，我们发现AI通过学习海量的历史数据科学知识，同时把数学方程编码到我们的这个大模型中，以后可以促进它与基础学科比如说分子动力学、流体力学、传热学、生物学等等的结合，去帮助我们发现更多的科学规律。

那么当前华为的这个盘古大模型，我们已经发布了盘古科学计算大模型，在这个科学计算大模型下，我们这里面包括了药物分子的大模型、盘古气象的大模型和海浪的大模型，我们和科学家共同合作取得了不错的成果。比如说像这个大屏上显示的，在气象研究这个领域，目前我们的盘古大模型可以在几秒的时间内就可以完成对未来全球一个多小，一个小时到七天，它的这个气象情况的这个预报又快又准，这里面就有几个关键就充分学习，它需要充分学习40多年的这个气象数据，同时还要结合这个气象行业的这个知识去不断的进行训练和这个矫正。

不断进行训练和矫正同样的工作，我们正在多个科学研究的领域正在展开，我们希望通过我们的努力，真正围绕AI for science去为科学家，为科学工作者带来更多的新思路、新方法和新工具，也为我们整个人类社会的发展输入新的动能。最后在这里我也想打个这个，打个小广告，因为明天的这个我们华为要开我们全球的这个开发者大会，明天在那个会上我们会详细的向大家解读华为的这个盘古大模型3.0，我们怎么样去为千行百业服务，为科学研究服务，也希望得到大家的关注。各位朋友们，我们非常有幸，共同见证了科技革命的几次浪潮，从互联网到移动化，到云计算到人工智能，每一轮的变革都带都给社会带来了深远的影响。毫无疑问，站在今天，通用人工智能正给我们无穷的想象空间，也正带领我们走进下一个黄金的十个十年。我们希望和大家携起手来，共同创新，来让人工智能更好地服务千行百业，更好地服务科学研究。AI for industry，AI for science，让我们一起来共赢人工智能的新时代。谢谢大家。

好，谢谢掌声，感谢胡厚坤先生来自华为的观点分享，再次感谢您各位。生成式人工智能的爆发式的发展带来了前所未有的机遇，但是与此同时，另一方面也使得AI治理成为了迫在眉睫的全球议题。接下来，图灵奖得主杨立昆先生将会带来他关于a i，对于a i治理的思考。请分享他与地平线创始人兼CEO余凯先生的精彩视频对话。请看大屏幕。So in.

Your view.

What's the most exciting.

在你看来，在过去的十年里面，人工智能最让人激动的进展是什么呢？总体来说，自主监督运行真的创造了一场革命。当然，自然语言处理，我认为语言模型、语音识别之类的翻译任何与符号或者本质上和符号序列有关的东西。我们现在要做的就是在图像和视频领域推动同样的革命，它已经开始生效了。当然，Transformer架构上也有很大的进步，现在我们相当于排列的Transformer。对平移不和排列不，对吗？我会说平移等。换句话说，如果你平移，输入输出也会被平移。然后对于Transformer而言，如果你重排输入重令牌输出，令牌既或允许，反之则不变，这是另一种等。如果你把两者结合起来的话，你可以做很多事情，什么都能做，几乎所有的事情。是的，最近我从公众媒体上注意到了你也加入到了这场有关ChatGPT或者大学语言模型，而不是AAGI终局的一个辩论。

i know you are。

我知道你回答说不是，那么我要问的问题就是，那么有关这项技术是否是通往AGI的正确之路？你的实际判断的基准是什么？你评判的标准又是什么？你可以使用的一个标准就是系统的功能是什么？他们漏掉了什么。如果他们漏掉的是一些非常基本的东西的话，那就意味着你所看到的系统是不足的。系统可能有用，可能也希望用它做点什么，可以加载很多应用，但它不会是走上通往人类智能水平的道路。

我并不喜欢AGI这个词，因为每一个智能都是专项的。人类智能也是非常专业专项的。所以第一个他们只用文本训练，对吧？你也无法使用图像或视频来训练他们，因为他们是用户生成式的架构。他们会试图去预测文本中缺失的单词。事实上，像ChatGPT这样的自回归类的模型只预测长文中的最后一个单词，对吧？这他们试图要做的。但这样做的问题是，你不可能准确的预测文本中缺少的那个单词。什么？你必须要预测在你字典中所有单词的分布。在一个典型的大语言模型中间。LM最大的令牌数量大约为数万，所以没问题。如果你想应用同样的想法，真正式架构会预测视频中间接下来会发生什么的，对吧？这样你不再有令牌，而是会有视频帧，你训练他们来预测视频的下一帧。

那么那一首先这个问题很简单，因为下视频的下一帧会和上一帧类似，对吧？差别会很小，系统学这些东西不会学到很多，这是第一点。第二点我们也不知道如何来表示所有可能的视频帧集合上的分布，做不到，我们也没有模糊视频帧的次集合，对吧？所以无法预测视频中之间正中间可能出现的所有细节。

很多事情是完全不可预测的，所以你要做的就是使用不同的非，你就要做什么呢？用不同的非生成式的架构，他们不是试图重建一切，而是试图预测一种消除了很多细节的呈现。这就是艾杰帕背后的思路，它联合和构建了预测架构，而不是在像素中间输入空间进行预测，在表征空间中做预测。然后问题就是你怎么训练它？这是另一个问题了，你怎么训练系统，让他学习潜在表征不崩溃的情况下学习该空间中的预测，这是LMM能做的第一件事，对吧？他们首先LAM不能用图像训练的，除非你作弊，对吧？不然他们更重要的一个事就是，他们并不满足于一个目标。你们不能给他们设定一个目标，只有通过设计提示，然后祈祷你训练的这个数据的统计数据足够优质。

系统可以基于此产生正确答案，但基本上控制不了，你不能指定一个目标，让系统检查是否已经实现了该目标，对吧？那么与子系统相关的是什么呢？当前的LM还是回归的LM？他们一个接一个生成令牌，不能提前规划他们的答案，所以他们不了解全貌，因为他们只基于文本训练，不是利用视频训练。他们不理解物理世界，没办法规划，没办法推理，就没办法实现目标。这就意味着要实现智能系统的话，我们还缺少非常重要的组件。我们或许有可以通过律师资格考试的LM来最终考试。它不是个很复杂的问题，它考的就是信息检索这样的一个能力。但是我们没有足够智能的系统，即使我们要能处理这些事物的机器人，我没有办法清理餐桌，把碗碟放到洗碗机里的系统，所以你需要一个视角模型，在人工智能的系统中间，这个模型主要通过观察来训练，少量通过交互可以处理不确定性世界模型就像人类理解世界的方式一样，通过物理、直觉等方式了解世界的一切。

这里刚才提到的，我认为对于未来10年的人工智能研究来说是个巨大挑战。如果允许AI形成像人类一样的意识和智慧，那我们该如何满足道德规范和治理的要求？毕竟人类花了很长的时间来建立起目前的道德规范和激励机制。就在这种情况下，人类对AI的干预机制是什么？我想这目前也是一个重要议题，在你看来，我们该怎么做？我要做耳机的。我认为如果你认为达到人类水平的人工智能，最好办法就是做更大的自回归l l LLM模型的话，然后利用多模型数据进行测试，你可能就会认为这些人工智能系统是不安全的，但实际上我不认为这些系统可以非常智能。让它们变智能的办法也是让他们变得可控的办法。这就是目标。驱动人工智能的理念，本质上就是给他们必须满足的目标。对的，这些目标有些是由任务定义的目标，比如说回答问题了吗？开你的车了吗？清理餐桌了吗等等。其他的目标就是安全护栏了，比如说不要伤害别人。

好吧，这有点像人类的恐惧或者痛苦，如果你违反了其中一个目标，这就违背了你的天性，你就做不到了，对吧？这也是类似的，这些系统不会出现一点一滴的渗透来欺骗或者支配人类的行为。我们可以设定迫使人工智能诚实的目标，比如说迫使它屈从于人类的目标。小心那些会让他们想要好奇的目标，或者要让他们接受到不该拥有的资源的这些目标。那就类似的这些事情，我认为这个系统将完全可控，可操纵。系统可以被设计的安全不容易，但是设计这个目标就是让系统安全，这是一个非常艰巨的工程挑战，我们不一定一开始就把它做好了，我们可以向老鼠一样聪明的系统开始，对吧？我们把它目标，把它变成一个好老鼠，然后让它变成一只猫、一条狗或者一个黑猩猩那样聪明，然后逐步提高。在我们努力的过程中，我们也会解决一些目标问题，让这些系统能够正常运行。我们把它放进沙箱、仿真环境中间进行测试，我们要确保他们是安全的，这是很重要的问题。

你知道有一些人，因为他们害怕人工智能的结果，基本上就是希望人工智能受到严格监管。因为他们说如果任何人都能掌握人工智能，因为他可以用人工智能做任何想做的事情，情况就危险了，所以必须要严格监管他们。我完全不同意这说法。相反，我认为从长远来看，要要让人工智能平台安全、良善并且实用的唯一的办法就是让它开源。

想象一下未来我们每个人都通过人工智能助手和数字世界来进行互动，比如说10年或15年之后，我们只需要和我们的人工智能辅助系统兑换，我们所有的信息都会通过这个人工智能助手系统。如果技术只是被少数控制公司来控制的话不是好事。未来的人工智能系统应该成为人类所有知识的保护，他们训练的方式必须要基于众多的源头，这样我们希望看到更多的开源LLM和更多的开源AI系统。

好，掌声，再一次谢谢两位对谈给我们带来的精彩观点，谢谢。为我们展现了对于创新问题如何来另辟蹊径，用创新的方法来加以解决。好各位领导，各位来宾、女士们、先生们，接下来我们要现场颁发卓越人工智能引领者SEO奖，这是世界人工智能大会的最高荣誉，前几届此殊荣的获得者以卓越的创新成果引领了全球科技和产业的发展潮流。现在就让我们一同来见证本年度卓越人工智能引领者cell奖的诞生。请看大屏幕。

2023人工智能引领者奖颁发给中国商用飞机有限责任公司上海飞机设计研究院三维超临界机翼流体仿真重、器东方易峰上飞苑气动设计团队针对飞机三维机翼的复杂流动仿真场景的需求，基于昇腾AI及昇mindspore AI框架，打造了工业级流体3D仿真模型东方逸风，可在保证仿真精度的同时提高仿真效率，大大缩短研发周期，为大飞机插上智能翅膀，以科学智能赋能气动领域跃迁式升级。

华为云计算技术有限公司华为云天筹AI求解器解决各种类型的角色优化问题，可满足云上各类决策优化需求。基于求解器的决策优化工具方法，可为企业带来新的运营方式，在决策机制上降低对人的依赖，尤其针对供应链及制造管理方面带来质的提升，从而显著提高企业的收益增长速度，提升企业成长空间。

高通无线通信技术中国有限公司第二代骁龙8移动平台的人工智能引擎。高通公司第二代骁龙8移动平台搭载的最新一代高通AI引擎提供卓越硬件加速和软件方案能力，结合高通AI软件站和AI studio，可提供全栈AI优化。行业内率先支持终端侧生成式AI用例，并协同云端一起打造适应大模型时代的混合AI架构。

晶泰制药技术上海有限公司晶泰科技智能化自动化药物研发平台，以量子物理、人工智能、云计算及大规模实验机器人集群等前沿技术与能力，让药物研发更智能，让生物创新触手可及。已服务众多国内外知名药企参与创新药管线超180条，服务客户超200家。

张云卫剑桥大学机器学习结合组抗腐技术预测锂电池老化。该论文创新性地将机器学习算法与电化学阻抗谱技术相结合，发展了一套智能电池预测方法，该方法能够准确预测锂电池的健康状态和剩余使用寿命，这是一项人工智能在电池诊断领域中的重要应用。该电池预测方法在大型电气设备如电动汽车和便携式医疗设备等的电池管理系统中具有实际应用价值。

各位，让我们用热烈的掌声祝贺以上5个获奖项目，有请获奖代表上台。掌声欢迎各位来台上，请，欢迎各位，接下来我们要有请教育部副部长陈杰先生和中国科协专职副主席、书记处书记述为先生上台为获奖项目颁奖。有请两位，好，让我们用再一次热烈的掌声祝贺我们今天在台上的5个项目，用卓越的创新成果引领全球科技和产业的发展，邀请我们的颁奖嘉宾加入他们的行列，一同合影留念。我们也特别提议，请大家高高举起属于你们的这份荣耀和奖杯，祝贺你们。好，再次祝贺各位，谢谢，请入座，感谢，期待着未来能够再接再厉。各位来宾，女士们、先生们，近年来，上海全力布局人工智能前沿技术创新领域的开拓发展，基础研究和原始创新在不断加强，一些关键核心技术实现突破，不少研究项目取得重大成果，助力中国加速进入创新型国家的行列。那么接下来我们将会在现场来发布一批重大创新成果的首秀，他们是书生通用大模型体系、复旦数字孪生大脑、张江super city、傅里叶通用人形机器人Gr one接下来让我们掌声有请，上海市常务副市长吴青先生上台启动成果首秀发布仪式。掌声有请吴市长，好，让我们一起来共同见证这一荣耀的时刻。五市长请做好准备321发布，谢谢吴市长，请您入座，感谢。

上海人工智能实验室发布书生通用大模型体系，包含多模态语言、三维空间三个性能卓越的基座模型，实现跨模态无缝整合，贯穿数据训练、对齐、部署、评测五大环节，面向产学研全链条开源开放，为无限创新提供启迪和支撑，以原创技术引领未来。

what you do？世界上首个具有860亿神经元规模、与人脑结构和功能相似的数字孪生脑，在数学上解决了大模型百万亿级参数推断的难题，在通信上突破了每秒百万级b海量脉冲长城传输拥堵瓶颈。在认知上成功模拟了人类视觉和听觉任务的情感评估。这项工作对于未来计算、神经科学、类脑智能和脑健康领域的应用具有十分重大的意义。股东张江科学城用世界最先进的大规模数字底座技术，绘就独一无二的4.1平方公里张江未来之城。数字孪生时空计算生成式AI交通流量全掌控、城市街景全复制、产业空间全感知加速数据算法、算力的集成化突破，承载上游、中游、下游创新技术的全面连接。张江未来之城创新梦想之地。物理业智能携全新通用人形机器人Grone闪耀登场，掀起AI具身智能新浪潮。凭借多年技术革新与沉淀，GR one拥有令人瞩目的运动能力，快速行走、敏捷避障、直腿行走稳健、上下坡冲击干扰应对、与人协同完成动作等，展现出了堪比人类的运动表现。通用机器人时代，傅立叶智能将继续为世界贡献中国智慧和解决方案。

好，让我们用掌声再一次祝贺以上重大创新成果在大会开幕式上的首秀，祝贺他们，谢谢，各位领导，各位来宾、女士们、先生们，接下来我们将会有请微软原执行副总裁、美国国家工程院外籍院士沈向阳先生和IEEE主席兼首席执行官塞伊夫拉曼先生、miss塞伊夫ramen来上台对谈，畅聊AI时代的科技合作。掌声有请两位。

Ramen教授，欢迎来到上海，这也是我爸爸的一个美丽的这个故乡，那么我们都来在上海，同时你也是IEE的主席兼的首席执行官。那么根据我的理解，其实IEE这个组织也可以说是最大的一个，我们工程学方面的一个专业的组织。您能跟我们来谈一谈IEE这个组织吗？好的，非常感谢能够邀请我来参加今天的会议。IEE在全球其实是有43万多个会员，那么中国的这个会员数是第三大的，所以说我们不仅仅有我们的会员，同时我们也开发相关的标准，我们还会出版论文，同时也会组织一些会议，这些都是非常重要的，因为IEE在全球的话其实每年都会举办2000多场的会议，在这2000多场会议当中有200场是在中国举行的。所以我们也是对中国和中国的科学家作出了这样子的一个承诺，把我们的组织提高他们的相关性实在是太好了。

我们现在在中国，您能不能简单的来讲一下IEE在我们这方面做了一些什么？同时您作为领导人在我们i e有一些怎样的新的举措？其实其实我觉得我们去主要的去看我们的这个组织的话，就像我们，就像前面的这个伊隆马斯克讲到的这个AGI，还有我们还有很多的其他的这些开源的、人工智能的这些工作都是我们所做的，我们也是开源的，我们是希望能够保证所有的这个通用的人工智能的发展，包括人工智能整体的一个发展都能够是开放的，如何来实现？如何来保证？我们必须要确保所有的这些人，如果他是在这些领域进行研究的话，他们有一个讨论的这个地方，能够来讨论他们的开放，他们的发明如果能够公开地来进行讨论的话，如果他们觉得太危险，那么就需要有一定的这个防御，这就是开放性。同时还需要用开源，我们要它的基础必须是开源的。

除此之外还有一点就是人工智能也需要人力，需要算力，对吧？前面我们也听到了，那么我们大部分都是不能够在秘密的状态上进行的，我们不能够突然说我突然想出来一个东西，然后你去监管，所以我们提供了一个平台，提供了一个基础，让科学家、工程师和开发者能够共同的来看来讨论他们所做的工作，希望通过这样能够来确保我们能够加以控制。

好的，非常感谢拉曼教授，我很同意你前面所说到的，就是我们很感兴趣看到前面的两位嘉宾，Elo Max和很多的一些人也讲到了这个是很吓人的，需要来监管。但是也有人来说有什么可以需要监管的？我觉得这个是不同的一些观点，不同的角度，从科学家的角度来说，我们要做开放的研究，像我是来自于业界的，同时我们是开发AI产品的。

我非常同意你前面所说的，我们还是要有一定的监管，要有一定的保障，因为人工智能变得越来越强大，那么为了实现这一点的话，我们也是认识到了社会的力量，我们必须共同努力。比如说微软和谷歌，包括其他的公司也建立了我们的partner，是Bing、AI这样子的一个组织，那么它的影响力也非常的大。

除此之外，我觉得像IEE这样子的这个组织，您所代表的这个组织也有很大的这个力量，因为你们是一个中立的位置，你们可以去影响相关的这些这个公司和国家，对吗？对，我觉得你说得非常的对。其实我作为IEEE的主席，我们关注开放性和全球化，那么我也是多次强调就是好的科学无论发生在哪里，那么是对于各地的科学都是有好处的，我是鼓励这么去做的。我不论是中东、南非，还是中国，还是北非，或者说是在北美，那么无论在哪里，我们大家都要共同的来进行探讨。我也是鼓励开放的科学，同时也鼓励大家在我们的会议和期刊当中发表你们的结果，可以提高可见度。

我们跟今天的会议就是一个很好的例子，我也希望能够看到这所有的这些成果，不仅仅是在上海，在全球都有可见度，我们的这些知识，我们的这些想法可以变得更加的实际，的确是如此。另外其实我也一直非常尊重IEE，因为这个组织其实也是帮助了很多很多的专业的人士，电气工程师、电子工程师、电脑的叫这个科学家，那么你们他们不从这个基本的会员到高级的会员到研究人员，那么讲到科学发展的话，我觉得IEE的这个研究者其实在各地都是很受尊重的，不仅仅是在中国，我也是非常的骄傲，我有7个学生都是IEE的他们的研究人员。

那么我知道您也是非常的关注，要进一步的来推动这些专业人士的职业的发展，特别是扩充中国IEE的会员的数量，同时也要增加中国的专业人士能够加入IEE这样子的一个组织，能跟我们来分享一下您的组织目前在这方面所做的一些工作吗？在我回答这个问题之前，我也想要指出这样子的一个数字，就是IEEE，其实每年的话的我们出版的这个论文来自于中国的大概是有30多万个作者，那么其实有很多的这些中国的作者都在我们的期刊上发表论文。

我们建立了一个社区，我们在几年之前在中国设立了这样子的一个社区，鼓励更多的这个工程师成为我们的会员和高级会员。那么其实我很多年前就成为了研究人员，我希望看到更多的中国的高级会员成为我们的研究者，包括更来自于香港地区和台湾地区的，这也是我对大家的一个鼓励，要提高可见度，我会给大家找到推荐人成为我们的研究人员，这样在全球可以获得认可。所以我们承诺于开放和沟通以及合作好。

另外一点，其实我也非常尊重IEE，正如你刚才所说的，就是你们组织很多的会议，有很多的这些期刊都是你们进行出版和赞助的，我也非常的听惊讶，听到您看到提到的数字有几千多个，那么我是第一次发表我的论文是在IEE的这个是关于是我们的这个机器智能方面的这个论文。

我感觉我就非常的激动，世界也正在发生变化，我们也是转向了一个数字的世界，数字的图书馆，那么现在我们也参加的是世界人工智能大会，在谈论的是AI，在AI的时代，在这样子的一个ChatGPT技术的这样子的一个时代，你们又会做些什么呢？比如说你们的期刊，你们的会议，你们会不会有所改变？因为能够寻取有一些新的这个形式来帮助人们更多的去理解相关的这些AI的知识，这一点我觉得非常的好。

其实从疫情当中我们也学习了很多，疫情当中我们不能够有很多的旅行。现在我们有一些会议是混合形态的，有很多也是网上的会议，我们也会有全息影像的这样子的一个会议，感觉非常的有现实感。我们用这个全息的影像感觉你实际上是参会的，但是远程的这样子也可以来确保你可以你在这里，但是可以在伦敦和纽约参会，这也是我们的任务，要让IEE成为一个更大的一个创新和包容性的一个灯塔，任何一个，比如说南京的一个小孩子可以跟我在华盛顿进行无障碍的沟通。

太好了，就算你不到上海，但是如果你不来上海的话，你就尝不到上海本地的美食了。那再问您最后一个问题，我知道你也是来过中国很多次，那上一次的话，你应该是印有过在这个中国VI个大学的这样子的一个教授的头衔。那么给我们来分享一下您的这个经验，就是您在中国的这些经验。是的，我通经常会来到中国，我也去过很多的这个大学。我感到非常有趣的一点就是那些年轻人，他们都是非常的具有好奇心，问很多的问题。为什么呢？因为某一天他们希望自己也能够成为知名的科学家，他们想要做出自己的贡献。所以我觉得好奇心发问要设立高的这个目标，要努力来确保你的目标能够实现是最为重要的。

好的，那在您的鼓励下，在您的领导下，我相信会有越来越多的中国的专业人士加入IEE，同时我们也可以把IEE的会员的数量能够翻一翻，能够是超过100万。然后我也是在这边是讲到，对于我们中国的大学，中国的业界来说，也是一个很好的机会，能够和IEE进行更紧密的一个合作。再一次感谢您来参加我们的世界人工智能大会，谢谢拉曼教授，谢谢。

好好好，谢谢，thank you very much MR safe Ramen，thank you。谢谢，谢谢沈向阳先生，谢谢赛义夫，拉曼先生，谢谢两位，在这里我们要特别谢谢沈向阳先生，在每年大会的开幕式现场都会带一位朋友来到舞台上，和大家一起来分享他们的对谈内容。再次感谢AIGC不仅是重塑了人工智能领域的产业格局，更是创造了全新AI赋能的模式和路径。接下来我们要有请微软全球资深副总裁、微软大中华区董事长兼首席执行官侯阳先生为我们带来他的精彩分享掌声。有请。

尊敬的陈书记、龚市长、各位领导，各位嘉宾，大家上午好，我是侯阳，很高兴能够代表微软公司再次参加世界人工智能大会。今年世界人工智能大会的主题是智联世界生成未来，我也想借此机会在这里与大家分享微软在拓展生成式人工智能的生态创新，以及加速推进产业智联的过程中收获的一些经验和思考。人工智能作为科研项目最早出现在1956年，至今已经发展了将近70年。随着去年底ChatGPT的一夜爆红，大模型和AIGC生成式人工智能仿佛在瞬间爆发，甚至很多科技行业的从业者都对AIGC的突然涌现感到惊诧不已。其实在微软看来，所谓的涌现也绝非偶然，无数优秀的科研人员、数十年如意制的研究基础以及海量计算资源的投入，才造就了这样的创新的成果。也许大家知道，OpenAI chat GPT的突破靠的正是微软智能云提供的基础架构和算力支持。从2019年开始，微软就和OpenAI展开深度合作，以海量的云计算资源支持OpenAI大语言模型的研究，而双方战略合作的基础就在于，我们两家公司都真诚的希望创造出造福每一家企业和每一位消费者的人工智能技术。

在今年1月的达沃斯世界经济论坛上，微软的CEO纳德勒先生提到，人工智能的黄金时代已经到来，微软智能云也由此开启了加速上新的模式。我们将最新的AI智能技术与企业级的云服务全面的融合，从而赋能广大企业在产业数字化转型进程中实现真正的数智融合。我们的h OpenAI企业版服务推出了包括GPT 4和企业级ChatGPT在内的五大模型，支持客户创造不同产业需要的定制化的智能服务，同时围绕Microsoft 365办公Dynamics 365商业应用、Git Hub开源社区开发、数字信息安全保护、员工体验提升以及我们每个人所熟悉的Windows操作系统，微软也推出了一系列由AI驱动的Copilot智能副驾服务，用户可以用自然语言提出需求，Copilot就能帮用户高效的完成一系列的任务。比如快速的写代码，开发出一个应用，或者根据演讲的提纲要点设计出一整套图文并茂的PPT演示稿。

那么刚才我举例的这些场景，在今天，我举例的这些场景，在今天已并非凭空的虚构，这是微软在内的，已并非凭空的虚构，这是微软在内的很多企业已经实践的现实的工作场景，比如备受关注的HOPTI企业级服务上线几个月以来，已经得到了超过全球4500家企业的首肯，在制造、零售、金融、服务等多行业的生产环境中已经在实践智能化的创新。

再比如用于辅助编程的Git Hub Copilot自推出一年半以来，已经有全球100多万的开发者在使用，他们有将近一半的代码都已经有Copilot帮助完成，并且编程的速度提升了50%以上。在全球客户对微软人工智能服务的这些积极的尝试当中，我们不仅看到了企业加速数字化转型的创新的热情，更是感受到了市场对新一代生成式人工智能的迫切的需求。因此，微软也在不断的持续加大投入，全力推进生成式人工智能的发展和普及。在今年5月举办的微软全球开发者大会上，微软就连续发布了超过50项与生成式人工智能开发相关的新技术和新服务。其中最重要的一项是我们向全球开发者开放了Copilot智能副驾与plugins插件拓展体系，让全球各地的开发者、合作伙伴和企业用户都能够抓住生成式人工智能带来的创新机遇，创造出前所未有的新一代的智能应用。其中，plugins智能plugins插件拓展体系采用与OpenAI相同的技术标准，它可以在第三方应用客户、业务场景和生成式人工智能之间构建起安全可靠的连接。

通过plugins接入实时更新的信息流以及多种多样的应用和服务，就可以为AI系统添加更具专业性的计算能力，创造出种类更丰富、使用更便捷、信息更准确的智能副驾式的对话服务。预计到微软Microsoft 365 Copilot正式发布的时候，我们将提供超过1000种plugins插件供开发者选择。

而更加岂值得期待的是，全球的开发者和合作伙伴将有能力自主运用这些插件接口和智能服务，开发出更多更丰富的、独树一帜的智能副驾驶的创新应用。那么，毫无疑问，这些是基于自能自然语言对话的。新一代的智能交互应用将为我们开启一个更加精彩纷呈的数字世界。微软坚信，今后任何一家公司都需要具备驾驭数字技术的能力，我们也看到随着生成式人工智能不断展现出的巨大潜力，今后每一家公司的每一个应用程序都将由人工智能来驱动。

人工智能的技术突破也正在为各行各业带来千载难逢的创新机遇和挑战，这也促使我们思考如何用它来提升企业自身的创造力和竞争力。在实现技术突破的同时，微软就在思考如何将研究成果转化为生产力。我们希望在第一时间将生成式人工智能与产业的需求相结合，加速产业的升级和创新。我在这里展示的是根据近期全球客户的产业智能化解决方案总结出的六个重点的行业应用人工智能的创新化场景，其中就包括比如优化制造与能源行业的供应链韧性、普及预测性的维护，以及提升智能驾驶的体验。再比如，我们可以革新零售电商的智能客服，实现互动式的搜索，引导消费的趋势。我们还可以在游戏中构建栩栩如生的NPC角色，生成无限的剧情和拟真的对白。在金融行业，我们可以随时获取金融市场实施行情的分析报告，更早的发现，更快的管控潜在的金融交易风险。同时，在生命科学研究领域，我们也可以提升临床实验数据的分析能力，加速药品和疫苗的研究，实现更精准的医疗影像识别和诊断。那么同时，在教育领域，我们可以也为学生带来更具启发性、交互性、定制化并且不受地域限制的探索式的学习方式，我们可以帮助培养更适合未来市场需求的有创造力和终身学习能力的人才。随着生成式人工智能不断加速产业融合，相信在今后的几个月，将会有更多丰富多彩、充满想象力的应用场景不停的涌现出来。那么在人工智能加速发展的过程中，不可避免会出现人们对潜在的安全风险的担忧。微软一直倡导并严格的恪守打造负责任的人工智能的这六大原则，我们也始终严格遵守与数据隐私、安全合规相关的各项的要求。同时我们也积极的倡导全球科技企业通过交流合作形成产业共识，确保我们所开发的人工智能技术能够负责任的造福全人类。面对新一轮的技术变革带来的巨大的创新机遇，微软在中国愿意从我们自身的技术和优势资源出发，深耕中国的本土生态系统，与全国各地各行各业的企业组织和合作伙伴持续的拓展技术交流和业务合作，与全国不断的发掘数字化智能在各个产业中的应用潜力，真正的推进各行业的智能化创新与数字化转型，贡献我们最积极的力量。人工智囊的黄金时代已经到来，微软也将在这个黄金时代中持续努力，充分发掘科技潜能，渔利全球的每一人，每一组织，成就不凡。谢谢大家，谢谢。

谢谢，感谢侯阳先生的精彩分享，我们也更多看到了侯阳先生对于创造未来的满腔热情，再次感谢以并肩合作激发人工智能的持续突破，以共同创想开创更为美好的未来文明。接下来我们将会邀请几位专家学者和企业家，从不同的领域和角度来围绕着创想共论质变可能这一主题来展开现场的讨论对话。接下来我们要分别请上的是图灵奖得主、上海七制研究院院长姚期志，有请清华大学交叉信息学院助理教授袁阳，清华大学交叉信息研究院助理教授萌shot AI创始人杨直玲、Jack第一作者、南洋理工大学计算机科学与工程学院助理教授潘新刚。我们要有请商汤科技董事长兼CEO徐立先生担任这一环节的主持人。接下来我们把舞台和时间交给他们，各位来，我们掌声欢迎他们。

各位嘉宾，好，很荣幸今天能在这场做这个主持，因为这场由我们这个计算机界的title姚院士以及我们三位非常年轻的学术之星，可以说这三位代表了我们这个人工智能的一些新的发展方向。所以话不多说，我开始简单的来介绍一下，来看启动一下我们的这个环节的论坛。

那么那首先这个姚院士，我们知道姚院士是图灵奖得主，并且是在清华创办了交叉信息学院这个量子学院。然后其实现在大模型发展的速度非常的快，我想请教一下姚院士说在大模型的发展的今天这个环节当中有没有一些从您看到的一些基础理论的突破，以及基础理论的突破，接下来有些哪些发展的方向？这些。

非常好的问题。今天我们听到汤小娥教授，他已经谈到过我们中国的科学家在这个现代的AI的发展上做了很多突破性的贡献。那么我在这里我想我就提一个，我们有一位年轻的高阳老师，那么他在一年多以前做了一个非常重要的在算法突破上的贡献，那么受到很多的国际关注，那么它基本上它就是能够把现在非常主流的强化学习，它能够加快数百倍。

那么让我来解释一下，在这个ChatGPT以后，也以后下一个非常重要的目标就是让智能机器人，它有这一种视觉、听觉等多种感知能力的机器人，它能够在一种各种不同的环境里面，他们能够自主的学习各种的新技能，那么但是现在的不。一般的强化学习的方法它就太慢了，因为他们对于这些新的技术常常要几个月的时间才能够学好。那么高阳老师他的一个突破就使得强化学习它能够在几个小时就能够做到。所以您可以看到这些智能机器人将来的发展里面，一定会要把刚才这个工作能够放进去。

那么同时这个它不仅是一个实用的一个问题，而且它有一个理论的一个贡献，就是在过去的六七年里面，人工智能在最高层上面这些思想家他们有一个路线之争，就是说我们现在把这个依赖着强化学习这条路线是不是正确？所以有很多的争论，那么我想高阳教授他这一年多以前他的这一个突破，我觉得把这个天平方向的另外一边，就是我们应该坚持就是我们现在这条路，对于通用人工智能它的完善还有很长的路要走。那么难怪OpenAI它的联合创始人将Schumer，他在不久以前，他在一个interview里面，其实他就把这个高阳老师他的这个工作当作近年来在强化学习里面最重要的亮点之一。我现在只是在做一个广告，我们明天汽车研究院要主办一个具身通用智能的一个分论坛，那里面大家可以遇见高阳老师，那么同时还有其他很多的中外的在基础理论跟框架上的贡献。

嗯，好，谢谢姚元士，我们也期待全化智能在这个具身智能的这个领域上面能够有更大的这个成就和突破。那么接下来我们这三位教授是非常年轻，两位是差院的教授，一位是这个NTU的这个教授。然后我想起人工智能当时起来的时候，56年时候那篇proposal，其实四位学者的平均年龄是33岁，我看了一下我们这三位教授的平均年龄还不到33岁。那我们接下来想请问一下元阳教授，这个其实元阳做的也是做大模型，也是在智能医疗方面有很多的研究。所以我想说在大模型的这个演进发展过程当中，这些交叉学科其实对模型的这些发展有没有什么进一步的帮助？

谢谢主持人。那个我觉得大模型现在特别大家特别强调能够用到一些交叉的那个行业里面，能够落地应用起来。大家会讲到多模态这个事情肯定是很重要的，就是但是我觉得大家对多模态的东西的理解可能比较粗糙，大家往往想到的多模态是他能够看图片、看文字，有触觉、有温度的感觉。但是我觉得要真正做到一个具体行业，能够解决行业里的问题多么太需要做的更细致一些。

比如说我举个例子，嗯，像一会儿潘老师可能要讲的那个Dragon，我们如果只是考虑文本到图片的一个生成，那么那个你说一句话要画一只狗，然后它生成一个狗的图片，但是这样的话很可能你会发现你生成那个狗的图片不是你想要的姿态或者模式，然后你可以用鼠标来拖动一下，修改一下这个鼠标拖动的这种方式。

在我看来这是就是一种新的模态，用户用一种比较好的方式把自己想要表达的内容告诉大模型，让他能够理解。那虽然它可能只是一种鼠标拖动，但这种多模态的输入我觉得在具体应用中非常重要。那到更具体的一些行业，比如说医疗、法律、教育，我觉得我们可能不应该只是把文本或者图像给模型，让他有一些专业的数据，就希望他能够解决专业的问题。

我们应该去深耕这个行业，去找到它里面最核心的问题是什么，然后再去找在这个问题里面我们到底需要什么样的模态的数据，什么样的信息能够精准表达我们想要解决的问题？这个我称为是一种模态的补全，然后模态补全之后我们也需要。嗯，在补全的模态的基础之上收集足够的数据，做好模态的对齐。模态补全，模态对齐做好之后，我相信它能够赋予大模型更强大的能力，来解决更核心的一些交叉领域的问题。

好了，谢谢袁老师。模态补齐之后可以相当于是这方面的know how，对于后面的发展是有很大的帮助。我们来问一下这个杨志玲，这个杨志玲也是誉为说天才少年，然后我也看到过他很多的工作，包括他也参与到大语言模型非常早期的一些工作。那么我想现在大语言模型应用很广泛，但是也会在实际当中会遇到一些问题，比如我们经常提到的幻觉等等的一系列的这个挑战。所以想请问一下说在大语言模型的实际使用当中，我们有哪些困难和挑战？或者要注意哪一些方面上的具体的。

点？非常好的问题，现在确实有很多这个大模型方面的还没有解决问题，比如说安全性怎么让他做到非常可控？然后包括就是去避免它产生这种幻觉，不去编造一些很不存在的东西，包括它现在其实也没有办法，比如说像科学家一样去创造新的知识，或者说在很多行业里面像最顶级的销售或最顶级的产品开发这些工作可能现在都还没办法做。

那我认为这里面很重要的一个点还是说我们去思考这些问题的时候，更多的不是说每个问题去单点思考。比如说今天我想解决幻觉的问题，那他可能更多的不是去头痛医头，而是可能更系统的去抽象出来这些问题之间到底层都是什么样共通的问题，回到更本质的这样的一个层面去解决，因为毕竟是通用的模型，其实我们希望它能够在这些方面都能够就是一举一反三。

所以更本质的话，我觉得其实还是要去做更规规、更规模化的、高效的压缩。比如说去用更好的、更适合分布式训练的这种框架，类似比如Moe，或者就是更支持更长的上下文，包括就是在这里面怎么样去更好的分配算力，对更高质量的数据分配更多的算力，就类似这样的问题，我觉得其实可以更根本的去解决。我们刚才可能聊到的现在AI的存在一些局限性，谢谢。

好的，谢谢。还是从理论层面上去解决，可能讨不得巧。然后今天我们的这个圆桌的背景都是用我们用算法生成的，其实都是基于discussion model的，但是这个新刚是以一己之力又把Gan重新拉回到大家的视野当中，他这个Dragon这篇文章是网上说爆款，然后说有手就行，大家就能来制作内容。所以也想听听新刚来讲说，比如说算法当中Gan和diffusion model的这个之争，这个算法本身路线选择有没有什么好坏？或者说在这之后您看生成内容的时候，我们会其实哪一些有可以更强的延展性？对。

谢谢主持人的提问。赣和diffusion model现在是图像生成的两个主要的生成模型，尤其是diffusion model在近期显然有盖过干的势头。那么我觉得他们由于生成里生成模型的框架以及优化目标的不同，主要有三个差异。那第一个是性能与效率的trade off。显然扩散模型在生成的过程中，它的需要的算力更大，它的迭代式的计算所需要的inference的时间和训练的时间都显著高于干。那么与此同时，更大的计算开销也带来了更高的图像生成的性能。它所生成的图像不会受限于Gan的mode CLAP的问题，它的真实性和多样性都显著优于Gan，所以我相信扩散模型它的上限一定是要高于干的。在性能允许的情况下，那么它对于质量和多样性方面的优势是非常明显，并且应用价值应用前景更广的。但是如果说在一些特定场合，例如Mobile device这些对于性能或者计算开销有限制的情况下，那么干仍然是一种妥协的选择。

那么第二点是它们Latin space的差异。那么我们知道Gan是将一个Compact latent Vector映射到图像，但是扩散模型是将一个和图像分辨率一样的noise map映射逐渐去噪，映射成为图像。那么在实践中，扩散模型的这种noise map，它对于图像内容的影响常常表现出来为比较随机，比较不具有结构化的特性。但是Gan的Compact latent code它更多的是体现成体现出来为这个高维的数据的一组低维的鸡，它可以非常有效的去编辑图像中的high level的属性，比如说人的表情或者动物的姿态之类的。这也是为什么我们选择将干作为drag这种编辑方式的第一个生成模型去study。但我相信之后如何去拓展到扩散模型也有非常也是一个非常值得探索的问题。

那第三点就是他们生成图像的这个空间的连续性上。那么由于这两个模型在设计的时候它的lip shes constrain不同，所以体现出来扩散模型的图像空间较为不连续那么深，Gan的图像空间非常连续自然，所以我们用扩散模型进行Latin space编辑或者视频的编辑时候，常常出会观察到跳变的情况，那么干中间我们去做这种Dragon的editing，它表现出来比较流畅，看起来像动画，所以那么这也是干的一个优势。那么将来如何把这两个模型各自的优势互补，会是非常有趣的研究问题。

好的，谢谢。就是get在前端或者连续视频上面有优势，然后diffusion其实在性能上会更好一些。那希望有一个更好的结合。那我再问一下最后一个问题，问四位，就是结合咱们的研究方向，就是觉得大语言模型在接下来哪个垂直领域里面可能最有，就是大家最看好哪一个垂直方向？

我想最容易的就是我们可以想到现在很多的文书工作，那么它的有了这个大模型的语言以后，更多的工作可以变得由这些机器来做，所以我想这个是一个直接。

的就生产力工具。文书工作。

元阳，对，我觉得是医疗，因为当然不光是因为我是做智能医疗，还有一个原因的话是因为我觉得大模型现在是基于预训练的这种范式，然后预训练的本质它其实在学数据与数据之间的关系，医疗里面有大量的关系，比如说患者的症状的关、与症状之间关系、与药物之间关系，吃了药之后会变成什么样子的这些关系。这些关系其实人类不一定能够学习的刻画的很好，我觉得在这方面大模型有可能做的比机器更好，所以我比较看好这个方向。好的。

谢谢。志玲。

我觉得比较重要的一个场景是AI将来应该会跟人一样有共同的记忆。比如说今天我们去用一个AI的话，还是需要每天给大家重新去灌输一些东西，给它提供很多上下文。那我觉得其实未来的话，比如说像最近也有像Rey的这样的产品，其实可以去，比如说通过录屏的方式，对吧？然后去把人更能看到的所有东西，其实AI都能看到，那通过这种方式其实我觉得可以在个人的使用上有非常大的想象的这个空间。对。

好，谢谢。姓。

高，我是做视觉生成的，视觉内容生成的，那么我觉得大模型之后，现在图像生成已经很好了，那么之后视频和三维内容生成也有非常大的前景，它可以帮助设计师、帮助艺术家、帮助动画制作者、影视特效师去更好更高效的创作更高内容的更高质量的内容。对。

谢谢，好的，谢谢。因为时间关系，我们的这个圆桌论坛就到此结束了，然后更多的工作其实可以关注各位老师的主页，我们他们其实更新的非常的快。好，谢谢大家。

好，谢谢，再一次谢谢各位的精彩分享，也谢谢徐丽携程为我们主持了这一趴的对谈，那我们也期待着未来人工智能将会在我们的日常的社会生活当中能够给我们带来更多的改变，能够给我们带来更多的帮助。再次感谢各位共筑AI生态圈是人工智能产业发展的基础，当大模型拥抱千行百业，一个数据创造、数据、知识创造知识的时代即将开启。为此，我们今天还将会在现场发起成立大模型语料数据联盟，让语料数据的涓涓蓄流汇聚成为大模型发展的澎湃动力。接下来，我们要有请大模型语料数据联盟发起单位的各位嘉宾上台。

有请中央广播电视总台编务会议成员姜文波，上海人工智能实验室主任助理王岩峰，中国科学技术信息研究所党委书记、所长赵志云，国家气象中心党委常委、副主任戴刊，人民日报社传播内容认知全国重点实验室专职副主任李军，上海数据集团董事长吴建雄，上海报业集团副社长丁波、上海市数商协会会长张琪有请各位。请各位嘉宾移步到大屏幕前，好，请大家伸出你的左手或者右手放在我们的启动装置上，让我们在现场一起倒数三21发布，谢谢，谢谢。正式成立，感谢各位，请入座，谢谢。

发展通用人工。

智能，谢谢各位营造产业。

创新生态，汲取高质量、多模态、宽领域的语料数据资源。为此，上海人工智能实验室、中央广播电视总台等8家单位共同发起成立大模型语料数据联盟，数联百亿据声万象。联盟将保障科研公关，坚持共享共用，推进安全发展，培育产业生态，让数据全方位服务通用人工智能。

各位来宾，当前，大模型已经是成为了通用赋能工具，引发智能时代的颠覆性变革，成为推动全球经济增长、重塑产业格局、巩固国家竞争优势的重要战略支撑技术。以模型能力测评验证作为抓手，构建具有严谨性、科学性、引领性的测评验证指标以及平台服务，有利于促进大模型和科研创新，客观评估大模型技术产品的水平及差距，从而推动大模型技术高质量发展，加速应用创新和行业落地。那么接下来，我们要有请中国信息通信研究院副院长王志勤、上海人工智能实验室党委副书记王平共同上台，启动大模型测试验证与协同创新中心的成立。有请两位。

好，接下来就让我们来共同见证大模型测试验证与协同创新中心成立这一特别的时刻，来，我们请两位嘉宾手握推杆，做好准备，来和大家一起倒数321启动，掌声祝贺创新中心成立，再次谢谢两位，请入座，感谢，大模型、各位领导，各位来宾女士们、先生们，数字经济是国家把握新一轮格际革命和产业变革新机遇的战略选择，移动信息产业链是数字经济时代协同创新的全新范式。

中国移动胸怀国之大者，勇担移动通信产业链链长的使命，创新规划了260亿产业链发展基金，落实央企提升基础固链技术补链、融合强链和优化速链的能力要求，发挥投验效应，打造验证格局，投资和培育深厚的中小企业，增强产业链供应链的韧性和竞争力，为国家现代产业体系构建发挥支撑、引领作用。

上海中移数字化转型产业基金作为落实中国移动与上海市战略合作协议的重要载体，在上海市委、市政府指导下，由中国移动联合成通集团、浦东引领区母基金联合发起设立，首期规模达100亿元。目前各项准备工作已经基本完成。接下来我们将有请中国移动通信集团副总经理高同庆、浦东新区区委副书记、区区长杭英伟，中国成通控股集团副总经理佟来明上台。启动基金的正式发布有请三位，欢迎3位嘉宾。

好，接下来我们将会来共同见证产业基金的现场发布。好，请三位嘉宾，将右手按在启动键上，我们和现场的朋友一起来倒数321发布，再次祝贺，谢谢3位请入座，感谢。

上海中移数字化转型产业基金旨在发挥中国移动链长使命，为上海打造具有全球影响力数字经济发展高地培育动能，为国家科技强国战略和长三角区域经济社会高质量发展贡献力量。

各位来宾，中移上海基金作为上海城市数字化转型的重要基金，将发挥资本纽带作用，助力上海经济、生活、治理全方位数字化转型。合作共赢是世界共同繁荣的基石。在我们的历届大会中，我们见证了一次次的团结合作、聚焦发展的精彩时刻。那么接下来，我们将会诚挚邀请大家共同见证联合国工业发展组织全球工业与制造业人工智能联盟，联合国工业发展组织国际工业与制造业人工智能发展卓越中心的发布仪式。首先请分享联合国工业发展组织总干事格尔德穆勒先生发来的视频，请看大屏幕。

好的，又回到了我们第一财经的3*24小时3*24小时的全程大放送的这样一个演播室的现场，这里是我们正在为大家直播的2023世界人工智能大会。回到我们演播室了，是这样，我们在整个这个为大家直播和转播的过程中，其实线上线下有很多朋友都在参与，都在看，但是也有很多朋友在这个时候他可能没有及时的看到整场大会开幕式到现在为止的一些内容，那么我这里为大家简单的来介绍一下今天开幕式的一些亮点。

好好，我来一一给大家来介绍一下这次大会的这个总体的架构，大家记住是一场开幕式，一场闭幕式，当然现在正在开幕式当中，然后还有一个科技创新和产业发展两场的这个全体会议，一场的科技创新和产业发展，然后两场的全体会议，另外十场的主题论坛以及n场的生态论坛。这是所有的一个总的架构。

那这次的亮点其实你没有看到，今天的大会你也有所耳闻了，就是这次大咖云集，我们看到目前的这个数字大概是1400位左右的这样一个嘉宾参会，这里边有四位图灵奖的得主，80多位国内外院士，这个阵容还是非常强大的，所以你应该是到现场来。好，那么今年的这个赛事，也就是说每年的这个大会上都会有赛事，今年赛事也是非常令大家期待和关注的，那就是说关世界人工智能创新大赛，还有一个黑客马拉松等等，这一共是四大赛事，那么这是有3000多支队伍参加，所以你可见竞争是如此的激烈的。好，这是一个点，那今年的这个展览是怎么一个情况呢？5万平方米的展区，那就是比前几年要大得多了，这个你都可以想象，这个领域包括了就是大家这一次集中，特别集中注意力要谈的大模型，这是一个，再就是芯片、机器人、智能驾驶等等这些，那今年的这个参展企业的数量又会怎么样？听一下，400家，400家，这里边有30多款首发首展的新品要在大会上发布，其实如果你注意看新闻的话，你会在公开的新闻上看到有些已经在报道这些方面的东西了。

好的，那我这样的话是为大家简要的总结了今天上午的一个大体的这样的一个状况，所以我们现在是这样简单介绍完之后，我们再看看现场的情况是什么，来我们交回现场。

好的，这样的话就是我们刚才为大家简要介绍了这个几个数据，我们再回到演播室，这样的话我再为大家介绍一下今天的这个国内外这个大咖都是哪些人，因为我们在线上也看到有些人在问哈，这里边图灵奖的得主，图灵奖得主里边有大卫帕特森，还有约瑟夫这个斯发斯基这些大家应该可能有些人比较陌生，因为你不太关注这个行业的话，还有曼尼尔布鲁姆还有姚旗志等等这些。那么诺奖得主迈克尔莱维特，还有咱们国内外院士等等这些好的，切回到我们的现场了。

接下来让我们掌声有请，上海市副市长刘多，联合国工业发展组织副总干事兼执行干事邹次勇、上海交通大学党委书记杨振斌、委内瑞拉人民政权科学技术部信息与通信技术发展副部长格洛利亚卡瓦略、中国电信集团总经理邵广路、华为企业沟通部副总裁张媛、腾讯云副总裁顾伟、阿里云智能科技研究中心主任安晓鹏、德国INC创新中心人工智能技术总监本尼德雷舍尔共同上台，一起来主理这一荣耀时刻。有请各位，please extend your palm and please it on the screen，please。好，让我们和现场的朋友一起来共同倒数321发布，谢谢，谢谢各位。

thank you very much，thank you please be seated。

谢谢，再次谢谢各位在现场为我们进行了正式的发布。好，各位领导，各位来宾女士们，先生们，我们今天上午大会开幕式的议程到这里即将告一段落，除了请大家继续关注我们三天大会的各项议程之外，我们今年会继续通过3*24小时全程大放送的网络直播，零距离展示大会的实况信息，多维度延展各场论坛的精彩内容，独家解锁大会优质资源。再次感谢在座的各位领导，各位来宾、女士们、先生们，以及在云端收看网络直播的观众朋友们，谢谢各位，我们未来再见，谢谢。

空间让物质存在，时间让一切演变，智慧让万物相连。中国上海集聚全球创新智慧，构筑人工智能高地，当产业基因重构，经济高质量发展核心驱动再次迭代，帮生活蓝图刷新。文明迎来新起点，会进化突破想象。当神经网络延展，世界连接为一体，未来趋势深切改变，人类文明的无数种渴望，正在这里生成。无限归因，一生无限世界。人工智能大会，神农只有一位，捍卫生命，我们一起，田螺姑娘，只青睐一人，呵护生活。我们为每一个人鹊桥，一年连接一次，隔空相助，我们随时随地。马良只有一支神笔制造万物。我们启动无数双手臂，伏羲探寻命运规律，把握趋势。我们用数据洞察先机。如果说人类比几千年前的自己更强大，那是因为我们用智慧将彼此紧紧相连，一起直面挑战。

以上是有关2023世界人工智能大会开幕式（现场文字稿）的完整内容。如果您还想深入了解相关剧情和角色的背景、发展和人物关系等方面的内容，非常欢迎您关注台词课。未来我们会提供详细而丰富的剧情介绍、分析和人物解析，让观众更全面地了解和体验剧集的魅力。

上一篇：高适的名言警句 下一篇：贝多芬的名人名言

您可能感兴趣

网站声明：本站 “2023世界人工智能大会开幕式（现场文字稿）” 由"逗号姑娘"网友提供，仅作为展示之用，版权归原作者所有;如果侵犯了您的权益，请来信告知，我们会尽快删除。

如果侵犯了您的权益，请来信告知，我们会尽快删除。