联系我们

专访吴军:未来10年,AI的发展方向是应用,不会出现重大的理论突破

2020-11-04

我们生逢信息时代,对信息的本质却知之甚少。

大部分人只知道1965年提出的摩尔定律是信息处理能力的描述,它正在以每18个月就加倍的发展速度颠覆着我们的生活方式。

殊不知,信息技术的发展,是由信息的传输、处理和存储技术这三个维度决定的。而全世界信息技术的发展,都是沿着用更少的能量传输、处理和存储更多的信息这条主线来进行。

为了描述信息发展的规律,吴军博士在他的新书《信息传》中,以信息发展史上的杰出人物及事迹入手,通过故事的方式描述了前人追求上述主线所经历的曲折与多彩。

(吴军博士新书:《信息传》)

其过程起承转合,柳暗花明,荡气回肠,但又顺理成章。

所谓起承转合,始于1901年,一位叫伽利尔摩·马可尼(GuglielmoMarconi)的27岁意大利年轻人在加拿大纽芬兰的信号山顶放飞一只巨大的风筝,接收到来自遥远英国波尔社基站发出的信号——摩尔斯电码S,标志人类进入无线电通信时代。

所谓柳暗花明,是世人追寻电和磁共同本质苦苦不解之际,一位叫詹姆斯·克拉克·麦克斯韦(JamesClerkMaxwell)的学者发表《电磁场的动力学理论》一文,用4个简单的公式,即著名的麦克斯韦方程组,描述了电、磁、光相互作用、相互转化的规律。

所谓荡气回肠,是1937年,一位叫克劳德·香农(ClaudeShannon)的22岁麻省理工硕士生跑到美国首都华盛顿进行硕士论文答辩。他的研究成果开启了数字化时代,他所总结的信息论揭示了信息的本质,给人类带来了一种新的世界观。

(克劳德·香农)

顺理成章地,在香农信息论的指导下,人类发展信息几乎从此没有再犯过致命的方向性错误。1G5G通信的发展,无非是工程师按照香农第二定律指出的方向,根据各个时代能够获得的技术,对信息编码和传输技术进行持续改进而已。

如今,我们站在科技发展的风口浪尖上,目睹着风起云涌的社会巨变。

那么,《信息传》是如何理顺信息技术的发展历史,帮助我们进一步了解信息的本质,理解信息技术和经济发展的趋势的呢?基于这个大问题,AI科技评论对吴军博士进行了专访,从回顾过去,描述现在,预测未来三个维度探讨了信息技术的发展规律和商业模式。

在专访中,吴军博士提到:在信息论出现之前,前人的研究是自发的,他们的成功是偶然的,失败是必然的;而信息论出现之后,成功不再是运气使然,而开始有迹可循。

特斯拉的失败,因此得以避免。

此外,吴军博士还提到,人工智能未来十年的发展方向是AI技术的应用,理论上暂时不会有重大突破。


1回顾过去:揭示信息理论发展的规律

AI科技评论:为什么要写《信息传》这本关于信息技术发展的书籍?通过这本书,除了告诉我们历史,还想告诉我们什么?

吴军能量和信息是衡量我们这个世界文明程度的硬性标准。一种文明能够创造、使用和传输的信息越多,手段越有效,其文明水平就越高。

了解信息是什么,了解信息技术是什么,才能帮助我们在日常工作学习中更好地收集和利用信息。

虽然这本书讲述的是信息的历史,但描写历史只是手段,更想呈现的是信息技术发展的规律。

关于规律除了有用更少的能量传输、处理和存储更多的信息这条主线脉络,还可以根据理论效果,将信息发展时间分为自发的阶段自觉的阶段

所谓自发阶段是指,人由本能(例如好奇心与探索欲)驱动所激发出来的发明创造。在自发的阶段,技术的发明者有很多随意变更的因素,因此在这一阶段,你会看到偶然的成功往往把人带偏方向,远离目标,例如无线电之父特斯拉就不幸进入了这个怪圈。

(尼古拉·特斯拉)

由于自发的阶段缺少理论支撑,运气成分非重要,每一个成功的背后可能存在着非常多的失败。谈到电报,大部分人只知道莫尔斯的成功,而不知道其他人的失败;谈到电话,大家只知道贝尔,而不知道其他人。而实际上,他们的成功其实有很大的偶然性。

自发阶段持续了很长时间,直到1948香农提出信息论,用一个被称为的概念和三个非常简洁的定律,描述了信息科学的本质。才使得我们进入自觉阶段。

自觉阶段的标志是:存在正确的理论支撑。所以那之后信息科学和工程的发展,人类从此几乎没有再犯过什么大的错误,也没有走太多的弯路,1G5G移动通信的发展,无非是工程师按照香农第二定律指出的方向,根据各个时代能够获得的技术,对信息编码和传输技术进行持续改进而已。

现在很多人仍然坚信偶然性,在思考问题的时候,仍然在缺乏理论支撑的询问我能否这样做,而《信息传》这本书希望让读者知道理论的重要性,也就是说试错固然重要,但不要盲目试错。

AI科技评论:无论是在《信息传》,还是在之前的书中,您都反复提到专利,专利对技术的发展有什么重要作用?

吴军:专利是把双刃剑,一方面它有激励作用,另一方面它也限制着技术的普及。

激励作用在于能够保证发明人受益,毕竟只有受益,大家才愿意投入钱去进行发明创造。尤其在今天,很多研发的成本都很高。例如做一个5G方案,首先就要投入数亿元,而且不能保证是否见效。如果投资者赚不了钱,其开发创造的积极性自然就弱化。当然,也有少数人是完全由兴趣驱动的,大部分人做事其实还是为了图利。

另一方面,技术也要普及,所以现在各国的专利都有一个专利期限。美国的专利期最多是20年,20年过后,这项技术就变成了公共领域的知识,让更多老百姓受惠。

AI科技评论:除了专利这一激励因素,其实早期技术发展与国家的地理位置也有关系,是这样吗?

吴军:科技发展和地理相关的一个重要原因是:经济和地理位置的关系特别紧密

例如,南美洲与北美洲的气候差异,影响了两个地区的经济发展:南美洲的气候条件要比北美洲好很多,所以南美洲可以通过发展种植业来增加经济收入,另外,南美洲还有许多金矿,因此,这个地区发展工业的动力也不足;而北美洲的气候条件不如南美洲,但最后北美成了一个特别发达的工业地区。

另一个例子是无线电为什么要到英国去进行实验?因为英国是岛国,与欧洲其他地区的通信相比,英国的电缆的成本太高,所以需要发展无线通电。同样道理,无论是马可尼和特斯拉,为什么都到美国跟欧洲进行通信研究?因为虽然可以拿电缆进行研究,但拉电缆不但成本高,而且经常失败,所以后来大家想到无线通信的方式。


2描述现在:信息技术发展的问题

AI科技评论:当前信息技术的快速发展,虽然给我们带来了许多便利,但是也存在的一些问题:信息太多,导致泥沙俱下。目前有没有一些方式有望帮助我们过滤信息、管理信息?

吴军:信息太多让大家广泛受益的同时,也带来一个非常严重的问题:信息泄露和错误信息(谣言)给人们造成的巨大损失。

虽然在古代,也有谣言和信息泄露,但是通常不会带来巨大的系统性的连锁反应。在人们开始广泛地使用现代通信工具大量传输信息之后,信息泄露就会给人们带来雪崩式的毁灭性灾难。

所以,需要考虑的是如何甄别有效信息。目前主要有两个解决方法,一个是交叉验证,另一个是寻找可靠的信息来源。

举个最简单的例子,前段时间关于金正恩有许多假新闻,有些新闻CNN也在报道,其可信度也是非常低,这并不意味着CNN有多糟糕,关键是CNN在朝鲜可能没有记者,大多都是二手信息。其实关于金正恩的信息,一个简单的判断标准是:是否有韩国的正式媒体报道,因为韩国非常关心朝鲜的状况;另一个是日本是否有正式的媒体报道,毕竟日本在北朝鲜有很多侨民。

另外,关于自媒体的信息,一定要看出处。当前有些转载是夹杂了私货95%的内容是一样的,剩下5%的信息是改写的。虽然只有5%,但有可能产生重大真实性、客观性转变。

利用交叉验证和信息来源检查这两个原理也催生了相关甄别信息的技术产品,例如我们之前在谷歌开发了一个产品叫做“GoogleAnswer”,就可以利用机器学习对信息进行权威来源检查。

AI科技评论:不仅是《信息传》,在《浪潮之巅》也提到过,有些科研想法如果超越时代背景,那么他有可能失败。这对现在的科研者有何启示?

吴军:首先,科学和技术要先分开。科学的发展常常要领先于技术。一项科学知识的作用,往往要经过几十年才能验证。今天的5G用的基本编码算法,实际上在六十年代就已经有了雏形。3G用的CDMA算法与变频调制,在二战时也有了雏形。从科学到技术,再到产品,中间的间隔可能比较长。

所以,国家一定要大力发展科学,因为有时候,科学产生的结果短时间内看不到,但到关键时刻,你会发现,没有科学基础,后面的技术发展也举步维艰。如今中美关系比较紧张,大家对技术比较关心,但在缺技术时,大家还应该反思:更早的时候,我们可能应该在科学上多做一些投入。

其次,在同一个时代,科学可能会带来技术的进步。技术路线有很多种,最后成功的可能就一两种。一项技术的失败,对投资人来说影响不算大。比如投了10项技术,两项成功,八项失败,成功的两项技术可能就能把投资的钱回本,而且还可能有利润。但对创业者来说,一项技术的失败是百分百的"灾难"

在每个时代,解决同一个问题的技术可能有很多,甚至成功的两项技术也未必是一开始最被看好的技术。成功有很多原因,可能是资金,可能是执行力,等等。所以也不能完全以成功或失败来衡量一项技术水平的高低。

此外,每项技术都有一个发展阶段。这个发展阶段很重要。还有些技术可能很有潜力,但在某个时间段里,大家对这项技术没有需求。例如存储技术,之前的磁带、磁盘等,也只存活了半个世纪。如今,大家可能用网络存储或分布式存储。如果你是磁存储技术的领先者,那么你可能在前十年能凭此获利,过后就被淘汰了。


3预见未来:5G与人工智能的发展

AI科技评论:根据信息技术发展的特点,您认为未来信息技术的主要发展方向在哪些应用与领域?

吴军信息技术的发展基本上是三根主线,即信息的传输、存储和处理

5G是信息的传输,人工智能是信息的处理。更具体一些,电报、电话、手机通信和互联网,都是传输信息的手段,计算机和各种控制系统则是处理信息的工具,纸张、胶卷、磁带、光盘、半导体存储器,则是存储信息的媒介。

全世界信息技术的发展,都是沿着用更少的能量传输、处理和存储更多的信息这条主线来进行的。

在移动通信中,从1G5G,单位能耗的信息传输率提高了5个数量级左右,这就是通信发展的根本趋势。处理信息也是如此。尽管1946年世界上第一台电子计算机埃尼亚克耗电量高达150千瓦,但是进行一次计算依然比机械计算机更能节省能量。

如果扩展的话,信息技术是一项在其他国民经济产业中起叠加作用的技术

一方面,信息技术本身就是一个产业,而且产业规模不算小;另一方面,如果将信息产业与其他产业叠加,比如汽车信息化以后,汽车可以配备地图、道路识别等,开起来会方便很多;或者,通过可穿戴式的系统与手机,汽车会变成一个移动平台,成为一个生活办公场所,这时候汽车可能就被重新定义了。

同样的道理,今年因为疫情,大家可以在家上班。如果疫情发生在20年前,在家上班就很困难,因为20年前,大多数人的家里没有完善的IT设备。如今,信息技术发展后,我们的家里实际上就是一个信息中心,所以能够在家上班。

因此,信息技术的发展,一方面是基于信息的核心往前发展;另一方面,信息技术的发展还会辐射到许多周边产业。

AI科技评论:能不能对人工智能的技术发展进行预见?

吴军人工智能接下来的十年发展方向是技术应用,理论上暂时不会有太多的突破了。计算机技术有一个规律,也可以说是共识,就是哪一个发明或者技术获得了图灵奖,那么它在短期内就走到头了。

人工智能的主要支撑技术深度学习已经在2018年获得了图灵奖。另外,今天我们使用的深度学习技术其实都是基于20多年前的工作。科学肯定是领先于技术的。虽然目前麻省理工等科研高校也在做一些理论性的研究,但是如果想要变成技术应用至少也是20年以后的事情了。

也不是说现在没有进行一些原创性的理论研究,只不过这些研究大多在科研院所和高校里进行,其理解门槛和进入门槛比较高,在媒体传播中没有优势,只是在学术圈内进行交流。例如学术界对深度学习的可解释性理论非常关注,都在投入大量的时间、经历、金钱,如果有突破,那么将会是重大的理论突破。

AI科技评论:从1G5G,信息技术的发展对商业的影响有什么特点?在5G时代,信息商业的发展会体现怎样的趋势?

吴军:从1G5G,其实真正影响我们生活的是阶段3G~4G1G的用户量很少,从2G开始,大家能够彼此的通过手机来通讯的,但也只是限制在通信本身,能够干的事情非常少。

3G4G在中国的过渡时间非常短,4G这个时代发生的第一个大事就是和云计算的结合,使得我们能够随时随地的访问信息。这时候手机成为了获取信息的平台。

4G时代,网络可以分为两个部分:通信的网络和计算机的网络,而这两个网络在手机上是融合的。但从产业的角度看,从技术和商业角度来看,这两个网络都没太融合。举个例子,在家用手机连接WiFi上网是计算机网络,而在外面用流量上网是通信网络,这两者并没有打通。

所以,谈到5G,必须和IOT联系到一起,必须讲万物互联,只有将所有网络融合到一起才能克服4G带来的缺陷,打通各方利益,进入万物互联的时代。

AI科技评论:3G4G在中国过渡很快,但是5G的建设这中间似乎脚步很慢,这是什么原因呢?

吴军:有两个原因,第一个是所有技术应用都需要配套,例如要想用5G进行万物互联,其工业设备和管理软件都要同步更新。

这件事情,对于个人来说比较简单,因为如果家庭想要更换5G设备,那么自己就能做主。而在企业、工业里,其在4G时代已经投入了大量的成本进行建设,如果更换成5G,企业会付出大量的成本。

第二个原因是,5G网络建设需要时间,现在虽然个别5G试点网络情况非常好,体验非常舒适,但是个别带来的意义不大,因为只有大众都能感受到,才是真正的5G时代。中国工程院院士邬贺铨是我国通讯方面的专家,他自己估计5G网络建设还需要10年时间,其实10年非常漫长。


(转载自AI科技评论)

诚聘英才
友好链接
业务咨询及参观访问:0755-86576085    0755-86576086    地址:深圳市南山区笃学路9号
国家超级计算深圳中心(深圳云计算中心)  ©2014-2020  粤ICP备10220126号