AI落地挑战连连看
2463
2019-04-08 14:04    文章来源:T媒体 卿云
文章摘要:2019年被称为AI理性回归之年,想要让AI在更多的场景落地,挑战与机遇并存。

众所周知人工智能的发展经历了三次浪潮,经过前两年的火热,也渐渐回归理性。目前仍然处于能听会写的弱人工智能阶段,而人工智能的落地要结合具体场景已经成为业内共识。除了如何与场景和产业更好的结合外,AI的落地还有很多挑战,AI芯片和网络都有相应的挑战。

在日前举办的云知声技术开放日上,云知声副总裁李霄寒指出万物互联的时代AI边缘芯片在物联网、人工智能落地上具有核心位置。他指出AI芯片的设计绝对不是孤立的,要基于端云互动的思想提供多模态处理的能力,在性能、功耗、面积上达到优异的平衡,并兼顾连接和安全的需求。

AI芯片设计是一个系统工程

李霄寒认为AI芯片可以分成两类,云端芯片和边缘芯片。云端芯片经过大规模的数据处理做训练形成AI模型,这部分以寒武纪为代表。

云知声做的是边缘芯片,目前人工智能已经有了很好的发展,在云端不仅集成了很多人工智能的能力,还集成了很多教育、医疗等方面的知识。所有的知识跟用户连接的时候,需要一个载体,这个载体过去是手机。但是在物联网时代,可能是开关插座、音箱,所有的设备都有可能。

对于这些设备来说,承接云端的能力赋能给用户,同时能够把用户端的数据及需求向云端上传,需要AI芯片以其上层的应用来实现。所以AI边缘芯片在物联网人工智能落地具有核心的位置。

李霄寒指出人工智能芯片的设计与传统CPU设计上不同,也将面临新的挑战。在传统的CPU设计时,考虑最多是是电路,根据成本、功耗、是否强劲等指标做出相应的选择。而且通用的芯片面向的是一个通用场景,不需要考虑不同的需求,设计的足够强大就可以。

但是涉及到边缘AI芯片时,作为一个设计者,需要考虑场景,因为不同的场景要用的芯片的需求不一样。

李霄寒认为第一个挑战是AI芯片的设计要考虑更多的因素。在新的场景和新的环境下,要基于场景,针对具体应用,着眼AI算法,再加上芯片的应用,设计新的芯片。

第二个挑战是冯诺依曼架构瓶颈。在上个世纪四十年年代,以冯诺依曼内存墙为代表提出的架构,在芯片上把计算的概念和存储概念分离,当需要计算的时候,把大脑拉过来,在运算单元上处理,再从内存上不断获取数据。现在使用的所有的芯片,几乎都是基于冯诺依曼架构。在AI架构下,冯诺依曼架构遇到新的问题,处理AI算法的时候,处理的数据非常多,有大量的数据拷贝需求。运算构件与存储构件之间大量的数据交换限制了系统的运算效率。

第三个挑战是低功耗需求。服务端有低功耗的需求,在边缘侧低功耗需求只会更加旺盛。因为边缘侧不希望它是热的,在低功耗下能够正常使用。但这和AI大规模的计算的需求非常矛盾,这是非常大的挑战。

在传统的时候考虑灵活控制功耗,当芯片在工作时全力以赴打开,不工作时关闭。但是在AI物联网时代下游戏规则变了。首先要从应用层面考虑,然后要考虑算法。算法是否要为芯片本身改变。或者反过来,芯片本身是否要为算法做一些调整。

所以AI芯片的设计是一个系统的设计,不仅是硬件和芯片设计问题,而且是芯片上层应用整个场景的问题都要考虑到。

李霄寒指出AI芯片的设计绝对不是孤立的,要基于端云互动的思想提供多模态处理的能力,在性能、功耗、面积上达到优异的平衡,并兼顾连接和安全的需求。云知声在相关方面做了尝试,比如安全方面设计工作中都会考虑到机密性和完整性。确保芯片卖出去以后,所有代码是加密的,所有在NTO里面运行的代码没有被人篡改过,通过一些其它的信号光学或者是别的手段来获取密钥,进行相应的检测。

云知声在AI芯片的发展逻辑是先用方案解决某一个场景下的问题,验证它是成立的,再考虑如何生产降低成本。例如车载芯片,先通过一些通用芯片去车里面寻找需求,发现原来方案的问题,再考虑以AI芯片更好地解决之前的问题。

云端互动也要做到脱离云后,端侧可以做基本的工作。

AI落地网络的挑战

实际上AI的落地受到芯片、算力、算法、网络等多方面影响,当前网络上也面临着挑战。

天翼云市场部总经理杨居正在2018年企业上云推进会暨地方“十佳上云”企业评选启动会上指出AI的落地很多时候GPU算力不是瓶颈网络是瓶颈。关于AI很多中小企业其实已经在考勤中用到了简单的人脸识别。中小企业也能够使用一种看上去高大上的东西,这是AI能力的API化。 

杨居正指出发展到现在GPU的算力不会是瓶颈,网络变成了瓶颈,比如按照GPU处理一张照片5毫秒计算。如果以10G的专线上传照片基本可以满足,如果按照10M专线匹配,GPU大量的时间处于闲置状态,算力没有得到充分释放,在这种情况下考虑企业如何设计业务,如何由服务商去优化服务,因为这两个的价格差的很远,如果算上专线和GPU的钱,分不清价格的高低。到底是应该把GPU搞贵一些,和专线一起提供服务,还是用户去选择自建。这不仅仅是一个技术问题,可能是整个商业模式的设计问题。 

不过随着5G的发展,边缘侧的网络能力也将提升。但是5G这样的新技术要达到一个规模化的效应需要一个过程。2019年被称为AI理性回归之年,想要让AI在更多的场景落地,挑战与机遇并存。

附:云知声副总裁李霄寒从芯片的角度看人工智能发展的三个阶段

第一个阶段,因为芯片算力不足,所以神经网络被打入冷宫。

大家一般认为1956年达特茅斯会议是人工智能元年。其大的背景是在当时芯片计算能力是非常弱,很多的算法没办法被计算机处理。在那个时代,计算机并不是实现人工智能唯一的出路。现在做语音合成是通过计算机实现,50-60年代有一个技术路径是通过摹拟手段来做,用风箱和黄片摹拟声音,再通过结构性的处理摹仿音节。但是这样的技术没有可持续性,所以这种技术很快就消失了。

第二个阶段,通用芯片CPU的算力大幅提升,但仍无法满足神经网络的需求。

80年代中期到90年代,此时CPU的发展已经到了非常高的水平,在一般的算法实践上已经产生很大影响,彼时深度学习因为计算能力的限制,没办法把层数做很多,所以它不能够处理非常多的数据,摹拟非常复杂的声音,所以人工智能第二的阶段只能结束。

第三个阶段,GPU和新架构的AI芯片推进人工智能落地。

2009年前GPU被用来做深度学习算法训练。GPU有很多计算模型,最擅长的是并行处理数据,正好和深度学习是深度耦合。2014年寒武纪接连发表文章,认为通过CPU的架构,做专用加速芯片。2016年阿尔法狗采用TPU架构用人工智能芯片做数据训练,并击败了人类世界冠军李世石。


版权声明:

凡本网内容请注明来源:T媒体(http://www.cniteyes.com)”的所有原创作品,版权均属于易信视界(北京)管理咨询有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)管理咨询有限公司将追究其相关法律责任。

评论