AI芯片的发展,离不开人工智能技术的成熟。人工智能从1956年诞生至今,共经历过三次大的浪潮。进入21世纪,由于计算机性能的提升和海量数据的产生,以及机器学习和CNN技术(Convolutional Nerual Networks,卷积神经网络)获得突破,算法、算力和数据都满足了人工智能的商业化落地需求,人工智能迎来了高速发展的阶段。
实际上,人工智能产业得以快速发展,离不开目前的物理基础——芯片。可以说,“无芯片不AI”,能否开发出具有超高运算能力、符合市场需求的芯片,已成为人工智能能否可持续发展的重要因素。
近年来,AI芯片产业发展迅猛,众多企业纷纷布局。但从芯片的起步、发展、成熟的三个阶段来看,人工智能芯片仍然处于起步阶段。
巨头新锐,共遇产业瓶颈
按应用场景的不同,AI芯片设计可分为云端训练、云端推断、终端推断三部分。其中云端训练芯片主要以英伟达的GPU为主,新入竞争者是谷歌的TPU,以及深耕FPGA的赛灵思与英特尔。在云端推断方面,代表企业有AMD、谷歌、英伟达、百度、寒武纪等。
在终端推断方面,由于移动终端、自动驾驶等应用场景需求逐渐爆发,布局企业包括传统芯片巨头和初创企业,如高通、华为海思、地平线、寒武纪、比特大陆等。
不难发现,在市场格局上,虽然目前都是传统芯片巨头占据着AI芯片市场的霸主地位。但AI芯片落地难,是困扰巨头与新锐的共同问题。
来源:清华大学未来芯片创新中心
地平线联合创始人兼副总裁黄畅告诉亿欧科创:AI芯片落地之所以难,首先是大家技术上都遇到了共同的瓶颈,也是所谓的“冯·诺依曼瓶颈”。
提高AI芯片性能的关键之一,在于支持高效的数据访问。在传统冯·诺伊曼体系结构中,数据从处理单元外的存储器提取,处理完之后再写回存储器。AI芯片本身基于冯·诺伊曼体系结构,使用简单的功能是完全没问题的。
但由于运算部件和存储部件存在速度差异,当运算能力达到一定程度,由于访问存储器的速度无法跟上运算部件消耗数据的速度,再增加运算部件也无法得到充分利用,即形成所谓的冯·诺依曼瓶颈,或“内存墙”问题,这是长期困扰计算机体系结构的难题。
目前常见的方法是利用高速缓存(Cache)等层次化存储技术,尽量缓解运算和存储的速度差异。然而,AI芯片中需要存储和处理的数据量远远大于之前常见的应用。这都使得冯·诺依曼瓶颈问题在AI应用中愈发严重。“可以不夸张地说,大部分针对AI提出的硬件架构创新都是在和这个问题做斗争。”黄畅补充道。
不过,也正是由于人工智能芯片的技术难题,导致不论是巨头还是新锐都处于同一起跑线,这给国产企业提供了良好的超越“赛道”。这也避免了传统巨头利用自身已有优势,快速甩开对手。
问鼎全球,如何弯道超车
19年6月20日,寒武纪推出第二代云端“思元270”;6月21日,华为发布人工智能手机芯片“麒麟810”;7月3日,百度发布人工智能芯片远场语音交互芯片“鸿鹄”;10月29日,地平线发布AIoT边缘计算人工智能芯片“旭日二代”。
可以发现,国产企业在AI芯片领域的布局已初见雏形,有一战之力。但想问鼎全球,仍需改善一些不足。
针对国产AI芯片的发展,中国工程院院士倪光南多次表示,芯片设计门槛极高,只有极少数企业能够承受中高端芯片研发成本,这也制约了芯片领域创新。我国可以借鉴开源软件成功经验,降低创新门槛,提高企业自主能力,发展国产开源芯片。
“开源软件正成为当前软件产业的主流,芯片产业也可以采用开源这种模式。”倪光南强调,目前在芯片开发方面,新的RISC-V指令集是一种能够降低处理器芯片IP成本的新模式。企业可以自由免费使用RISC-V进行CPU设计、开发并添加自有指令集进行拓展等。RISC-V对于当前AI芯片架构的优化,成本的控制,都有很好的效果。
关于AI芯片架构,其实我国企业已有不少可圈可点的案例,例如华为的达芬奇架构,寒武纪的Cambricon-X架构,鲲云科技的CAISA架构,地平线的伯努利架构等。
比起人工智能芯片架构,我国更应该关注人工智能芯片的产业链完整度。
我国制造芯片的新设备和工艺比国际先进水平落后多代,因此一些人工智能芯片需要送到境外进行制造和封装。这就会造成芯片产量不足,以及价格过高的问题。使得下游很多使用其模组的产品无法量产,造成恶性循环,不利于行业的发展。
作为国内边缘侧AI芯片领域的先行者,嘉楠科技早在2016年就掌握了16nm制程工艺,之所以现阶段的AI芯片制程工艺仍为28nm,主要也是受价格和出货量的限制。
赛迪顾问《中国人工智能芯片产业发展白皮书》显示,中国人工智能芯片市场规模保持高速增长。云端领域,2018年云端市场全球占比17.0%;预计2021年将达221.5亿元,CAGR达 51.23%。终端领域,2021年将达84.1亿元,CAGR为59.3%。
面对如此广阔的市场,希望国产企业能潜心突破瓶颈,问鼎全球。