7月20日,有着“AI芯片第一股”之称的中科寒武纪科技(以下简称“寒武纪”)正式登陆科创盘。从股票发行至今的数据来看,寒武纪在股市的表现相当亮眼,至7月22日收盘,市值已经达到1124.28亿元。相比257.62亿元的发行市值,寒武纪的市值在三天时间里增长了336%。近年来,我国AI芯片市场加速成长。但是,当前AI芯片处于产业化早期,企业大多面临盈利难的问题,如何加快技术成果转化,仍然是AI芯片企业面临的关键课题。
“AI芯片第一股”备受期待
市值的大小、股价的高低,在一定程度上反映出资本市场对上市企业及其所在产业发展水平和未来前景的判断。有行业分析师《中国电子报》记者表示,寒武纪在股市的活跃表现,一方面是因为科创板正处于被资本高度关注的时刻,资金流动较为活跃;另一方面,寒武纪的主营业务是AI芯片,目前来看,AI芯片的前景被各方看好,是资本市场非常注重的方向。
从诞生之初,寒武纪就备受各方期待。2017年,寒武纪科技完成1亿美元A轮融资,估值达到10亿美元,成为AI芯片领域“独角兽企业”。同年,华为推出的全球内置独立NPU麒麟970搭载寒武纪1A模块,寒武纪一战成名,打响了市场知名度。目前,寒武纪形成了面向云、边、端的系列化智能芯片产品和平台化基础系统软件。其智能终端IP模块已集成于超过1亿台智能手机及其他智能终端设备中,面向云端、边缘端的思元系列产品也已应用于浪潮、联想等多家服务器厂商的产品中。
半导体属于资金、技术、人才密集型产业。研发资金、专利技术和人才储备,通常是市场衡量半导体企业实力的关键因素。研发投入方面,在2017、2018、2019三个年度,寒武纪研发投入占营业收入的比例分别为380.73%、205.18%、122.32%,三年累计研发投入8.13亿元。专利技术方面,寒武纪主要面向智能芯片及相关领域进行布局,截至2020年2月29日,已获授权的境内外专利达65项,PCT专利申请120项。人才储备方面,截至2019年年底,寒武纪研发人员占总体员工人数的79.25%,硕士及以上学历的员工占比超过63%。
业内人士葛婕向《中国电子报》记者指出,寒武纪通过与华为手机AI芯片的合作,打开了市场知名度。相对目前国内其他AI芯片公司,寒武纪已经有落地应用的场景和实例,得到了部分用户的认可。同时,创始人陈云霁、陈天石出身中科大“天才少年班”的履历光环,也增强了资本市场对公司后续发展的信心。不过寒武纪目前仍处于亏损状态,需要更充足的应用落地和客户来支撑公司的良性发展。
寒武纪本次募集资金的主要用途是云端和边缘端智能芯片的研发,投入方向与公司目前的业务转型方向相符。2018年起,华为海思选择自行研发智能芯片,不再使用寒武纪的IP,导致寒武纪终端智能处理器IP业务营收骤减,云端智能芯片及加速卡转而成为营收高业务。寒武纪通过发行股票募集的资金,将用于新一代云端训练芯片及系统、云端推理芯片及系统、边缘端AI芯片及系统3个项目。寒武纪表示,云端智能芯片的升级换代将有利于公司更好地为云计算时代提供高性能、高安全的服务器加速芯片及其平台产品;边缘端芯片的研发项目将完善公司云边端一体化的发展战略,弥补市场上边缘加速方案的空白,为公司储备新的业务增长点。
国内外企业抢滩AI芯片
有别于CPU、GPU、FPGA、DSP等通用芯片,AI芯片通常指专门针对AI领域设计的芯片。葛婕表示,AI芯片通常指针对特定应用需求而专门设计,可扩展性不及GPU等通用芯片,但在性能、面积、功耗上一般可以进行针对性的优化,算法更加高效,对互联网公司等某些需求可以实现定制化加速。
目前,AI芯片已成为国内外科技巨头的抢滩之地。集邦咨询(TrendForce)分析师姚嘉洋向《中国电子报》记者表示,AI芯片的发展,会面临不同精度运算的工作负载,对FP32(单精度)、FP16(半精度)以及INT8(8位定点运算)与INT4(4位定点运算)的支持已经是AI芯片的必备条件。同时,AI芯片的竞争指标还包括AI运算效能的展现、功耗的多少以及芯片本身的面积与成本等。发展趋势方面,除了运算架构仍要持续优化外,采用先进制程也是助力AI芯片整体表现的关键要素。此外,若投入加速卡产品的发展,存储器的搭配与选用也是关键。
谷歌的TPU是AI芯片的代表作。TPU是为谷歌Tensorflow深度学习框架打造的AI芯片,通过谷歌云平台开放给客户使用,目前云TPU3.0版本算力达到420TFLOPS,基于云TPU集群打造的TPUPod可提供每秒超过100千万亿次浮点运算。天风证券分析师指出,谷歌将TPU开放给客户是为了提供差异化的云计算服务,提升谷歌云的机器学习服务的易用性。通过CloudTPU和TensorFlow的软硬结合,以及TPUPod的加持,可进一步激活中小企业以及科研单位的云计算需求,构建差异化竞争优势。
长期占据云服务头把交椅的亚马逊也不甘示弱,推出了高性能机器学习加速芯片Inferentia,能够提供128TFLOPS的算力,并支持INT8和BF16(混合精度)/FP16计算类型。移动通信芯片龙头高通推出了面向边缘侧的专用AI芯片Cloud100,采用7nm制程,运算速度超过100TFLOPS。
我国企业也在AI芯片积极布局,并在部分算力参数上接近甚至国际水平。
寒武纪于2018年推出了中国高峰值云端智能芯片思元100,2019年推出了第二代产品思元270,均采用台积电16nm制程。思元270理论峰值性能达到256TFLOPS(INT4)、128TFLOPS(INT8)、64TFLOPS(INT16)。从招股书披露的信息来看,寒武纪下一代云端智能芯片思元290采用了台积电7nm制程,已处于内测阶段。
姚嘉洋表示,在2019年,思元270相关产品线便已经支持INT4规格。在2018年下半年左右,英伟达的Turing架构确定支持INT4。以整体AI芯片市场来看,寒武纪在这方面的布署可谓超前。
华为、阿里巴巴的AI处理器,也在衡量AI计算能力的ResNet-50模型训练中有着可圈可点的表现。华为的昇腾910AI处理器在INT8下的性能达到512TFLOPS,FP16下的性能达到256TFLOPS。在ResNet-50模型训练中,由1024颗昇腾910组成的AI训练集群Atlas900,只用了59.8秒完成了训练,比原先的世界纪录快了10秒。阿里巴巴的NPUAI芯片含光800采用12nm工艺,支持INT8/INT16量化加速,以及FP16/BFP16向量计算。据阿里达摩院院长张建锋介绍,在ResNet-50测试中,含光800推理性能达到78563IPS,比目前业界的AI芯片性能高4倍。
此外,腾讯领投的AI芯片企业燧原科技推出了面向云端的云燧系列;地平线推出了面向自动驾驶的征程系列和面向智能摄像头的旭日系列处理器。