1、龙芯中科:完全自主的引领者
龙芯是国内最早自主研发芯片厂商,于2001年在中科院计算所开始研发,得到了中科院、 863、 973 、核高基等项目大力支持,完成了十年的核心技术积累。2010 年,中国科学院和北京市政府共同牵头出资,龙芯中科技术有限公司正式成立,开始市场化运作,旨在将龙芯处理器的研发成果产业化 。

龙芯坚持走自主创新与生态建设之路。龙芯走市场带动技术的道路,通过体制内市场引导,带动技术进步,再参与体制外市场竞争。龙芯CPU采用MIPS体系结构,产品现包括龙芯1 号小 CPU 、龙芯2号中CPU和龙芯 3 号大CPU三个系列,此外还包括龙芯 7A1000 桥片 。产品方面,龙芯目前共推出3代CPU产品, 2017年4月发布面向桌面服务器应用的龙芯3号处理器的最新升级产品龙芯3A3000/3B3000 ,其中,龙芯 3A3000 基于中芯 28nm FDSOI 工艺,自主 GS464E 架构(自主指令系统 LongARCH),设计为四核 64 位,主频 1.5GHz ,功耗仅 30W ,是目前国产CPU中单核 SPEC 实测性能最高的芯片之一。

2019年12月,龙芯推出首款基于 GS464v 微架构的四核处理器 3A4000 相比上一代产品实测性能提高一倍 。预计2021年上半年将推出 3A5000/3C5000,其工艺改进提高主频至 2.5GHz ,核数提升至 16 核。

相比龙芯3A3000 处理器,龙芯3A4000 性能翻倍 。龙芯3A4000相比3A3000的 GS464e 微架构,进一步优化流水线,提升运行频率,加强对虚拟化、向量支持、加解密、安全机制等方面的支持。其芯片整体实测性能提升一倍左右 。

在某些测试项目中,龙芯3A4000 的速度超过了3A3000 的三倍,比如hmmer 测试,3A4000 的速度是3A3000 的 3.6 倍,这是因为龙芯 3A4000 的向量指令在发挥作用。但与 Intel i5 7200U处理器相比,龙芯3A4000处理器性能 还存在一定差距。
从测试结果可以看到,3A4000 处理器单核整数性能只有 i57200U的 60%, 浮点性能只有后者的50% 。但考虑到 Intel i5 7200U睿频频率高达3.1GHz,处理器的每GHz 性能为整数10.64分,浮点12.6 分;3A4000 处理器核的同主频性能已经能够达到 i5 7200U 处理器的80%-90%。
2、飞腾:PK生态的主导者
飞腾是国产自主安全主力芯片厂商,全称“飞腾信息技术有限公司”,是目前国资比例最高(CEC通过中国长城控股)的国产CPU企业。其团队核心骨干研制CPU最早起步于20世纪90年代,曾先后研制X86、Epic、SPARC、ARM等指令集,并以SPARC开源代码为基础设计了FT-1000、FT-1000A、FT-1500等CPU。之后出于生态考虑,获得了ARM指令集授权继续开展自主研发。飞腾是聚焦国家战略需求和重大项目的CPU国家队,在以往信创项目中具有较强的实战经验,目前其产品在政府信创市场占有率排名第一。
飞腾专注于ARM芯片研发,是中国最早获得 ARMv8 指令集架构授权的芯片设计厂商,主要致力于国产高性能、低功耗集成电路芯片的设计研发和产业化推广,产品广泛应用于计算机终端、服务器和工控领域。目前国内完全自主设计的芯片厂商仅飞腾、龙芯、海光、兆芯和申威等寥寥数家,飞腾在CPU能耗比、JS引擎性能、HTML5兼容性、虚拟化效率等方面整体领先其他厂商 。
飞腾产品覆盖高性能服务器CPU (腾云S)、高效能桌面CPU(腾瑞D)和高端嵌入式 CPU (腾珑E)三条产品线。飞腾是国内通用CPU里面谱系最全的CPU厂家,包括高性能服务器CPU 、高效能桌面CPU 、高端嵌入式 CPU ,能为从端到云的各类设备提供核心算力支撑 。目前,主推产品是面向服务器的腾云S2500、面向桌面终端、安全应用和嵌入式领域的腾锐D2000。
飞腾CPU是PK体系(Phytium CPU+Kylin OS)信息系统的核心。飞腾的CPU芯片架构和国际主流ARM 指令集接轨,而内部则是完全自主研发的“飞腾内核”。架构和国际主流接轨,保证了芯片接口的通用性,产品能更好地融入国际市场和生态环境;自主研发内核,则保障了芯片的自主性和可控性。基于自主研发的处理器内核FTC3xx、FTC6xx和FTC8xx三个系列,飞腾拥有完整的CPU产品谱系,并与国内软硬件厂商完成适配和产品业化研发,使得基于飞腾芯片的产品性能上可以达到替代国外产品的水平,为从端到云的各型设备提供核心算力支撑,为我国构建安全、自主、可控、生态良好的国产化计算平台奠定了基础。

此外,飞腾还致力于将安全机制融入CPU之中。2019年飞腾发布飞腾处理器安全架构标准(PSPA),首次在FT-2000/4芯片中得到实现。PSPA使芯片具备抗“幽灵”、“熔断”等漏洞攻击的特性,支持包括国密算法在内的密码加速引擎,以及可信启动、安全存储、量产注入、生命周期管理、抗物理攻击等多种机制,使CPU实现内生安全。

目前,飞腾已经与国内众多厂家开展合作,携手合作伙伴构建繁荣开放的生态,合作伙伴数量超过 1600 家、累计研制了 7 大类 900 余种整机产品,已经适配和正在适配的软件和外设超过 2500 种,飞腾已经建立起云、端、边和嵌入式全栈解决方案图谱。
2020,飞腾公司业绩大幅增长。上半年,飞腾营收3.5亿元,超过2019 全年营收,下半年继续保持增长势头。2020年年出货量超过150 余万片,营收超过 13亿元。产品广泛应用于党政、金融、通讯、智慧城市、工业等领域。
今年以来,飞腾对高性能服务器CPU 、高效能桌面CPU和高端嵌入式CPU等三条产品线进行了全面品牌升级。高性能服务器CPU统一以飞腾腾云S系列命名(为服务器和数据中心提供强算力、高并发的计算服务)、高效能桌面CPU产品线统一以飞腾腾锐 D 系列命名(打造高性能、高安全的单用户极致体验)、高端嵌入式产品线统一以飞腾腾珑 E 系列命名(提供定制化契合各行各业嵌入式应用的解决方案)。腾云、腾锐、腾珑并驾齐驱,三线齐飞 。

2020年7月23日,飞腾发布腾云系列第一代高可扩展多路服务器芯片腾云 S2500。与 FT 2000+/64相比性能大幅提升,集成64颗FTC663内核,扩展支持2路-8路,一台服务器整机最多可以支持8 颗S2500芯片直连构成多路服务器,片内集成64MB三级Cache ,支持8个DDR4 3200 存储通道。

在整机性能方面,双路的SPECint分值为1000+增长至原来的2倍,四路的SPECint值为 2000+,八路的SPECint值3200+。在分布式数据库性能方面,双路服务器的 tpmC 值达到 98000 ,线性提升至原来的 2 倍,四路的 tpmC 值达到176000,增长至原来的4倍。在云桌面支持方面,双路服务器支持虚拟机70个,是原来的2.5倍,四路服务器支持140个,是原来的5倍。
2020年12月,飞腾发布新一代桌面CPU腾锐D2000,集成最高8个FTC663内核,主频最高2.6GHz,双通道DDR4-3200,支持PSPA安全机制,TDP功耗25W,其管脚数与上代产品保持一致,可以实现原位插拔。腾锐D2000的SPECint分值为97.45分,SPECfp分值94.62,整体性能相比其上代产品FT-2000/4提升近一倍,也已大幅超过16核的FT-1500A。
未来三年的产品规划:腾云 S系列将有两款核心产品(腾云 S5000和腾云S6000)、腾锐D系列有两款核心产品(腾锐 D2000已发布,和腾锐D3000)、腾珑E系列(腾珑E2000和腾珑 E3000)。

此外,飞腾公司对于2020~2024年五年间,在融资、人才、市场和技术等方面也有非常具体的规划部署。

3、海光:性能领先的实干者
海光信息技术有限公司成立于2014年10月,主营高性能处理器,业务涵盖芯片领域的设计、制造和生产等环节,自主设计了“禅定” X86中央处理器。
海光的最大优势是其产品性能和X86丰富的应用生态 。由于有 AMD 技术做后盾, AMD 授权给海光的是性能强劲的 Zen 的结构和代码,海光芯片性能优越,在信息化领域应用广泛。
2018年7月, AMD与天津海光合作后首款 X86 处理器 Dhyana (禅定)启动生产 Dhyana (禅定)基于超微(AMD)Zen核心架构开发,性能方面与AMD EPYC处理器相似,Linux维护者将EPYC 支持代码转移到Dhyana(禅定)处理器后可以成功运行,说明当时两款处理器差异相对较小。
2020年5月10日,中国电信 56314台服务器集采华为鲲鹏 920 芯片、海光Hygon Dhyana系列处理器的H系列全国产化服务器,首次将全国产化服务器单独列入招标目录。2020年7月1日, Intel停供服务器芯片,海光已开始向国内诸多服务器厂商供货。

X86架构经过近50年演变,拥有全球近99%服务器市场份额。形成了无可比拟的生态优势。海光处理器基于X86架构,拥有先天良好的生态。据了解,海光已与近千家操作系统、中间件、应用厂商进行了适配。
海光处理器当下暂未受制裁影响,海光产品当下确定性相对较高,下一步海光将在现有架构基础上持续迭代创新,维持国产的优势。
4、华为鲲鹏:快速崛起的领导者
鲲鹏是华为计算产业的主力芯片之一。华为基于ARM 架构,研发五大芯片族,实现全场景布局。华为自研芯片产品主要包括服务器芯片鲲鹏系列、手机 SOC 芯片麒麟系列、人工智能芯片昇腾系列、 5G 基站芯片天罡系列、 5G 终端芯片巴龙系列等以及一系列专用芯片,如凌霄芯片、 NB IoT 芯片、视频编码解码芯片以及 SSD 控制芯片等。
Kunpeng 处理器从指令集和微架构两方面进行兼容性设计,兼容全球 ARM 生态,并围绕 Kunpeng 处理器打造了“算、存、传、管、智”五个子系统的芯片族,实现全场景处理器布局。华为从 2004 年开始投资研发第一颗嵌入式处理芯片,历经 16 年,累计投入超过 2 万名工程师,形成了目前以“鲲鹏 昇腾”为核心的基础芯片族。
作为鲲鹏计算产业底座的 Kunpeng 处理器,华为持续重点投入以满足市场对于新算力的需求。目前鲲鹏系列已经实现量产的有 Kunpeng 912 、Kunpeng 916 、 Kunpeng 920 、 Kunpeng 920s ,而Kunpeng 920Lite 、Kunpeng930及 Kunpeng 930s 目前 仍在研发中, Kunpeng 930Lite 尚在规划中。

鲲鹏具备“端边云算力同构”的优势。鲲鹏CPU基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。

最新鲲鹏920芯片已实现通用计算最强算力,性能优于其他厂商的同类型芯片。2019 年,华为发布最新鲲鹏 920 处理器。这款鲲鹏 920 基于ARMv8 指令集,是行业内首款 7nm 数据中心 ARM 处理器,由华为自主研发设计,采用多发射、乱序执行、优化分支预测等多种手段提升单核的性能。鲲鹏920拥有64个内核,集成8通道DDR4,可以提供多个接口主频可达2.6GHz,总带宽 640Gbps,保证了920超强算力的高效输出。
此外,在 Memory子系统上也进行了大量的优化,采用当前典型的3级Cache 的架构,对 Cache 大小以及延时进行了优化设计。鲲鹏920面向数据中心,主打低功耗强性能,性能达到业界领先水平,尤其是整型计算能力,业界标准SPECint Benchmark 评分超过930 ,超出业界标杆 25%同时能效优于业界标杆30%。并已经针对大数据、分布式存储、数据库及云服务等场景进行了欧化,通过软硬协同进一步提升处理器的性能。

鲲鹏920已实现性能超越Intel系列X86 芯片。鲲鹏芯片算力维度方面在非 X86 架构芯片中明显领先,且发展至目前已经达到可以与 X86 芯片相匹配的性能。鲲鹏 920 芯片基于ARM v8架构,各方面性能优异。目前从整体性能上看,鲲鹏 920 与芯片龙头 Intel 公司所生产的芯片相比较而言,48核鲲鹏 920 与 Intel 至强 8180 性能相当,但鲲鹏 920 能耗比对方低 20%,而 64 核的鲲鹏 920 测试性能要远优于 Intel 至强 8180。这证明 ARM 架构已经具备赶超 X86 架构性能的能力。

从2019 年开始一直加速各行业生态的适配,在政府端进行得较为充分完善。目前在操作系统方面,推出了自主研发的欧拉服务器操作系统,但欧拉操作系统与鲲鹏产业合作伙伴诚迈科技的统信UOS 、中国软件的麒麟操作系统并不矛盾,华为将借助鲲鹏 920 与这些国产操作系统的适配来构建起强大的鲲鹏生态。目前基于统信UOS 、华为鲲鹏平台的整机、应用、外设的适配已经超过1000款,在日常办公领域已经完全具备替换 Windows系统的能力。
华为是ARM服务器芯片领域的领军企业,其产品已经服务于国内多个领域 。移动领域,华为海思的麒麟芯片已经通过华为高端手机 Mate 系列、 P系列打响自身品牌;服务器与云计算领域,华为陆续发布的鲲鹏系列和昇腾系列芯片,基于 ARM 架构,分别用于服务器和云计算市场 。然而,在不断加剧的国际封锁和美国制裁下,华为鲲鹏的发展蒙上了一层不确定性。
5、兆芯:合资CPU的探路者
上海兆芯集成电路有限公司(简称“兆芯”)于2013年成立,由上海联合投资有限公司(隶属于上海市国资委)和台湾威盛电子共同成立 ,总部位于上海张江,在北京、西安、武汉、深圳等地设有研发中心和分支机构。目前,上海市国资委持股比例为 85.24% 。威盛电子是台湾老牌芯片公司,是除 Intel 、 AMD之外,唯一一家拥有X86 架构授权的公司,也是除高通之外,唯一一家拥有CDMA 基带授权的公司。
兆芯的技术源自 VIA,通过技术引进、仿制,再修改原始设计,最后自主创新,致力于通过技术创新与兼容主流的发展路线,为行业用户提供通用处理器和配套芯片等产品。公司成立以来,兆芯已成功研发并量产多款通用处理器产品,并形成“开先”、“开胜”两大产品系列。


2019年6月,兆芯发布开先KX 6000,开胜KH 30000系列处理器,是首款主频达到3.0GHz 的国产通用处理器,也是业内第一款完整集成 CPU 、 GPU 、芯片组的 SoC 单芯片国产通用处理器,其单芯片性能相比上一代产品提升了多达50%,同频下的性能功耗比则是上代产品的3倍,产品性能与国际主流的 Intel i5水平相当。
兆芯的CPU芯片最先进制程是16nm,已经广泛应用于服务器、计算机、嵌入计算平台等领域。但相对来说,VIA所持有的x86专利相对落后,兆芯在性能上有所不足,但胜在x86芯片整体生态较为成熟。
6、申威:为超算而生的强者
申威最初基于Alpha指令集架构,形成三个系列国产处理器产品线。成都申威科技有限公司,主要从事对申威处理器的产业化推广,核心业务包括申威处理器芯片内核、封装设计、技术支持服务及销售,小型超级计算机研发、测试、销售、服务及核心部件生产,基于申威处理器的软件、中间件开发,嵌入式计算机系统定制化产品服务,集成电路 IP 核等知识产权授权。
申威处理器是在国家“核高基”重大专项支持下,由上海高性能集成电路中心,采用自主指令集,研制的具有完全自主知识产权的国产处理器系列。现已形成申威高性能计算处理器、服务器及桌面处理器、嵌入式处 理器三个系列的国产处理器产品线,以及申威国产 I/O 套片产品线。
申威CPU长期创新可信,但生态建设存在难度。2006 年,背靠科技部和上海市政府的上海高性能集成电路设计中心首次成功研制出基于DEC公司Alpha 架构的申威1 单核 CPU,130nm工艺,主频 900MHz 。申威作为军方专供CPU厂商,军队大部分机密设备均使用申威处理器,因此出于安全性能以及知识产权角度,申威在研发出第一代基于 Alpha 指令集的 CPU 后,将指令集替换为自研的自主可控申威64位指令集,完全区别于原有Alpha 指令集。
因此,基于完全自主指令集架构的申威 CPU 研发能力不受限制,不受美国制裁的威胁,可以为军队、党政机关等高机密、关键行业持续稳定提供支撑,并已经开展了产业化推广。但由于申威是唯一一个基于申威64位指令集打造的国产CPU厂商,因此后续在独立生态建设上将存在一定难度。
申威SW2601 是中国首个采用国产自研架构且性能强大的计算机芯片。SW26010采用 260核心众核架构,乱序执行架构,频率 1.45GHz ,整个处理器包括 4 个 MPE管理单元、 4个CPE计算单元及4个MC内存控制器单元组成,总计260个核心。
申威在服务器领域向上至超算领域的应用场景中性能强大,优势较为明显。2016年6 月20日,搭载了申威 SW26010 以及国产操作系统神威睿思的神威太湖之光获得全球超级计算机第一名,并持续4 年。神威太湖之光峰值计算速度达每秒12.54 亿亿次,是全球首台峰值计算速度超过十亿亿次的超级计算机,软件硬件并行,均为申威自主设计。

2020年1月,申威与中国电科进行了对接。目前,中国电科已经成立中电科申泰公司,负责申威处理器的产业推广工作。2020年7月29日,申威全国首条服务器规模化生产线在上海松江区正式启用。这标志着中国电科贯彻落实国家战略要求,实现了申威服务器规模化生产。目前已建成的规模化生产线年产能超过4万台。
申威与多家厂商进行适配,国产处理器得以推广应用的关键在于生态的丰富与否。为应对这一问题,申威推出了自研的操作系统,实现了从处理器到操作系统,在到上层应用软件的国产化。近期,多家厂商与申威处理器进行兼容认证,涉及操作系统、存储等软件硬件领域,例如统信、联想、大道云行、鼎甲等。目前,申威处理器适配的操作系统有中标麒麟、统信UOS及深度deepin。
结语
CPU国产化大潮起,群雄正逐鹿中原。CPU作为ICT产业的核心基础元器件,是国家发展的一大“命门”。
目前,在国际环境、产业政策、市场需求的联合驱动下,一大批国产CPU厂商奋楫前行,在工艺、性能、生态建设等多个方面不断取得突破,为CPU的自主可控、安全可信做出了贡献,并在“好用”的市场化道路上越走越远。
来源:自主可控新鲜事
