亚虎国际

服务中心


  亚虎国际-PT老虎机官方合作伙伴

  地 址:北京市朝阳区朝阳剧场写字楼1188号

  电 话:010-82911999

      010-82900666

  服务热线:400-8866-999

  传 真:010-82911777


最新动态

学术论文基于龙芯3A1500的计较加快模块设想方式

文字:[大][中][小] 发布时间:2018-01-10  浏览次数:

  亚虎国际军事手艺消息化越来越深切的今天,保守加固计较机只依托CPU进行数据处置的体例已不克不及满脚对高速计较的高要求,对于研发高机能数据处置能力的计较机手艺的需求已愈发强烈。恪守加固计较机通用化、系列化、模块化的设想思,正在现有通用计较机平台上,兼容现有尺度系统,提拔计较机处置能力,是现正在沉点研究的标的目的。

  国际上对高速计较手艺已成长的比力成熟,不竭发布高速处置器及GPU协帮计较方式等,计较加快结果很是优良。但国外供给的软硬件存正在平安现患,可能正在处置器及软件系统中被设置后门和缝隙[1],使我方设备及数据平安性遭到严沉。

  深刻挖掘我国自有手艺潜力[2-3],开辟自从可控的具有高速计较能力的手艺至关主要[4]。本文提出一种基于国产龙芯处置器的计较加快手艺,采用3A1500+2FPGA的模式,搭配我国自从开辟的麒麟操做系统,可以或许正在软件硬件方面达到自从可控,满脚对高速计较手艺的需求。

  为了提高计较处置模块的通用性,兼具FPGA计较定制能力和CPU操做系统兼容性,CPU+FPGA的模式[5-6]能够充实阐扬龙芯平台的特长,又可填补高机能计较方面不脚,是一种适合现有军用需求的设想思。本设想名为基于龙芯3A1500的计较加快模块,简称计较加快模块。

  基于龙芯3A1500的计较加快模块功能框图如图1所示,以龙芯3A1500处置器为焦点[7],搭配AMD 780E+SB710芯片组,形成模块硬件从框架。计较加快模块采用高速DDR3内存芯片,连系两片高机能FPGA芯片,以供给高机能的计较能力。本模块制版采用尺度6U VPX总线架构,具有较强的抗恶劣能力,合用于对计较能力要求较高的舰载、车载设备。

  龙芯3A1500处置器为龙芯系列4核处置器,最高工做频次1 GHz,片内集成2个64位400 MHz的DDR3节制器、2个16位800 MHz的HT节制器。龙芯3A1500的双HT总线接口为毗连FPGA,以提高计较能力的体例供给了高速接口。计较加快模块采用AMD 780E芯片做为从模块的北桥,通过北桥的HT总线处置器毗连;通过DDR3显存芯片实现显示存储空间的扩展;通过北桥PCIE X1接口取Inteli210千兆收集芯片毗连;操纵北桥A-LINK高速总线,实现取南桥的互联。此外,北桥芯片还供给1PCIE X16接口(可拆分为2PCIE X8)和1PCIE X2接口,用于系统内的功能模块扩展,并毗连于VPX毗连器;北桥供给显示功能,支撑VGA及DVI显示接口。南桥内部集成丰硕的功能外设接口,包罗高速A-LINK、USB、SATA以及LPC接口等,USB、SATA接口可间接从南桥输出,PS/2接口可通过南桥的LPC总线挂接SuperIO实现。

  为实现较强的计较能力,计较加快模块搭载两块FPGA芯片,FPGA芯片采用Xilinx公司的高机能VIRTEX-6。FPGA0通过HT总线实现通信,并通过PCIE X8总线E毗连,外出两RapidIO X4高速串行总线,满脚高速数据互换的需求。FPGA1通过PCIE X8总线E毗连,外出一RapidIO X4高速串行总线 电源电设想

  电源做为电运转的动力和载体,电源设想是电设想的根本。及格的电源设想,需要正在充实领会各器件及电需求的前提下,配备好各电源电压、功耗分派、纹波干扰等。通过本设想供电电及转换电源,供给各器件工做所需电压,具体的电源分派如图2所示。

  本模块涉及电源品种较多,设想思为通过同一电源供电,正在模块设想各类电源转换电,供给各器件工做所需各电压。正在本设想中,根据VPX架构的特点,电源输入同一由12 V供电,理论上可供给300 W以上的功率,而本模块功耗正在60 W以内,可满脚功耗需求。

  本设想中时钟设想涉及器件次要有龙芯3A1500、南北桥及FPGA芯片。龙芯3A1500处置器通过外部的晶振等时钟源供给其所需的工做时钟;外接的14.318 MHz晶体通过外部时钟发生器,为南桥、北桥以及PCIE设备供给其所需的工做时钟,模块的时钟分派见图3。

  本设想采用MAX706决定整个模块的复位。起首上电复位后由VPX毗连器供给电源和原始的复位信号,从模块中MAX706担任完成对CPU、南桥和外围电的复位工做,芯片内部集成严酷的时序逻辑节制电,能够系统按照严酷的时序进行复位,完成不变启动。系统能够通过CPU的GPIO信号节制系统全体复位。系统复位电道理框图如图4所示。

  为提高模块抗恶劣能力,计较加快模块内存采用全板载DDR3颗粒实现双通道设想体例。龙芯3A1500处置器内部集成两存储节制器MC0和MC1,存储节制器MC能供给尺度的DDR3存储设备接口,能够实现取外部DDR3芯片的数据传输。

  为实现本文提出的基于龙芯3A1500的计较加快方式,需要为计较加快模块进行软件设想。计较加快模块软件设想次要包罗操做系统相关设想及计较加快软件设想。对于操做系统,基于软硬件国产化的需求,选择近年来成长较好的中标麒麟操做系统,正在中标麒麟操做系统根本长进行对应龙芯3A1500平台的操做系统移植及驱动设想;计较加快软件的设想,可充实阐扬计较加快模块双FPGA优异的计较机能,协调系统合理分派资本,将FPGA融入到计较过程中。

  中标麒麟操做系统是基于Linux内核开辟的一套系统,故其驱动和软件开辟根基遵照Linux开辟流程。内核移植正在手艺上以开源Linux操做系统为从,采用交叉编译的体例进行移植开辟,点窜处置器初始化及硬件驱动等相关代码,针对处置器架构进行中标麒麟系统移植。连系龙芯3A1500处置器硬件平台的特点,设想和开辟龙芯3A1500处置器的支撑模块。次要完成处置器初始化代码、相关驱动的点窜,使其支撑收集功能,支撑JFFS2、YAFFS文件系统[8]

  计较加快模块包含CPU和FPGA,CPU施行软件指令,FPGA可按照需要被设置装备摆设成分歧布局的硬件加快器。硬件加快器的设置装备摆设及运转由处置器(软件)节制,对软件编写提出了较高要求,需对整个设置装备摆设过程及加快器的接口细节进行全面领会方可完成法式建立。软硬件协同计较屏障了硬件细节,供给一个硬件通明的编程模子,可沉构硬件以函数的形式进行笼统,即硬件实现法式化,简单挪用硬件函数可实现可沉构硬件的搭建。硬件函数的形式取利用体例取其他软件函数库中的函数一样,整个底层硬件的具体细节对其是通明的[9]

  硬件函数的运转需要供给响应的软硬件支持,按图5所示的条理布局设想支撑硬件通明编程的可沉构系统。整个系统分为五层,使用层以下是片上系统的软硬件根基布局,是通用的。针对分歧的使用,只需要编写响应的使用法式即可。

  各层的功能:软硬件使命设想库供给了夹杂使命编程接口,连系软件函数库和硬件函数库,能够按照保守的软件编程体例,设想出软硬件高度夹杂的系统。软/硬件使命安排器和可沉构资本办理器对硬件函数的挪用、运转形态等进行办理,并和办理可沉构资本。硬件函数取软件函数正在运转体例取物理根本上存正在素质的差别,软件函数是串行施行的指令调集,硬件函数是二维的逻辑电,能够取CPU同步施行,插手响应的硬件函数办理模块可成立同一的软硬件运转过程。可沉构资本办理器应随时办理可沉构资本的利用环境,为挪用的硬件函数分共同适的资本。

  本模块的立异点是正在龙芯3A1500平台上,设想了通过双FPGA对龙芯3A1500模块进行计较加快,正在延续现有软硬件的同时,提高国产化计较机的计较机能。因而,正在对计较加快模块进行机能测试时,沉点考虑FPGA对模块加快结果的测试。

  龙芯3A1500处置器标称从频为1 GHz,但正在本文所搭建系统实测时,其不变工做从频为800 MHz,因而本测试中龙芯3A1500工做频次为800 MHz。

  由图6能够看出,即便LS2400为双核处置器,正在内存2 GB的环境下,计较机能仍然较为优良,申明X86平台计较机能优异。正在800 MHz的工做频次下,龙芯3A1500正在计较机能比之LS2400差别较着,3A1500+2FPGA模式能够大大提高龙芯3A1500计较机的计较机能,加快比除DES加密计较略低于5之外(需要对算法继续优化),其他算法均跨越5,分析计较机能优胜。因而本设想中,龙芯3A1500+2FPGA的模式大大填补了龙芯3A1500正在计较处置能力方面的不脚。图7为统计3A1500+2FPGA模式下针对各算法的计较加快比。

  本文引见了基于龙芯3A1500的计较加快模块的设想方式,包罗设想思、硬件设想方案、软件设想方案,最初给出机能对比测试。成果表白,3A1500+2FPGA模式大大提拔了龙芯3A1500平台的全体的计较机能,平均计较加快比达到5以上,加强了基于国产化处置器计较机模块的计较机能,对于我国加固计较机正在高机能标的目的的成长有着积极的意义。