【摘 要】
:
在科学技术和数字信息化社会的不断推进的背景下,数据的爆炸式增长带来了对传统高性能计算体系的严苛挑战。随着半导体技术逐步接近物理极限,单平台处理器的性能提升难以满足人们对算力的需求。面对算法复杂度和系统性能需求的不断增加,结合了不同架构优势的异构计算平台展现出了巨大的潜力。而在异构系统的协处理设备中,FPGA因其高能效和低延时的优异特性,在信号处理、高频交易和人工智能等领域有着广阔的应用前景。同时,
论文部分内容阅读
在科学技术和数字信息化社会的不断推进的背景下,数据的爆炸式增长带来了对传统高性能计算体系的严苛挑战。随着半导体技术逐步接近物理极限,单平台处理器的性能提升难以满足人们对算力的需求。面对算法复杂度和系统性能需求的不断增加,结合了不同架构优势的异构计算平台展现出了巨大的潜力。而在异构系统的协处理设备中,FPGA因其高能效和低延时的优异特性,在信号处理、高频交易和人工智能等领域有着广阔的应用前景。同时,Open CL标准这一异构平台框架的提出和应用,也为基于FPGA的异构计算带来了新的思路。在该背景下,Altera和Xilinx厂商将开放式计算语言(Open CL)和FPGA结合,提出了基于高层次语言的硬件开发手段和CPU+FPGA的异构计算平台,一定程度上改善了传统FPGA开发流程长、门槛高的难点,使得软件开发人员可以在C环境下进行高效的FPGA应用设计,实现高性能低功耗的异构计算系统。本文以嵌入式多FPGA异构计算系统设计为题,首先对Open CL标准下的异构计算进行介绍,引入SRIO高速串行总线协议、AXI片上总线传输协议和高层次综合等异构平台搭建所需技术,阐述了FPGA上的Open CL实现机制和优化策略。完成对异构计算系统搭建的调研后,从软件端架构、通信、硬件平台框架等多个层次对基于Open CL标准的CPU+多FPGA的嵌入式系统及相应开发平台进行探索和设计,重点阐述了基于SRIO的通信设计、FPGA片上的指令和数据传输结构、内核的开发和控制以及事件反馈机制等。在VPX基础规范下,将本文的Open CL异构计算系统设计部署在T4240 CPU+多VX690 FPGA的嵌入式系统上,使用SRIO交换结构实现设备间通信。同时,设计雷达分辨率提升的算法链示例(算法链包含MTI预处理、脉冲压缩和相参积累3个子算法内核,使用HLS方法对内核进行开发和优化)用于系统的验证和性能测试,子算法内核分别在不同的FPGA板卡上进行集成。验证结果表明本文设计的嵌入式多FPGA异构计算系统正确实现了Open CL标准框架下的异构计算和相应的API功能,处理结果与MATLAB计算结果进行比较,最大误差小于10^-5。在系统性能方面,SRIO接口传输效率达到86.55%,DDR接口传输效率达到76.48%。利用多流水线复制、设备间数据直接传输和多帧流水并行策略,该异构系统相较于CPU的处理效率有9.2倍的显著提升。相较单一FPGA平台上的计算,所采用的优化设计也提升了78.4%处理效率,实现了Open CL框架下高效的多FPGA异构计算。
其他文献
目的:通过应用自拟紫癜1号方治疗血热风盛证免疫性血小板减少症,观察血小板计数、T细胞亚群(CD3+、CD4+、CD8+、CD4+/CD8+)、中医症候分级量化积分、出血评分、疾病疗效、中医症候疗效,明确自拟紫癜1号方对免疫性血小板减少症的临床疗效,以及中药作用机制,为临床治疗ITP提供一种新的思路及数据支撑。方法:收集2018年11月至2019年12月期间河北省中医院血液科住院部及门诊部治疗的IT
近年来,随着经济社会的发展、党和国家的宣传和公民素质的提升,思想政治课的重要性越来越受到社会各界的关注。在影响思想政治课实施效果的各个因素中,思想政治课教师起着关键的作用。习近平总书记在全国思想政治理论课教师座谈会上强调办好思想政治理论课的关键在教师,关键在发挥教师的积极性、主动性、创造性。但是每一位有经验的好老师都是从初任教师阶段开始成长的,初任教师阶段是每一位教师职业发展的必经阶段,在这个关键
新时代高校法治教育对个人成长成才、高校依法治校以及国家法治建设具有重要意义。本研究从高校法治教育的理论基础出发,通过解读法治教育与高校法治教育的基本内涵,进而阐明了高校法治教育的主要功能。阐释了马克思恩格斯的法律思想、中国优秀传统法律思想、中国特色社会主义法治理念的形成为新时代高校法治教育提供了理论遵循。在此基础上,进一步探索了高校法治教育的实践历程,从而明晰了新时代高校法治教育的实践意义和价值。
《语文课程标准》(2011年版)(以下简称"课标")建议习作教学要"贴近学生实际,让学生易于动笔,乐于表达""注重培养学生观察、思考、表达和创造的能力"。统编本三年级习作教材,很好地体现了课标的意图与要求,既注重习作兴趣的激发和习惯的养成,也重视观察的训练和想象的培养。编者力图通过多次训练让学生掌握写好段落的基本方法,体会习作
随着生命科学的不断发展,患者遗传信息在临床个体化用药中的作用日益突出。基因突变检测技术被广泛应用于个体化用药相关基因标志物的检测当中,尤其在筛查用药相关基因多态性、指导肿瘤靶向药物使用以及监测耐药突变基因产生等方面有着重要意义。但随着临床需求的增大,现有的基因突变检测方法的问题也逐渐显现出来,主要包括检测灵敏度低、技术难度大、检测成本高、检测耗时长以及容易引起扩增产物污染等。针对目前存在的问题,本
强化学习是机器学习中解决序列化决策问题的算法的统称。相较于在给定的数据下进行预测的监督学习,强化学习通过主动的与环境交互,在不断的试错中提升算法的性能。由于人类世界的大部分问题都可以被视为序列化决策问题,因此强化学习被视为目前最可能实现“通用人工智能”的的路径之一。近些年来,强化学习,尤其是与深度学习结合的深度强化学习,已经在多个领域取得了傲人的进展,包括大量虚拟世界的应用,例如围棋,Dota,星
以铌酸锂为代表的铁电晶体,因其独特的铁电特性以及较高的非线性系数,逐渐成为了非线性光学领域所研究的重要材料之一。通过提拉法、外加电场极化法、飞秒激光直写等加工技术,可以控制铌酸锂晶体中的自发极化方向,从而形成周期极化、图案极化等特殊的畴结构。结合准相位匹配、非线性光学衍射、非线性体全息等理论,研究者可以灵活地对畴工程铌酸锂晶体中发生的非线性过程进行调控,从而实现多维度的光束操控。基于此,大量的畴工