一种带溢出控制的高性能FFT处理器的实现

来源 :2004年全国计算机体系结构学术会议 | 被引量 : 0次 | 上传用户:jick85726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种带自适应溢出控制的高性能定点FFT处理器的设计方法.这种方法在CORDIC算法基础上,通过优化数据存储结构和旋转因子生成方式,实现每个周期完成一个基4蝶形运算.同时提出一种高效的溢出控制实现方法,在不中断处理器流水工作的情况下,根据蝶形运算结果,动态地实现定点FFT的溢出控制.在Xilinx公司XCV2P30FPGA芯片上实现了整个FFT处理器,系统时钟频率达到130MHz,对于1024点16位复数FFT运算需要9.85μs,对16384点FFT运算需要220.56μs,优于目前大多数已有的FFT处理器.
其他文献
网格安全技术主要解决网格环境中实体之间的认证和授权问题.Globus网格项目中的GSI(GridSecurityInfrastructure)主要基于X.509技术实现身份认证以及数据的机密性、完整性和抗否认性,重点解决了认证和消息保护问题.然而在授权问题上缺乏必要的技术支撑.本文在分析现有安全技术的基础上,提出了将基于X.509的PKI技术和PMI技术相结合的网格安全框架,旨在实现基于安全认证基
本文针对一组网络处理器基准测试程序NpBench,实验测试了它在分支方面的各种特性,包括分支频度、分支组成以及基本预测精度,还测试了分支预测器大小、分支目标缓存的组数以及相联度对处理器核整体性能的影响,最后依据实验数据给出了对网络处理器分支预测器设计的一些认识.
以分布式处理机监控为出发点,在介绍网格环境对计算高可靠性的需求、处理机心跳监控基础上,对网格环境中已有的处理机心跳监控系统提出了改进.给出了一种网格下的处理机层次式心跳监控结构,减少了外部数据接收中心的通信量和系统开销,增强了监控系统检测处理机故障的能力,从而有助于提高网格系统的容错能力和可靠性.
本文提出了一种基于profile信息反馈的页迁移技术.与已有页迁移技术不同,该技术结合了并行编译优化方法,其信息收集工作主要在编译器内完成,具有迁移及时、决策准确和通用性好的优点.重点研究了该技术的决策信息和迁移策略,并提出了实现方案.
本文针对模糊神经网络的缺陷问题,提出了一种网络的快速算法和一种新量子遗传算法相融合的技术.快速算法只需对数据进行一次学习,避免了传统的迭代,并引入了置信度的概念;新量子遗传算法的全局寻优能力强,通过对模糊神经网络参数的优化,可提高网络性能.通过仿真,该融合算法技术收敛速度快,精度高,具有广泛的应用价值.
本文介绍了基于IXP2800的高速信息发现系统的基本原理、体系结构:硬件结构、软件结构和性能指标,该系统可为公安、安全、政府、教育和企业等提供一个对网上传播信息进行信息发现的工具.
IA-64是Intel与HP联合开发的64位的指令集体系结构.ItaniumTM是基于IA-64实现的第一款微处理器.它采用了许多先进的技术,文中针对ItaniumTM微处理器的简化结构,分析它的分支预测硬件层次,着重对动态两级自适应分支预测和完美循环退出等结构进行分析,并介绍了它们的工作过程.
本文通过对工业控制软件和实时数据库的研究建立基于OPC的实时数据库的架构,提出了三层OPC实时数据库的应用模式,探讨了一种大型实时数据的分布式解决方案;设计实时数据库的软件体系结构并给出OPC数据访问接口与OPC驱动接口程序的实现,实现了实时数据库与上层应用软件和下层现场设备的无缝集成.
结合弹载图像匹配计算特点,提出一种基于HPI互连的神经网络图像匹配计算机结构,在这种并行计算结构中,主控计算机通过HPI接口与各个神经匹配处理单元直接连接,主控计算机通过HPI接口可以直接访问各个神经元的片上和片外存储器,实现实时图像数据的直接转发和神经元中间运算结果的读取.理论分析表明,该设计可有效优化神经计算结构,提高图像匹配的实时性.
本文提出了一种基于FGSS的数字视频监控系统.该系统使用FGSS作为视频编码算法,重点解决了传统的视频编码方法存在的码率固定的问题,使得码流具有在任何地点截断的特性,并且具有较强的错误恢复功能,能够很好地适应网络带宽的变化.