针对高性能光线追踪基于图像处理器的存储聚集访问和线程调度架构

来源 :2016北京微电子研究生学术论坛 | 被引量 : 0次 | 上传用户:abmabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  Ray-tracing rendering has long been considered as a promising technology to enable a higher level of visual experience.The democratization of the ray-tracing rendering to consumer platforms, however, poses significant challenges to rendering hardware and software due to its highly irregular computing patterns.
其他文献
传统的计算体系是以计算为中心的.在数据处理的过程中,数据被通过层层的存储体系传输到计算单元所在的位置进行计算,这种结构在过去的几十年里是成功的,也能达到性能需求.然而随着时代的发展,计算机的应用需求也随着发生了很大的改变.近些年,大数据的出现迅速成为热点话题.随着计算机需要处理的数据量越来越大,数据处理的过程中,相比于数据计算,数据的存取所占的比重也越来越大.数据存取面临的带宽,延迟和功耗的问题已
假体碰撞磨损是髋关节置换后的一种常见并发症.为了减小此并发症的发病率,本文提出了一种新型智能试模,可用于术中髋关节假体定位、假体脱臼检测和假体运动范围及稳定性评估.试模内含摄像头和惯性测量单元,外形尺寸与真实假体相同,但不具备耐磨性.当医生使用此辅助试模确定假体合适的植入位置后,试模将被替换为耐磨的真实假体.为配合试模内的摄像头进行假体实时姿态检测,我们在髋臼内表面设计了参考图样.本文提出了通过分
Novelty This abstract reports the investigation on the piezoelectricity of single far-field electrospun PVDF nanofibers at nanoscale by piezoresponse force microscopy (PFM).
深度卷积网络(DCNN)已经被广泛地应用于图像分类、物体检测、视频监控等各种计算机视觉应用中.DCNN的网络规模和层参数随着应用需求的不同而有很大的差异,这给DCNN的通用硬件加速带来很大的挑战.目前已有的DCNN硬件加速工作通常采用固定的计算模式来加速不同的DCNN模型.这种方式会产生硬件资源与多样模型不匹配的问题,进而导致功耗效率和性能无法兼顾.为了解决这一问题,我们设计了一个支持混合计算模式
由于浮点快速傅里叶变换(FFT)具有宽动态范围和高处理精度的优势,它在科学计算和高精度成像应用中得到了广泛的应用.然而,相对定点计算而言,浮点计算带来了更高的面积和功耗问题.为了解决这一问题,本文提出了一种全新的面积和功耗优化的混合SDC/SDF结构.该结构可以分别在单路径延迟转换(SDC)部分和单路径延迟反馈(SDF)部分极大优化所需的计算资源和存储资源.通过结合这两部分在计算资源优化以及存储单
随着数据传输速率的不断提高,电子产品对模数转换器(ADC)的转换速率提出了越来越高的要求,然而精度和功耗限制了单通道ADC转换速率的进一步增长。当前,时间交织(Time-Interleaved)结构已成为实现高速模数转换器的首选,但该结构通道之间存在着失配问题,其中采样时钟偏差(Timing mismatch)尤为棘手。基于自相关(Autocorrelation)的采样时钟偏差校准方法因硬件实现复
The solid-state nanopores have attracted growing attention in single molecule sequencing fields, especially in DNA sequencing area, due to their superior properties such as robustness, environmental t
Recently 2D material graphene with carbon atoms packed into a plane honeycomb crystal structure becomes research hotspot due to its extremely high mobility, easy to be scaled down, high light transmit
本文提出了一种利用勒计德函数拟合肠鸣音频谱模型来定量评估人体肠道活动性的方法。包含肠鸣音事件的信号样本经快速傅立叶变换后,其频谱被分解为勒让德函数表示的广义傅里叶级数,足够多的样本用以训练该频谱模型。对于每一段待测的肠鸣音样本,计算其相对频谱强度和与频谱模型的相关度,可以给出肠道活动性、肠鸣音时间次数以及平均每次肠鸣音的持续时间。仿真结果已经证明,该方法具有相当的准确性和可操作性。
隧穿场效应晶体管(TFET, Tunnel field effect transistor)由于其能够实现低于60mV/dec的亚阈值摆幅(SS, Subthreshold swing)而在低功耗集成电路领域有着广阔的应用前景。但其开态电流比之传统的MOS晶体管低了2-4个数量级,限制了它的发展。采用纵向的线隧穿结构可以有效地改善这一缺陷,但同时也带来了较大的关态漏电。本文提出了一种基于锗硅异质结