上海论文网提供毕业论文和发表论文,专业服务20年。

面向MCM-GPU体系结构的电压噪声表征及平缓设计思考

  • 论文价格:150
  • 用途: 硕士毕业论文 Master Thesis
  • 作者:上海论文网
  • 点击次数:1
  • 论文字数:32122
  • 论文编号:
  • 日期:2024-04-20
  • 来源:上海论文网

计算机论文哪里有?本文主要研究了MCM-GPU架构处理器的电压噪声分布特点和影响因素,并针对MCM-GPU的电压噪声提出了两种平缓技术来提高整个系统的能效。

第1章   绪论

1.2   研究现状

MCM封装技术是一种很有前途的封装技术,能够以相对较低的成本实现巨大的性能提升。关于MCM的芯片设计, AMD已经在其最新的CPU和GPU产品中使用MCM架构,如EPYC、Ryzen[20]和MI250。在EPYC中,将单CPU的组件以芯粒(chiplet)的形式封装在一起,分为包含了内存通道、PCIe通道的IO Die(IOD),和包含了核心的core-complex die(CCD)。在学术界,一些研究人员通过利用MCM集成构建高性能和高能效的GPU。例如,A. Arunkumar等人提出了第一个具有多个架构级性能优化的MCM-GPU[19],验证了GPU程序对于MCM架构的高扩展性,并提出了MCM-GPU的能效分析指标[21]。而S. Pal等人[22]利用硅互连结构(Si-IF)建立了一个晶圆级规模的GPU。为了解决MCM-GPU中的非统一内存访问(NUMA)效应,M. Khairy等人[23]提出了一个全局位置感知的数据管理系统,通过优化数据放置、线程块调度和远程数据缓存来减少片外通信访问。

而在处理器电压噪声方面,目前针对CPU和GPU体系结构有较多研究工作。在CPU的电压噪声研究方面,T. N. Miller[24]研究了在多核处理器中由于同步行为引起的电压噪声,并提出了一种新的同步方法VRSync,通过减少负载波动的速率来平缓电压噪声。Z. Hadjilambrou[25]等人利用处理器执行过程中的电磁辐射强度来研究电压噪声的幅度。V. J. Reddi[26]等人通过测量处理器中电压噪声与分析程序的执行过程来研究影响电压噪声的微架构行为,设计了一种线程调度器对程序执行实时调度来平缓电压下降。而在GPU的电压噪声研究方面,J.  Leng[27]等人利用测量工具对GPU的电压噪声幅度、处理器电压保护带的大小以及程序的极限电压Vmin进行了测量和分析。R. Thomas[28]等人利用GPU中的谐振现象对电压噪声进行预测,并提出以破坏谐振活动模式来减少电压噪声幅度,还提出了在GPU中减少工艺变化(process variation)因素下引起的电压噪声[29]。J. Leng等人以GTX480为平台建立了一个电压噪声模型[30],研究了单片GPU中的电压噪声特性,并提出了全局检测分层平缓技术来缓解单片GPU中的电压下降[31]。对于MCM-GPU体系结构的电压噪声,目前还没有相应的研究,本文的工作是第一个关于MCM-GPU电压噪声特征分析和缓解的研究。之前的GPU电压噪声平缓技术均面向传统的单片式GPU体系结构,相对而言,本文的工作考虑了MCM-GPU体系结构的特点,能够更好地表征及平缓MCM-GPU中的电压噪声。

计算机论文怎么写

第3章   MCM-GPU电压噪声模拟与分析

3.1   引言

正如前文中所述,MCM-GPU处理器得益于较低的成本和制造工艺逐渐成为未来高性能GPU的发展方向。但是,由于较大的规模和功耗,其能效问题值得深入分析。考虑到目前MCM-GPU的发展尚未成熟,以及需要对不同配置下进行详细地分析论证,本文经过广泛研究并使用模拟的方法对MCM-GPU的电压噪声问题进行分析和探讨。

虽然目前没有针对MCM-GPU开发的模拟工具,但对单GPU的性能模拟和功耗模拟研究已经较为成熟。本文利用已经广泛使用并经过验证的Accel-Sim[32]平台为基础,加入MCM-GPU的架构特性,来对MCM-GPU的性能和功耗进行模拟。通过设计合理的MCM-GPU的PDN参数,以功率模拟中得到的单SM功率和PDN中设计的电子元件参数相结合,从而模拟整个芯片的片上电压。

研究将对MCM-GPU处理器中电压噪声的分布特点、形成原因以及影响因素进行重点分析。同时,与单芯片GPU以及不同规模和配置MCM-GPU架构的电压噪声变化对比分析也是本次研究的重要内容。

第4章   MCM-GPU电压噪声平缓和评估

4.2   GPM感知平缓技术

本节首先介绍GPM感知电压噪声平缓技术,即GAM技术。此前,针对单片GPU的电压噪声问题,一种全局性的电压噪声平缓机制被提出,通过检测GPU运行中大多数SM是否存在从少量到大量warp的发射来判断电压噪声的出现并推迟每个SM的执行来缓解电压噪声。然而,这种全局性的检测和节流技术并不能直接用于MCM-GPU架构,因为如第三章所分析的那样,MCM-GPU处理器呈现出明显的GPM局部性特征,所有的GPM同时进行同步活动并引发电压噪声的现象几乎不会出现。因此,在本节中,为MCM-GPU提出了了一种基于GPM感知的电压噪声平缓系统GAM。

GAM基于GPM级别的SM同步活动进行检测,并预测GPM级别的电压下降。GAM由两部分组成,分别为检测器(detector)和节流器(throttler),通过检测器来预测电压噪声的出现,通过节流器来平缓噪声的幅度。如图4.1为GAM技术的算法伪代码,显示了整个GAM的技术流程,检测器在MCM-GPU处理器运行中实时监测每个SM的活动warp的数量,它为每个SM中的子核添加一个1-bit标志位。在本文使用的基准MCM-GPU配置中,每个SM包含4个子核,也即是每个SM增加的存储时4位,一共是384位。这里需要说明的是,这里也可以利用GPU的ISA(instruction set architecture,指令集架构)在指令缓冲区提供的空闲位来进一步减少这种存储开销。但是,我们选择在warp调度器中之间增加一个标志位存储缓冲器,这样可以避免消耗ISA的可扩展性。

计算机论文参考

4.3   电压噪声幅度感知平缓技术

根据前面的分析可以得知,MCM-GPU中程序执行侧电压噪声的主要原因是GPU本身执行过程中会出现的线程对齐等各种同步活动引起的处理器电流快速上升,在di/dt效应下导致电压出现较为明显的下降。GAM技术以相同的方式处理所有的电压下降行为,通过检测warp的数量变化来预测电流是否将要快速上升导致大范围的电压下降。然而,根据前文在第三章第二节中所观察到的现象,即电压噪声存在不同的幅度,包括本文所分类的高噪声(电压下降8%以上)、中噪声(电压下降4%至8%)以及低噪声(电压下降4%以下)。因此,GAM技术在识别范围上依然不够准确,不能适应不同的电压噪声幅度。在本节中,一项新的可以对不同幅度电压噪声进行预测并分别平缓的技术被提出,即电压噪声幅度感知平缓技术(DMSA),来更精准地预测和缓解MCM-GPU中出现的电压噪声。

4.3.1   电压下降幅度分析

计算机论文怎么写

第5章   总结与展望

5.1    全文工作总结

本文主要研究了MCM-GPU架构处理器的电压噪声分布特点和影响因素,并针对MCM-GPU的电压噪声提出了两种平缓技术来提高整个系统的能效。首先,通过对在GPU研究领域广泛使用的模拟工具Accel-Sim进行扩展使其支持MCM架构,包括在性能模拟上增加GPM的逻辑支持,通过不同的片内片外延迟来区分不同的GPM,而单个GPM沿用现在的GPU架构。在功率模拟上添加GPM间的通信能量来模拟片外功率,最后利用单个SM的功率结合扩展的MCM-GPU的PDN设计得到按周期和区域分布的电压结果。

然后对MCM-GPU处理器的电压噪声分布进行了详细的分析,首先是最大电压噪声的分布,与单GPU相比,MCM-GPU经历更大的电压下降,表现出更明显的电压噪声影响。然后是所有基准程序的所有幅度的电压噪声整体分布,发现电压噪声整体的出现频率很低,在99%的运行时间上噪声幅度都小于7%,幅度越大的电压噪声分布频率越低。而且MCM-GPU的电压噪声空间分布呈明显的区域性,不同GPM的电压噪声趋势相似,但存在着数十个周期的相位差异。在功率分布上,不同GPM的分布也十分不均匀,在某些情况下,部分GPM的功率总是大于其他GPM。

接着本文研究了不同敏感性参数下MCM-GPU的电压噪声影响情况,首先是整体规模也就是SM数量,结果显示当GPM数量不变时,SM数量越多其整体的电压噪声幅度越大。而当SM数量不变时,GPM数量越多,整体电压噪声也越大。当改变GPM片外延迟时,电压噪声先随着延迟的增大而增大,接着延迟继续增大,电压噪声幅度反而减小。而改变GPM间通信能量时,电压噪声会一直随着片外通信能量的增大而增大。

参考文献(略)

123
限时特价,全文150.00元,获取完整文章,请点击立即购买,付款后系统自动下载

也可输入商品号自助下载

下载

微信支付

查看订单详情

输入商品号下载

1,点击按钮复制下方QQ号!!
2,打开QQ >> 添加好友/群
3,粘贴QQ,完成添加!!