我昨天发到chh了,写的很清楚了为了方便我就直接复制吧,不一定保证100%有效 每个人情况都不一样,但这个是我认为的最可能的解决办法。
前段时间入手的二手vega56上水by冷头后 hotspot高温异常,昨天新入手的vega64上了这个by的冷头依然存在hotspot高温的问题,但将之前温度异常的56装回黑风散热器拷机温度又正常了 问题症状是满载下gpu温度 显存温度均正常 hotspot会超过100度到达110度将黑屏死机
具体问题详情见
https://www.chiphell.com/thread-1927610-1-1.html
查了半天 包括外国的一些论坛 网上目前均对hotspot这个温度代表什么部位没什么明确说法,有说是gpu跟hbm显存之间的缝隙的(绝大部分vega56/64封装都是树脂填充 根本不存在用硅脂填充散热的说法),也有说是代表任何部件中最高温度部分的(包含gpu显存供电或者其他任何原件)。但是根据会死机的情况看,这个数值是有实际意义的 不仅是显示一个毫无作用的缝隙温度。
另外得知 有此现象的基本为使用by冷头和拆过散热器的群体。
今天反复拆机好几次,结合坛友“manyhn”和“ycy9128”的经验,自己发现了大概的问题所在
这是vega原装散热器的导热部分 对应核心位置(GPU+显存)以及供电的mos部分和电感部分 图片来自太平洋电脑网(https://diy.pconline.com.cn/977/9774424_1.html)

这是pcb拆解全图以及原装散热器导热垫对应的位置 蓝色为mos贴片(低矮)红色为电感部分(较高 高出核心高度)


这是我之前使用的导热方案 灰色部分为1.5mm莱尔德 ,粉色部分为0.5mm杂牌导热垫

这样的原装导热方案(原装散热器设计不同高度的凹凸部分以对应不同高低的原件 硅脂厚度均为1mm 我用1.5mm可压缩硅脂搭配0.5mm实现全贴合) 上机依然存在hotspot高温的问题,通过再次拆开发现 mos、电感处导热垫 以及核心均接触到BY的冷头导热板,但是核心位置上下贴合不均匀 没有完全贴死核心与hbm位置

再次安装时我仅保留了mos供电位置的导热垫,我使用1.5mm的莱尔德760 这种导热垫类似固体硅脂可以受力压缩 间隙小于1.5mm 它也可以自己压到合适的厚度 (1.5~1.0之间)可以更好的贴合 同时固定核心使用了原装X背板


实测这样hotspot温度恢复正常
左图为hotspot高温症状,右图为正常状态



通过这几次拆解观察与结合网络上的说法,我虽不确定hotspot到底是不是代表核心处缝隙温度,但可以大致得出结论:大部分hotspot问题出现的原因应该在于核心位置贴合不紧导致。vega显卡的温度感测项目中 gpu与hbm温度检测应该只是显示表面温度 不是内部温度,所以出现了显示表面温度低但在满载情况下hotspot项目却迅速过热的问题。
可能导致贴合不紧密的情况有:
1.背部螺丝没有拧紧 2.使用了错误厚度的导热垫 撑开pcb与散热器距离 3.散热器设计公差有问题 4.不应该安装导热垫
至于BY冷头通过与客服咨询,得知设计时仅为mos部分散热,如果自行给电感部位加导热垫 不管多薄都会影响冷头贴合核心位置 导致贴合不紧密。原装的散热器以及EK、bp、北极狼散热器 均给电感部分也散热 并配备了多种不同厚度不同大小的导热垫。by属于降低定模成本的简易设计,因此不推荐上by 冷头 除非你牺牲电感以及pwm芯片的散热。
另外有一项就是建议核心位置安装原装X背板,不要使用冷头自带的螺丝,可以更好的贴合。
结论:vega显卡的核心温度与HBM温度的感测器感应的是应该表面温度 ,hotspot温度依然检测的是核心部分,供电部分没有单独的温度感测器。
前段时间入手的二手vega56上水by冷头后 hotspot高温异常,昨天新入手的vega64上了这个by的冷头依然存在hotspot高温的问题,但将之前温度异常的56装回黑风散热器拷机温度又正常了 问题症状是满载下gpu温度 显存温度均正常 hotspot会超过100度到达110度将黑屏死机
具体问题详情见
https://www.chiphell.com/thread-1927610-1-1.html
查了半天 包括外国的一些论坛 网上目前均对hotspot这个温度代表什么部位没什么明确说法,有说是gpu跟hbm显存之间的缝隙的(绝大部分vega56/64封装都是树脂填充 根本不存在用硅脂填充散热的说法),也有说是代表任何部件中最高温度部分的(包含gpu显存供电或者其他任何原件)。但是根据会死机的情况看,这个数值是有实际意义的 不仅是显示一个毫无作用的缝隙温度。
另外得知 有此现象的基本为使用by冷头和拆过散热器的群体。
今天反复拆机好几次,结合坛友“manyhn”和“ycy9128”的经验,自己发现了大概的问题所在
这是vega原装散热器的导热部分 对应核心位置(GPU+显存)以及供电的mos部分和电感部分 图片来自太平洋电脑网(https://diy.pconline.com.cn/977/9774424_1.html)

这是pcb拆解全图以及原装散热器导热垫对应的位置 蓝色为mos贴片(低矮)红色为电感部分(较高 高出核心高度)


这是我之前使用的导热方案 灰色部分为1.5mm莱尔德 ,粉色部分为0.5mm杂牌导热垫

这样的原装导热方案(原装散热器设计不同高度的凹凸部分以对应不同高低的原件 硅脂厚度均为1mm 我用1.5mm可压缩硅脂搭配0.5mm实现全贴合) 上机依然存在hotspot高温的问题,通过再次拆开发现 mos、电感处导热垫 以及核心均接触到BY的冷头导热板,但是核心位置上下贴合不均匀 没有完全贴死核心与hbm位置

再次安装时我仅保留了mos供电位置的导热垫,我使用1.5mm的莱尔德760 这种导热垫类似固体硅脂可以受力压缩 间隙小于1.5mm 它也可以自己压到合适的厚度 (1.5~1.0之间)可以更好的贴合 同时固定核心使用了原装X背板


实测这样hotspot温度恢复正常
左图为hotspot高温症状,右图为正常状态



通过这几次拆解观察与结合网络上的说法,我虽不确定hotspot到底是不是代表核心处缝隙温度,但可以大致得出结论:大部分hotspot问题出现的原因应该在于核心位置贴合不紧导致。vega显卡的温度感测项目中 gpu与hbm温度检测应该只是显示表面温度 不是内部温度,所以出现了显示表面温度低但在满载情况下hotspot项目却迅速过热的问题。
可能导致贴合不紧密的情况有:
1.背部螺丝没有拧紧 2.使用了错误厚度的导热垫 撑开pcb与散热器距离 3.散热器设计公差有问题 4.不应该安装导热垫
至于BY冷头通过与客服咨询,得知设计时仅为mos部分散热,如果自行给电感部位加导热垫 不管多薄都会影响冷头贴合核心位置 导致贴合不紧密。原装的散热器以及EK、bp、北极狼散热器 均给电感部分也散热 并配备了多种不同厚度不同大小的导热垫。by属于降低定模成本的简易设计,因此不推荐上by 冷头 除非你牺牲电感以及pwm芯片的散热。
另外有一项就是建议核心位置安装原装X背板,不要使用冷头自带的螺丝,可以更好的贴合。
结论:vega显卡的核心温度与HBM温度的感测器感应的是应该表面温度 ,hotspot温度依然检测的是核心部分,供电部分没有单独的温度感测器。