【非MC/硬件求助】小主机特定条件下异常花屏死机记录
大家好,我是 Flen。好久没有在苦坛发帖了,故在这里发一下。从2月开始,我的小主机遇到一个异常的花屏死机问题。经过了多轮详细测试和变量控制,记录下了一些现象。由于个人设备有限,目前无法得出确切的结论,特整理了所有测试数据和现象,恳请各位硬件大佬帮忙诊断。
- 型号: ThinkCentre M720q
- CPU: Intel Core i5-8600T(使用核显 UHD 630)
- 内存: 单根 16GB DDR4 2666MHz 联想 OEM 笔记本内存(见图1)
- AIDA64内存读取信息:见图2
一开始,我把所有所需配件买齐并组装,测试时在农村老家,表现一切正常。之后,我去了我妈所在的城市,在长时间使用的情况下(系统正常运行期间)会偶发花屏,并伴随彻底死机(见下图)。
随后发现,使用 MemTest64 测试(设置大小为 1024MB,不限制循环次数)可稳定触发此现象。即使在安全模式下依然能被稳定复现(见下图)。
在一次死机前(晚上9点多,记录的数据时间下同),我用 HWiNFO 记录了传感器的读数。由于数据实在太多,我用 AI 进行了总结:
“在44:19.2之前,系统运行平稳:所有核心频率稳定在3490–3492 MHz,有效频率与之匹配,各核心使用率均为100%,温度约68–71℃,功率约30W。但从44:19.2开始出现严重异常:核心频率升至平均3543 MHz(最高3593 MHz),但有效频率平均骤降至2177 MHz,且核心间极不均衡(如Core 3仅351.8 MHz,Core 4为1628 MHz),表明部分核心实际工作频率远低于请求值。核心使用率从100%降至平均71.9%,其中Core 2仍为100%,而Core 3仅46.2%,无法维持满载。同时温度最高73℃,未达过热阈值;CPU封装功率约27W,低于35W的PL1限制;风扇转速却从1507 RPM逐渐升至1788 RPM。这些异常发生在MemTest64内存测试期间,最终导致花屏死机。”
这里也有一个问题,上面的传感器数据实际上在当时死机前几秒就没有后文了,并且系统日志中没有留下明显有用的信息,目前尚不清楚原因。
为了排查问题,我进行了以下测试:
首先,我拆机拔下内存,使用橡皮擦拭了金手指,并更换了主板上的另一个内存插槽,开机测试后问题依旧。
然后,我在 msconfig 中设置了系统最大内存限制为 14GB。在此状态下再次运行相同的 MemTest64 复现测试,连续跑了近半小时,未出现花屏死机。
之后,我回到了老家。老家房屋电气线路为去年装修重做,有良好接地。我解除了 14GB 内存限制,并进行多轮压力测试和 MemTest64 复现,连续满载跑了 1 个多小时,完全没有出现任何故障。
补充下背景。我妈所在的城市曾出现过两次照明灯具损坏(次卧吸顶灯修好后再次爆掉烧坏;之前长期正常的厨房灯也突然损坏)。但其他电器没出现明显异常。两地测试使用的是同一套电源适配器、显示器和线材。
4月,我再次回到城市,并换到客厅进行测试,在相同的 16GB 满载配置跑了共 20 分钟未发生死机。期间,在第 13 分钟时,桌面出现了一次瞬间刷新,随后继续运行至 20 分钟手动结束。
随后,停止测试并进行日常轻度使用约 3 个小时,关闭所有程序后再次运行 MemTest64。结果测试仅 10 秒左右即触发花屏死机。
强制关机等待约 10 分钟后,再次开机测试,运行约 12 秒时再次出现问题(见下图,剧烈闪烁画面警告)。
我把上述数据给不同的大模型分析,结果它们得出的结论不同,解决方法更是不尽相同。本人因各种原因,精力有限,非必要情况下其实是不想弄这么麻烦的,但还是要尽可能解决问题。恳请各位经验丰富的大佬结合以上信息帮忙分析一下,这种特定条件下的花屏死机究竟是什么原因导致的?非常感谢! 我猜测是这样的:1城市接地不良,导致(可能是内存/显存溢出),并且零线可能带电,以上结合你家的灯爆掉,你可以找个电工检查一下你家的电路
还有一种城阳电工遇到的有emp脉冲
页: [1]