當電腦出現 “藍屏” 異常問題時,應當如何處理?
( 內附《通用修復方案操作指南 | 第一版》與《初步分析方案操作指南 | 第一版》)
作 者 | 高楷修 (Ling Gao)
職 位 | Microsoft 大中華區社區領袖 (CL),Windows Insider 最有價值專家 (MVP),學生大使。
日 期 | 2021 年 1 月 3 日 (庚子冬月二十)
本文 由 Ling Gao 發佈於 Microsoft Community,本站在此僅作轉載,您可在 此處 查閱原文。
一、概述
“藍屏” 異常是 Microsoft Windows 10 產品的個人和家庭用戶在日常使用中可能會遇到的常見疑難問題之一,同時也是 Microsoft Community 社區處理次數最多的 Windows 問題,其發生概率遠高於其它疑難問題。針對個人用戶、家庭用戶和 IT 管理人員工作經驗相對匱乏的小型企業,“藍屏” 異常問題同時具有 “易發生”、“難解決” 和 “高代價” 三大特點:
- “易發生”:包括但不限於 “更新 Windows 系統”、“更新電腦硬件驅動程序”、“安裝應用程序”、“安裝新硬件 / 更換電腦硬件”、“啟動部分軟件 / 啟用部分功能” 等常見的 Windows 系統操作均有一定的可能性導致電腦出現 “藍屏” 異常。
- “難解決”:絕大多數的 Windows 10 產品用戶並不具備針對 “藍屏” 異常問題的處理能力和經驗,用戶通常會寄希望於社會中質量良莠不齊的第三方電腦維修工程師,或者直接通過重新安裝 Windows 系統的方式嘗試徹底解決問題。
- “高代價”:很多用戶在電腦出現 “藍屏” 異常問題時,會自行或在第三方電腦維修工程師的協助下直接重新安裝 Windows 系統。無論用戶是否有執行過完整的數據備份操作,重新安裝 Windows 系統均可能導致用戶個人文件或應用程序數據丟失。
本文將系統性的闡述電腦 “藍屏” 異常問題的成因、通用修復方案以及初步分析方案,將會幫助遭受電腦 “藍屏” 異常問題困擾的 Windows 10 產品用戶徹底解決問題,同時也可以為 Microsoft 社區工作人員 (包括社區獨立顧問) 提供針對電腦 “藍屏” 異常問題處理能力的基礎培訓。本文屬於 Microsoft 社區 “將 ‘客戶至上’ 的服務理念做到極致” 改革創新總路徑中的一部分,撰寫本文的目的是:穩步提高 Microsoft 社區處理電腦 “藍屏” 異常問題的綜合能力和整體效率,切實提高 Microsoft 社區客戶滿意度。
二、什麼是 “藍屏” 異常?
當 Microsoft Windows 10 系統遇到影響其自身安全運行的情況時,產品將自動停止運行。這種 “自動停止運行” 的現象被稱為 “Bug Check” (中文名稱為 “錯誤檢查”、“系統崩潰”、“內核錯誤” 或 “停止錯誤”)。通常情況下,Windows 10 系統將會在自動停止運行前面向電腦屏幕顯示 藍色 背景顏色的錯誤提示信息,因此這種現象也被稱為電腦 “藍屏” 異常。
雖然伴隨藍色畫面出現的系統錯誤檢查經常引起用戶的強烈恐慌,但實際上此功能是為了保護用戶數據與系統自身安全所設計的。如果放任操作系統在出現 “完整性泄露” 問題後繼續運行,用戶的個人數據與 Windows 系統的自身數據將會出現損壞。藍色畫面中通常會顯示類似 “nvlddmkm.sys” 的錯誤驅動程序名稱或類似 “CRITICAL_PROCESS_DIED” 的停止錯誤代碼。
電腦 “藍屏” 異常問題的成因涉及諸多不同因素,因此其具有 “難解決” 的特點。大量研究表明:電腦 “藍屏” 異常問題絕大多數情況下是由於用戶在電腦中安裝了不兼容或存在問題的第三方應用程序 (如反病毒軟件) 或硬件驅動程序 (如顯卡驅動程序) 所導致的,僅極小概率是由於 Microsoft Windows 產品及其組件自身出現異常所導致的。
Microsoft 曾對大量電腦 “藍屏” 異常問題樣本的成因進行過分析,研究結果如下:
- 70 % 的 “藍屏” 異常問題是由 第三方驅動程序代碼 所導致的。
- 10 % 的 “藍屏” 異常問題是由 電腦硬件異常或故障 所導致的。
- 5 % 的 “藍屏” 異常問題是由 Windows 系統自身 所導致的。
- 其餘 15 % 的 “藍屏” 異常問題因數據嚴重損壞無法準確分析成因。
如果用戶在系統中啟用了 “崩潰轉儲” 功能,則發生 “藍屏” 異常問題時,Windows 將自動創建日誌文件。如果專業的軟件開發人員連接並啟用了內核調試器,Windows 系統將不再顯示藍色畫面,便於開發人員調查和分析問題成因。Windows 系統執行錯誤檢查時,並不總是顯示藍色畫面,某些情況下還會顯示綠色或橙色畫面。無論屏幕顯示任何顏色,處理方案是基本一致的。
三、通用修復方案操作指南(第一版)
概述:《通用修復方案操作指南》適用於:空閑時間充裕、不急於解決問題 (電腦無法使用並不影響正常工作、學業和生活 )、有備用電腦、電腦中存放了重要的個人文件,不希望直接通過 “重新安裝 Windows 系統 ” 方案解決問題的用戶。此操作指南同樣適用於 Microsoft 社區工作人員和支持代理在用戶無法成功收集到電腦 “藍屏 ” 日誌文件時向其提供。
步驟一:用戶確認近期是否執行過硬件層面的特殊操作。
當 Windows 10 產品用戶遇到電腦 “藍屏” 異常問題時,應當確認在問題首次出現之前,自己是否執行過任何硬件層面的特殊操作。硬件層面的特殊操作包括:更換或新增電腦硬件 (包括內存、硬盤、鼠標、鍵盤、讀卡設備、外置網卡等)。如果用戶可以確認未執行過任何硬件層面的特殊操作,轉到執行步驟二。如果用戶執行過硬件層面的特殊操作,則執行下方的修復方案:
通常情況下,電腦中的新增硬件便是導致其出現 “藍屏” 異常問題的罪魁禍首。用戶應當將新增硬件從電腦中移除,然後確認 Windows 系統能否正常啟動。如果 Windows 系統無法正常啟動,轉到執行步驟二。如果 Windows 系統可以正常啟動,用戶應當按照日常使用習慣繼續使用 72 小時電腦,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,轉到執行步驟三。
步驟二:確認 Windows 系統目前能否正常啟動。
在此步驟中,用戶應當確認 Windows 系統目前能否正常啟動。如果 Windows 系統可以正常啟動,但是在一段時間後會出現 “藍屏” 異常,轉到執行步驟三。如果電腦在開機後無限出現 “藍屏” 異常問題,無法成功進入 Windows 桌面,則執行下方的修復方案:
用戶應當首先執行系統內置的自動修複流程,即在 Windows 恢復界面點擊 “修復” 按鈕,系統將嘗試自行尋找並修復妨礙其正常啟動的問題。如果自動修復功能無法解決問題,用戶應當在 Windows 恢復界面卸載掉近期安裝的全部功能和質量更新,並且在命令提示符中執行 “chkdsk C: /r” 命令,尋找並修復硬盤中的邏輯錯誤和物理錯誤。如果上述三個修復方案執行完畢後 Windows 系統仍無法正常啟動,則用戶應當執行下方的修復方案,使用 U 盤安裝介質全新安裝 Windows 系統 (系統盤中的文件將會全部丟失):
用戶自行準備容量大於 8 G 的 U 盤 ⑴,使用其他可以正常使用的 Windows 10 電腦,進入 Windows 10 下載網站 (https://www.microsoft.com/zh-cn/software-download/windows10),下載 Microsoft 媒體創建工具,使用此工具的第二個選項創建 Windows 10 U 盤安裝介質。接下來,用戶須將無法正常啟動的電腦通過 BIOS 調整為 “USB 啟動” 狀態,插入介質 U 盤並重啟電腦,在安裝界面格式化系統盤後重新安裝 Windows 10 產品。重新安裝後,用戶應當按照日常使用習慣繼續使用 72 小時電腦,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,轉到執行步驟七。
注 ⑴ :創建 Windows 10 U 盤安裝介質時 U 盤將自動格式化,重新安裝 Windows 系統時用戶個人文件和應用數據將會被刪除,用戶須提前進行數據備份。如因重新安裝 Windows 系統導致用戶電腦文件出現丟失或損壞,Microsoft 不承擔任何法律責任。
步驟三:在 “藍屏” 提示信息中尋找錯誤驅動程序名稱。
在此步驟中,用戶應當在 “藍屏” 提示信息中尋找類似 “nvlddmkm.sys” 的錯誤驅動程序名稱。如果 “藍屏” 提示信息中僅能尋找到類似 “CRITICAL_PROCESS_DIED” 的停止錯誤代碼,則忽略此步驟,轉到執行步驟四。
如果可以尋找到類似 “nvlddmkm.sys” 的錯誤驅動程序名稱,用戶應當在 Microsoft Community、Bing、Google 和 Baidu 等網站或搜索引擎中尋找此驅動程序名稱,並且嘗試確認其具體是何種硬件驅動程序或電腦應用程序。如果用戶可以確認此名稱是電腦中某個硬件的驅動程序,則應當通過官方渠道重新安裝對應的驅動程序 (切勿使用第三方驅動程序更新軟件)。如果用戶可以確認此名稱是電腦中安裝的某個應用程序,則應當卸載此應用程序。完成上述操作後,用戶應當重啟電腦,並按照日常使用習慣繼續使用 72 小時,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,轉到執行步驟四。
常見錯誤驅動程序名稱對照表:
錯誤驅動程序名稱 | 對 應 | 修復方案 |
---|---|---|
ntkrnlmp.exe | Windows 系統內核 | 通過官方渠道重新安裝電腦所有主要硬件 (包括 BIOS、獨立和核心顯卡、有線和無線網卡、聲卡等) 的驅動程序。 |
nvlddmkm.sys、dxgmms2.sys、igdkmd64.sys 等 | 電腦顯卡硬件相關驅動程序 | 通過官方渠道重新安裝獨立顯卡和核心顯卡的硬件驅動程序。 |
NETIO.SYS、tcpip.sys、vwififlt.sys、wdiwifi.sys、rt640x64.sys 等 | 電腦網卡硬件相關驅動程序 | 通過官方渠道重新安裝有線網卡和無線網卡的硬件驅動程序。 |
iaStorAC.sys | Intel 快速存儲技術驅動程序 | 通過官方渠道重新安裝 “Intel 快速存儲技術” 驅動程序。 |
topsecpf.sys | “天融信” 廠商旗下應用程序 | 卸載電腦中的 “天融信” 廠商旗下軟件。 |
360Hvm64.sys | 360 安全衛士 (360 殺毒) 應用程序 | 卸載電腦中的 “360” 廠商旗下軟件。 |
TesSafe.sys | 騰訊電腦管家、騰訊遊戲等應用程序 | 卸載電腦中的 “騰訊” 廠商旗下軟件。 |
aida64.exe | “AIDA 64” 硬件檢測工具 | 卸載電腦中的 AIDA 64 工具。 |
xlwfp.sys | “迅雷” 廠商旗下應用程序 | 卸載電腦中的 “迅雷” 廠商旗下軟件。 |
chrome.exe | “谷歌” 旗下 Chrome 瀏覽器 | 卸載電腦中的 Google Chrome 瀏覽器。 |
待 續 | 待 續 | 待 續 |
步驟四:用戶確認近期是否執行過軟件層面的特殊操作。
在此步驟中,用戶應當確認自己是否執行過任何軟件層面的特殊操作。軟件層面的特殊操作包括:安裝 Windows 系統更新、安裝應用程序等。如果用戶確認其未執行過軟件層面的特殊操作,轉到執行步驟五。反之則執行下方的修復方案:
如果用戶近期安裝過 Windows 系統更新,則應當通過 “設置”>“更新和安全”>“Windows 更新”>“查看更新歷史記錄” 界面卸載近期安裝的全部 Windows 更新 (部分 Windows 更新可能無法卸載,屬正常現象)。如果用戶近期安裝過應用程序,則應當通過 “設置”>“應用”>”應用和功能” 界面將應用列表的排序依據調整為 “安裝日期”,卸載近期安裝的全部應用程序。
如果用戶近期未安裝過 Windows 系統更新,並且目前使用的不是最新版本的 Windows 系統,則用戶應當將 Windows 系統更新至當前的最新版本。完成上述操作後,用戶應當重啟電腦,並按照日常使用習慣繼續使用 72 小時,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,轉到執行步驟五。
步驟五:執行常規修復操作 ⑵。
注 ⑵ :如果開機進入系統後,電腦的可用時間不足以執行常規修復操作 (如開機數分鐘後就會出現 “藍屏 ” 異常 ),則用戶應當按照 Microsoft 文章《在 Windows 10 中,在安全模式下啟動電腦》中提供的方案進行操作,進入 “安全模式 ” 後繼續執行修復操作。
在此步驟中,用戶應當完整的卸載電腦中安裝的全部第三方反病毒軟件。卸載完畢後,用戶須重啟電腦,並按照日常使用習慣繼續使用 4 小時,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,則繼續執行下方的修復方案:
用戶應當通過官方渠道 (如電腦品牌官方網站) 重新安裝電腦中全部主要硬件的驅動程序,其中包括:BIOS、CPU、獨立顯卡、核心顯卡、有線網卡、無線網卡、聲卡等。重新安裝驅動程序後,用戶須重啟電腦,並按照日常使用習慣繼續使用 4 小時,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,則繼續執行下方的修復方案:
用戶應當按照 Microsoft 文章《如何在 Windows 中執行乾淨啟動》中 “如何執行乾淨啟動” 章節提供的方案進行操作。執行完畢後,用戶須重啟電腦,並按照日常使用習慣繼續使用 8 小時,確認其是否再次繼續出現 “藍屏” 異常問題 ⑶。
注 ⑶ :執行 “乾淨啟動 ” 操作後,如果電腦 “藍屏 ” 異常問題得到了有效緩解,則用戶應當繼續按照《如何在 Windows 中執行乾淨啟動》文章 “執行乾淨啟動後如何確定問題原因 ” 章節中提供的方案進行操作,直至排查出問題成因。
上述全部常規修復操作執行完畢後,如果 “藍屏” 異常問題仍然存在,轉到執行步驟六。
步驟六:執行高級修復操作。
在此步驟中,用戶將會直接重新安裝 Windows 系統。用戶應當通過 Microsoft “下載 Windows 10” 網站 (https://www.microsoft.com/zh-cn/software-download/windows10) 下載 “Microsoft 媒體創建工具”,使用此工具執行 “不保留文件與應用” ⑷ 的 “全新安裝 Windows 10” 操作。重新安裝 Windows 系統後,用戶按照日常使用習慣繼續使用 72 小時電腦,確認其是否再次繼續出現 “藍屏” 異常問題。如果 “藍屏” 異常問題仍然存在,轉到執行步驟七。
注 ⑷ :在執行高級修復操作前,用戶須自行備份電腦中的全部個人文件與應用程序數據。如因重新安裝 Windows 系統導致用戶電腦文件出現丟失或損壞,Microsoft 不承擔任何法律責任。
步驟七:排查硬件層面異常。
如果用戶執行到了步驟七,則可以基本認定電腦 “藍屏” 異常問題是由於其中部分硬件出現了異常或故障所導致的,Microsoft 社區不建議用戶自行排查涉及電腦硬件層面的 “藍屏” 異常問題。用戶應當攜帶電腦前往電腦品牌售後服務網點 (品牌機) 或專業的第三方電腦維修網點 (組裝機) 進行完整的硬件檢修,確認具體導致電腦出現 “藍屏” 異常問題的硬件,並對其進行維修或更換。
四、初步分析方案操作指南(第一版)
概述:《初步分析方案操作指南》適用於:對 Microsoft Windows 10 產品充滿興趣的個人與家庭用戶、專業的軟件開發人員、經驗豐富的 Windows 預覽體驗成員、小型企業 IT 管理員和計算機領域相關專業的學生等。《初步分析方案操作指南》中僅包含基本分析方案以供參考,無法有效應對更加專業的異常問題分析場景。
步驟一:通過 Microsoft Store 下載 WinDbg Preview 工具。
如需準確分析電腦 “藍屏” 問題成因,用戶應當首先通過 Windows 10 產品內置的 Microsoft Store 下載 WinDbg Preview 工具。安裝完畢後,用戶應當嘗試啟動工具,確認其能否正常啟動 (如下圖)。如果 Windbg Preview 工具可以正常啟動,轉到執行步驟二。
步驟二:尋找擴展名為 DMP 的 “藍屏” 日誌文件。
在此步驟中,用戶應當啟動 “設置” 菜單,選擇 “系統”>“關於”>“高級系統設置”>“高級” 選項卡>“啟動和故障恢復 – 設置”,複製文本框中類似 “%SystemRoot%\Minidump” 的路徑信息 (如下圖)。接下來,用戶須按下 “Windows 徽標鍵 +R” 快捷鍵啟動 “運行” 窗口,粘貼之前複製的路徑信息,回車後在彈出的文件資源管理器界面中尋找擴展名為 DMP 的文件。如果可以找到,轉到執行步驟三。
如果 “啟動和故障恢復” 界面中的 “將事件寫入系統日誌” 選項尚未開啟,用戶須手動開啟此選項。如果 “寫入調試信息” 選項處於 “(無)” 狀態,用戶須將其調整為 “小內存轉儲 (256 KB)” 並重啟電腦,等待電腦再次出現 “藍屏” 異常問題後重新尋找日誌文件。
步驟三:使用 Windbg Preview 工具打開 “藍屏” 日誌文件 ⑴。
注 ⑴ :Microsoft Windbg Preview 分析工具目前在中國大陸地區無法正常使用,用戶須通過 VPN 技術連接至國際互聯網環境方可恢復正常。上述 “通過 VPN 技術連接至國際互聯網環境 ” 的操作在中國地區可能屬違法行為,用戶須遵守其所在地法律法規與相關政策,如因用戶強行分析電腦 “藍屏 ” 異常問題成因導致違反相關規定,Microsoft 不承擔任何法律責任。
在此步驟中,用戶應當打開 “藍屏” 日誌文件,WinDbg Preview 應用程序將自動啟動。稍等片刻,Windbg Preview 工具完成初始化工作後,屏幕中將會顯示帶有 “!analyze -v” 字樣的提示信息 (如下圖),轉到執行步驟四。
步驟四:開始執行初步分析操作。
在此步驟中,用戶應當點擊提示信息中的藍色 “!analyze -v” 超鏈接按鈕,Windbg Preview 工具將會自動執行分析工作。Windbg Preview 工具的界面背景顏色由白色轉為灰色、並且不再彈出新的提示信息時,代表分析工作已經結束。
首先,用戶應當在提示信息中尋找類似 “DPC_WATCHDOG_VIOLATION (133)” 由大寫英文字母、下劃線、括號和括號內數字組成的停止錯誤代碼 (如下圖黃色位置)。尋找到錯誤代碼後,用戶應當在 Microsoft 文檔《Bug 檢查代碼參考》中尋找此代碼,並瀏覽由 Microsoft 編寫的建議修復方案。如果錯誤代碼為 “WHEA_UNCORRECTABLE_ERROR (124)”,或者建議修復方案中明確指出此代碼是由於硬件出現故障所導致的,則用戶應當按照《通用修復方案操作指南 (第一版)》中 “步驟七:排查硬件層面異常” 章節進行操作。如果建議修復方案中指出此代碼需要執行涉及註冊表、硬盤等位置的修復操作,則用戶應當按照建議執行對應的修復操作。
如果 Microsoft 建議修復方案中指出此代碼是由於電腦驅動程序存在異常所導致的,則用戶應當在提示信息中繼續尋找 “PROCESS_NAME”、“MODULE_NAME” 和 “IMAGE_NAME” 三處位置 (如下圖綠色、紫色、藍色位置,如果某位置無法找到,屬正常現象)。如果三處位置記錄了擴展名為 .exe 或 .sys 的文件名稱,則用戶應當記錄此名稱,並按照《通用修復方案操作指南 (第一版)》中 “步驟三:在 ‘藍屏’ 提示信息中尋找錯誤驅動程序名稱” 章節進行操作,此三處位置顯示的文件名稱即為錯誤驅動程序名稱。
如果用戶在提示信息中無法找到 “PROCESS_NAME”、“MODULE_NAME” 和 “IMAGE_NAME” 三處位置,或者三處位置未記錄到擴展名為 .exe 或 .sys 的文件名稱,則用戶應當從《通用修復方案操作指南 (第一版)》中 “步驟一” 章節開始執行修復操作。
步驟五:按照分析結果執行修復操作。
無論能否得到電腦 “藍屏” 異常問題分析結果,用戶均應當參考《通用修復方案操作指南(第一版)》執行修復操作。但如果情況緊急,或者用戶不便逐一執行通用修復方案,則用戶應當直接通過 Microsoft Community 發帖詢問,專業的 Microsoft 社區工作人員和熱心的社區成員將在第一時間為用戶提供關於 “電腦 ‘藍屏’ 異常問題成因分析” 方面的技術支持。
五、總結
包含了《通用修復方案操作指南 (第一版)》和《初步分析方案操作指南 (第一版)》的《當電腦出現 “藍屏” 異常問題時,應當如何處理》文章的發布,將有效的解決中國 Microsoft 社區 “電腦 ‘藍屏’ 問題相關技術文章過於零散” 與 “電腦 ‘藍屏’ 問題處理效率偏低” 兩大問題,讓每一位 Windows 10 產品用戶都能輕鬆修複電腦 “藍屏” 異常問題,讓每一位 Microsoft 產品技術支持工作者都能具備初步的電腦 “藍屏” 異常問題分析能力。中國 Microsoft 社區將繼續堅定不移的貫徹落實 “將 ‘客戶至上’ 的服務理念做到極致” 改革創新總路徑,我們的最終目的是:讓每一位 Microsoft 產品和服務的客戶均可享受到最完美的客戶服務。
六、參考文獻
[1], Microsoft, Troubleshoot screen errorsblue, 2020
[2], Microsoft, Blue Screen Data, 2020.3
[3], Microsoft, Advanced troubleshooting for Stop error or blue screen error issue, 2020.10
[4], Microsoft, Bug Check Code Reference, 2020.4
[5], Rex Liu (Microsoft Agent), 《關於 Windows 藍屏問題匯總》, 2018.2
[6], Ling Gao (Microsoft Insider),《為確保將 “客戶至上” 的服務理念做到極致,Microsoft 社區全體成員仍需做出不懈努力》, 2020.11
對於 Windows 預覽體驗成員們來說,如果大家的電腦在某次安裝預覽體驗版本更新後突發 “藍屏” 異常問題,則問題有較大的可能性是由於 Windows 預覽體驗版本自身存在 Bug 所導致的,請大家不必擔心。
Windows 預覽體驗版本是 Microsoft 面向產品愛好者開放體驗的 “外部測試” 版本,其相比於正式版本 Windows 產品而言,其中可能存在着大量的惡性 Bug。請預覽體驗成員們在發現產品 Bug 時及時向 Microsoft 提交反饋,請在編寫反饋時參照由我撰寫的《當發現 Windows 問題時,該如何處理》技術文章。
— Ling Gao 2021/01/08