2017/5/25 更新

收到支援工程師主管來電,可以提供免費升級 RT-AC66U 但必須回收 RT-AC1200G+,我選擇專注在解決問題上,謝絕他的好意。沒有了 RT-AC1200G+,就無法進一步測試,重現當機。我請該工程師將我的聯絡方式轉交 RD,如果需要擷取更多資料,例如封包,請聯繫我。

在這個當機事件中,我有機會學習到更多網路知識、建立能具體描述問題的表單,後者可以協助其他人縮限問題,應付難纏的隨機當機,與原廠一起合作解決問題。

新的一章開始

首先,我將機器韌體升級,按下 Reset 重置,僅做了最少的設定。最重大的差別在於停用 USB Tethering,改串連 RT-AC51U 的 LAN 到 RT-AC1200G+ 的 WAN,簡化網路環境。

接著我將 NAS 網路線從 RT-AC51U 拔下,插入 RT-AC1200G+ 的 LAN 孔,按下開機後,RT-AC51U 重啟了!這真是太不可思議了!他從來沒有重啟,最近我只有在 2017/5 因為安全更新升級韌體,這是我首次遇到他的當機。

我重複上述步驟五次,但是都無法重現 RT-AC51U 的當機。

詳細內容:Asus RT-AC1200G+ Random Reboots Automatically

I am currently self-employee providing CRM Consulting service and developing software applications. Welcome to check my blog @ Amigo's Technical Notes


共 12 則回應

1 樓 · Amigo · 發表於 2017-05-27 21:16 · 檢舉

2017/5/26 更新

我搜尋許多相關資料,RMerlin 指出,核心崩潰無法看到 syslog.log,必須使用 serial 與軟體追蹤,因此,無須花時間在挖出更多 Log

為了在 RT-AC1200G+ 當機的時候也可以擷取畫面,我修改網路架構:

為了測試大家建議的散熱,使用 10" 循環扇直吹分享器,結果一樣不穩定,確定排除溫度因素。

在 2017/5/26 11:19 ~ 21PM 發生 5GHz 網路不穩定的燈號錄影,擷取到華碩 RD 要求的燈號影片:

影片在 YouTube 平台

在提供華碩 RD 這些資料後,我有兩個觀點:

1. 華碩 RD 不知道當機無法從 syslog.log 看出,可能不熟悉作業系統運作原理,不瞭解什麼是 Protection ring,在 Inside Windows NT 與完整說明。

2. 華碩 RD 可以判讀我們不知道的燈號閃爍,或許類似摩爾密碼,這部分沒有公開資訊,不知道是否有通訊兵可以判讀呢?

詳細說明與紀錄請參考:Asus RT-AC1200G+ Random Reboots Automatically

學習如何架設監控系統請參考 Setup a Surveillance System to Proof Crash of Asus RT-AC1200G+


2 樓 · Amigo · 發表於 2017-06-02 01:17 · 檢舉

Hi,

這幾天機器發生很多狀況,無法同時寫文章與翻譯在社團分享,簡述這幾天的事件,詳細的圖片、文字、影片、Log 請先閱讀 Asus RT-AC1200G+ Random Reboots Automatically,我會儘速補上翻譯分享。

2017/6/1, Upgrade to RT-AC1200G+_9.0.0.4_382_10680-gc72d1c8.trx,註解有下載連結,確定無線網路驅動程式有改版

2017/5/31, 5GHz Unstable, Reboot,有擷取影片並上傳

2017/5/30, 壓力測試, 5GHz 壅塞, 無線網絡技術

2017/5/29, Reboot, Identify Crash Time with Another Router,抓到精確的當機重啓時間。

2017/5/28, Upgrade to Un-official RT-AC1200G+_9.0.0.4_380_7415-gc949b277fca.trx,別試了,沒有用

2017/5/26, Research on syslog.log, Change Network Map, Testing Cooling System, and an Unstable 5GHz Issue. 不是散熱問題

Have a nice day!


3 樓 · Amigo · 發表於 2017-06-02 22:44 · 檢舉

2017/5/28

認定修改設定、加強散熱效率、觀察 syslog.log、更換機器與電源供應器對提高穩定性沒有幫助,我決定升級韌體到非官方網站下載的版本 RT-AC1200G+_9.0.0.4_380_7415-gc949b277fca.trx,同時學習如何利用序列埠與 RT-AC1200G+ 溝通。

建議遇到不定期重新開機的網友可以先走送修更換流程,看可否更換其他機型。本機型 2017/5/28 目前還沒有解決方案。

在升級韌體前,我利用 dmesg 與 nvram show 指令保存目前版本的資訊,好比較兩者差異。詳細比較請參考 On 2017/5/28, Upgrade to Un-official RT-AC1200G+_9.0.0.4_380_7415-gc949b277fca.trx 的 Difference 小節。

關心重點:Linux 版本與無線網路晶片組的驅動程式版本,在升級前後相同。

升級後我調整一些設定,僅啟用 5GHz 無線網路、僅支援 802.11n 與 40MHz 頻寬、關閉 ssh daemon、自訂密碼加密、加入 MAC 限制、指定 LAN IP 等等。

詳細內容:Asus RT-AC1200G+ Random Reboots Automatically


4 樓 · Amigo · 發表於 2017-06-03 11:19 · 檢舉

2017/5/29

利用串接的 RT-AC51u,根據 syslog.log 的 Link Status Changed,精確抓到 RT-AC1200G+ 重啓的時間點,很遺憾沒有錄影

2017/5/30

利用一連串的檔案複製執行 8 小時的壓力測試,無線網路晶片與 GbE 都很穩定。

過程中有出現使用 RT-AC51u 5GHz 的裝置網路速度緩慢,判斷是 Radio Jamming,修改 channel 後恢復正常。

最重要的是今天學習到許多 kernel panic, 無線技術的知識,我認為下面的文章值得閱讀:

1. Linux Shtuff: Troubleshoot Linux Kernel Panics – 說明 kernel panics 與如何追蹤

2. StackOverflow: Generate kernel oops or crash in the code – 觸發 kernel panic 的程式碼

3. Unix & Linux: What’s the difference between a kernel oops and a kernel panic? – 比重開機更精確的敘述 RT-AC1200G+ 的狀況的字彙

4. Embedded System Blog: Debugging Analysis of Kernel panics and Kernel oopses using System Map: – 如何一步一步除錯 kernel panic 與 soft panic

5. StackOverflow: Kernel panic error in ARM board – 看來創客會比桌上型使用者更常遇到 kernel panic

6. StackOverflow: Arguments to ARM Linux’s arm_pm_restart() – 從本文提及的函數開始閱讀相關 linux kernel 原始碼

7. free electrons: /arch/arm/kernel/reboot.c – source code for static void __soft_restart(void *addr)

8. free electrons: /kernel/reboot.c – source code for void do_kernel_restart(char *cmd) and void migrate_to_reboot_cpu(void)

9. O’Reilly: Learning Debian GNU/Linux: 7.4 Viewing System Messages and Logs – 學習 dmesg 與 /var/log/message.

10. My Cyber Universe: Full controlling the ASUS router via command line – 學習 Asuswrt 的命令列指令

11. Cisco: Meraki: Channel Planning Best Practices – 學習基本的無線網路字彙與觀念

12. Extreme Networks: How to create a 5GHz WiFi Channel Plan – 如何設計 5GHz 建置環境,與相關的注意事項

13. Networking Computing: Dynamic Frequency Selection Part 3: The Channel Dilemma – 我很愛 802.11ac channel allocation 的圖片說明

14. 電腦王:無線路由器怎麼設定?拆機器、教術語,基本功一次搞懂 – 學習基本的無線網路字彙與觀念

15. 聊Wi-Fi – 學習進階的無線網路字彙、觀念、與建置設計

16. 無線網路新趨勢–漫談 802.11ac 新協定 by 臺灣大學計算機及資訊網路中心游子興 – 學習頻寬、spatial streams、MU-MIMO、beam forming、256-QAM modulation

請自行搜尋文章標題,或者在 Asus RT-AC1200G+ Random Reboots Automatically 直接跳到 2017/5/30,點選閱讀。

I am currently self-employee providing CRM Consulting service and developing software applications. Welcome to check my blog @ Amigo's Technical Notes


5 樓 · Amigo · 發表於 2017-06-03 16:14 · 檢舉

2017/5/31

5GHz 不穩定,錄影上傳 YouTube:

Asus Wireless Router RT-AC1200G+ 5GHz Unstable between 13:26 to 34 on 2017/5/31

Asus RT-AC1200G+ Random Reboots Automatically 另有 Android WiFi Scanner / Analyzer 與 macOS Sierra 的相關截圖。

當機過程從 00:28 開始,錄影上傳 YouTube:

Asus Wireless Router RT-AC1200G+ Reboots Automatically between 18:41 to 42 on 2017/5/31

I am currently self-employee providing CRM Consulting service and developing software applications. Welcome to check my blog @ Amigo's Technical Notes


6 樓 · Amigo · 發表於 2017-06-03 17:45 · 檢舉

2017/6/1

升級到 Asus 提供的非公開測試版 RT-AC1200G+_9.0.0.4_382_10680-gc72d1c8.trx

最大的差異在於:

1. Broadcom BCM43227 802.11 Wireless Controller 9.10.178.61 (r667680) 升級

2. Broadcom BCM43c8 802.11 Wireless Controller 9.10.178.61 (r667680) 升級

安裝後不要 reset NVRAM,有些網友反應清除後會看不到 2.4GHz 的 SSID。如果清除了,caliban 建議重新開機就可以解決問題。

詳細內容:Asus RT-AC1200G+ Random Reboots Automatically


7 樓 · 飛兒 · 發表於 2017-06-03 18:02 · 檢舉

感謝大大無私地分享


8 樓 · Amigo · 發表於 2017-06-03 18:05 · 檢舉

Hi 飛兒,

接下來就看看這個有升級驅動程式的韌體是否能提高穩定了!:)

Have a nice day!

I am currently self-employee providing CRM Consulting service and developing software applications. Welcome to check my blog @ Amigo's Technical Notes


9 樓 · Amigo · 發表於 2017-06-07 14:26 · 檢舉

Hi,

2017/6/7 更新:修改網路圖,MAC filter list 有顯示問題

自從升級新版本韌體後,已經有 6 天沒有當機重啓,升級韌體的國外網友也沒有回報當機重啓問題。因此我決定做進一步測試,移除 RT-AC51u,將 RT-AC1200G+ 作為唯一的無線網路分享器。

在設定過程中,我發現 MAC filter list 有顯示問題:

當你新增加一個裝置,即使同時修改名稱與更換圖示,按下兩次確認,依然顯示預設圖文。當裝置連線後,有時候圖文會依據你的設定顯示,有時候是會強制顯示為另一種不同於預設的圖文。這在之前的韌體版本並不曾經發生過。

詳細說明請參考:Asus RT-AC1200G+ Random Reboots Automatically

在接下來三週,我會繼續觀察與測試看看是否有任何問題,尤其是當機重啓。

Have a nice day!


10 樓 · Amigo · 發表於 2017-06-16 14:16 · 檢舉

Hi,

自從升級到 RT-AC1200G+_9.0.0.4_382_10680- gc72d1c8.trx 已經有 15 天沒有當機問題,目前還有下列的小問題:

1. caliban 回報有一次 20 秒的無線網路斷線,但有自動重新連上
2. 可用無線 channels 不符合歐盟規範
3. 升級後需要 NVRAM reset,否則可能會看不見 2.4GHz SSID

我會繼續觀察兩週,看看是否有其他問題。

Asus RT-AC1200G+ Random Reboots AutomaticallyRT-AC1200G+ with RT-AC1200G+_9.0.0.4_382_10680-gc72d1c8.trx Stability Tracking 小節有持續更新網友升級韌體後的穩定性。

目前該韌體依然無法自官網產品支援頁面下載。