監視器網芳傳檔案,CPU會突然爆高 - Linux

By Steve
at 2020-08-08T00:26
at 2020-08-08T00:26
Table of Contents
: → LIAR: 如果硬碟沒問題,還會有甚麼因素會卡在I/O呢? 08/07 08:26
: → LIAR: 我報告一下實際的狀況,整台電腦運作真的都會頓頓的,SMB 08/07 08:27
: → LIAR: 關掉就會恢復正常。 08/07 08:27
: → bitlife: 你說5月前正常,是否5月前才開始用smb? 存檔影片是只有即 08/07 09:04
: → bitlife: 時影像還是包含(你文中提到的)歷史錄影檔案轉移?單個攝影 08/07 09:06
: → bitlife: 機每秒流量? 網路是100M還是1G? 硬碟是HDD還是SDD? 要各 08/07 09:07
: → bitlife: 種因素一起看才比較好推測. 忘了還有同時多少攝影機(總秒 08/07 09:07
: → bitlife: 流量) 08/07 09:07
: 推 bitlife: 5月之後才開始用smb 08/07 09:09
: 推 bitlife: SSD 08/07 09:13
我整理一下這幾個月的紀錄,有點長,不好意思。
伺服器接收9台監視器資料,監視器檔案先錄到自己的記憶卡,再上傳到伺服器,
所以應該不算即時的,但是每分鐘每台都會有一個4~8MB大的新檔案被上傳。
硬碟是傳統硬碟,伺服器是筆電裝CentOS,伺服器和另外兩台監視器連接的AP一起
接在P880下面,網路是100Mbit的。
平均一天會有75GB檔案產生,也就是理論上每分鐘平均會接收53.3MB大小的檔案。
按照時間軸,伺服器有幾個重大事件:
4月samba啟用接收檔案 + rclone自動上傳到Gsuite,自動運作正常。
5月都正常。
6月18日換硬碟500GB→2T,用clonezilla轉移後xfs_growfs放大,沒發現異常。
6月21日中發現有error log,當時無法解讀也忘記紀錄,用yum update後,grub
多出一個CentOS Linux 7 Rescue f8b625c751034e15b45eb19be9e13e06的開機選項
6月22日開始有CPU過載的問題。
硬碟買來前有先整個scan過,因為時間點接近,我一開始有看smart或hdparm稍微
判斷一下,沒有明顯異狀。
7月之後才安裝mcelog,/var/log/message裡面抓到一段
log:
Hardware event. This is not a software error.
MCE 0
CPU 0 BANK 5
MISC 138a0000086 ADDR fef873c0
TIME 1593684184 Thu Jul 2 18:03:04 2020
MCG status:
MCi status:
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: corrected filtering (some unreported errors in same region)
Generic CACHE Level-2 Generic Error
STATUS ae0000000040110a MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0
MICROCODE 26
CPUID Vendor Intel Family 6 Model 69
Hardware event. This is not a software error.
MCE 1
CPU 0 BANK 6
MISC 238a0000086 ADDR fef87380
TIME 1593684184 Thu Jul 2 18:03:04 2020
MCG status:
MCi status:
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: corrected filtering (some unreported errors in same region)
Generic CACHE Level-2 Generic Error
STATUS ae0000000040110a MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0
MICROCODE 26
CPUID Vendor Intel Family 6 Model 69
印象中每次開機都有,但之後運作除了監視器傳輸出問題,其他都正常。
雖然log表示有硬體問題,但無法交叉測試,加上我用其他電腦直接網芳傳大檔案進去,
每秒也都有正常的幾MB,只有監視器上傳檔案會延遲,所以這個error只能先擱置。
不過懷疑過CPU有問題,想說雙核心,嘗試用下面方式分別停掉一個核心
/sys/devices/system/cpu/cpu0/online
/sys/devices/system/cpu/cpu1/online
結果只會讓CPU負載情況惡化。
因為公司因素,我沒法說直接要一台新電腦取代,只能先嘗試修過或是分析出
確定因素才能報修,所以目前我就卡在這邊了。請問這個問題和硬體有關嗎?
--
起初,他們追殺共產主義者,我沒有說話,因為我不是共產主義者;
接著,他們追殺猶太人,我沒有說話,因為我不是猶太人;
後來,他們追殺工會成員,我沒有說話,因為我不是工會成員;
此後,他們追殺天主教徒,我沒有說話,因為我是新教教徒;
最後,他們奔我而來,卻再也沒有人站起來為我說話了。
《First They Came(他們首次來時)》,Martin Niemoller牧師(1892-1984)
--
: → LIAR: 我報告一下實際的狀況,整台電腦運作真的都會頓頓的,SMB 08/07 08:27
: → LIAR: 關掉就會恢復正常。 08/07 08:27
: → bitlife: 你說5月前正常,是否5月前才開始用smb? 存檔影片是只有即 08/07 09:04
: → bitlife: 時影像還是包含(你文中提到的)歷史錄影檔案轉移?單個攝影 08/07 09:06
: → bitlife: 機每秒流量? 網路是100M還是1G? 硬碟是HDD還是SDD? 要各 08/07 09:07
: → bitlife: 種因素一起看才比較好推測. 忘了還有同時多少攝影機(總秒 08/07 09:07
: → bitlife: 流量) 08/07 09:07
: 推 bitlife: 5月之後才開始用smb 08/07 09:09
: 推 bitlife: SSD 08/07 09:13
我整理一下這幾個月的紀錄,有點長,不好意思。
伺服器接收9台監視器資料,監視器檔案先錄到自己的記憶卡,再上傳到伺服器,
所以應該不算即時的,但是每分鐘每台都會有一個4~8MB大的新檔案被上傳。
硬碟是傳統硬碟,伺服器是筆電裝CentOS,伺服器和另外兩台監視器連接的AP一起
接在P880下面,網路是100Mbit的。
平均一天會有75GB檔案產生,也就是理論上每分鐘平均會接收53.3MB大小的檔案。
按照時間軸,伺服器有幾個重大事件:
4月samba啟用接收檔案 + rclone自動上傳到Gsuite,自動運作正常。
5月都正常。
6月18日換硬碟500GB→2T,用clonezilla轉移後xfs_growfs放大,沒發現異常。
6月21日中發現有error log,當時無法解讀也忘記紀錄,用yum update後,grub
多出一個CentOS Linux 7 Rescue f8b625c751034e15b45eb19be9e13e06的開機選項
6月22日開始有CPU過載的問題。
硬碟買來前有先整個scan過,因為時間點接近,我一開始有看smart或hdparm稍微
判斷一下,沒有明顯異狀。
7月之後才安裝mcelog,/var/log/message裡面抓到一段
log:
Hardware event. This is not a software error.
MCE 0
CPU 0 BANK 5
MISC 138a0000086 ADDR fef873c0
TIME 1593684184 Thu Jul 2 18:03:04 2020
MCG status:
MCi status:
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: corrected filtering (some unreported errors in same region)
Generic CACHE Level-2 Generic Error
STATUS ae0000000040110a MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0
MICROCODE 26
CPUID Vendor Intel Family 6 Model 69
Hardware event. This is not a software error.
MCE 1
CPU 0 BANK 6
MISC 238a0000086 ADDR fef87380
TIME 1593684184 Thu Jul 2 18:03:04 2020
MCG status:
MCi status:
Uncorrected error
MCi_MISC register valid
MCi_ADDR register valid
Processor context corrupt
MCA: corrected filtering (some unreported errors in same region)
Generic CACHE Level-2 Generic Error
STATUS ae0000000040110a MCGSTATUS 0
MCGCAP c07 APICID 0 SOCKETID 0
MICROCODE 26
CPUID Vendor Intel Family 6 Model 69
印象中每次開機都有,但之後運作除了監視器傳輸出問題,其他都正常。
雖然log表示有硬體問題,但無法交叉測試,加上我用其他電腦直接網芳傳大檔案進去,
每秒也都有正常的幾MB,只有監視器上傳檔案會延遲,所以這個error只能先擱置。
不過懷疑過CPU有問題,想說雙核心,嘗試用下面方式分別停掉一個核心
/sys/devices/system/cpu/cpu0/online
/sys/devices/system/cpu/cpu1/online
結果只會讓CPU負載情況惡化。
因為公司因素,我沒法說直接要一台新電腦取代,只能先嘗試修過或是分析出
確定因素才能報修,所以目前我就卡在這邊了。請問這個問題和硬體有關嗎?
--
起初,他們追殺共產主義者,我沒有說話,因為我不是共產主義者;
接著,他們追殺猶太人,我沒有說話,因為我不是猶太人;
後來,他們追殺工會成員,我沒有說話,因為我不是工會成員;
此後,他們追殺天主教徒,我沒有說話,因為我是新教教徒;
最後,他們奔我而來,卻再也沒有人站起來為我說話了。
《First They Came(他們首次來時)》,Martin Niemoller牧師(1892-1984)
--
Tags:
Linux
All Comments

By Faithe
at 2020-08-09T02:03
at 2020-08-09T02:03

By Joe
at 2020-08-13T22:03
at 2020-08-13T22:03

By Blanche
at 2020-08-15T08:45
at 2020-08-15T08:45

By Elvira
at 2020-08-18T15:46
at 2020-08-18T15:46

By Linda
at 2020-08-19T16:59
at 2020-08-19T16:59

By Isla
at 2020-08-20T07:31
at 2020-08-20T07:31

By Hedda
at 2020-08-24T21:48
at 2020-08-24T21:48

By Caitlin
at 2020-08-29T19:20
at 2020-08-29T19:20

By Adele
at 2020-09-02T15:54
at 2020-09-02T15:54

By Anthony
at 2020-09-03T15:53
at 2020-09-03T15:53

By Heather
at 2020-09-07T22:52
at 2020-09-07T22:52

By Jacky
at 2020-09-08T06:48
at 2020-09-08T06:48

By Skylar DavisLinda
at 2020-09-10T06:24
at 2020-09-10T06:24

By Aaliyah
at 2020-09-13T19:52
at 2020-09-13T19:52

By Oliver
at 2020-09-15T07:41
at 2020-09-15T07:41

By Odelette
at 2020-09-16T21:15
at 2020-09-16T21:15

By Freda
at 2020-09-20T15:16
at 2020-09-20T15:16

By Rebecca
at 2020-09-21T00:19
at 2020-09-21T00:19

By Jack
at 2020-09-21T13:47
at 2020-09-21T13:47

By Charlotte
at 2020-09-24T11:21
at 2020-09-24T11:21

By Megan
at 2020-09-25T23:28
at 2020-09-25T23:28

By Jacky
at 2020-09-30T14:45
at 2020-09-30T14:45

By Andrew
at 2020-10-02T09:08
at 2020-10-02T09:08

By Agnes
at 2020-10-04T16:02
at 2020-10-04T16:02

By Yedda
at 2020-10-05T15:17
at 2020-10-05T15:17

By Oliver
at 2020-10-10T13:24
at 2020-10-10T13:24

By Charlie
at 2020-10-13T07:12
at 2020-10-13T07:12

By Olivia
at 2020-10-17T04:56
at 2020-10-17T04:56

By Eartha
at 2020-10-21T03:08
at 2020-10-21T03:08

By Elizabeth
at 2020-10-21T09:26
at 2020-10-21T09:26

By Yedda
at 2020-10-23T21:08
at 2020-10-23T21:08

By Isla
at 2020-10-28T01:41
at 2020-10-28T01:41
Related Posts
CentOS架設SSH server connection time out

By Yuri
at 2020-08-07T11:47
at 2020-08-07T11:47
監視器網芳傳檔案,CPU會突然爆高

By Yedda
at 2020-08-06T22:57
at 2020-08-06T22:57
genymotion裝ARM Translation不成功

By Ina
at 2020-08-05T22:57
at 2020-08-05T22:57
Arch Linux with Ryzen Laptop

By Jake
at 2020-08-04T22:14
at 2020-08-04T22:14
ssh關掉後重開保持同一畫面的工具

By Lydia
at 2020-08-04T16:51
at 2020-08-04T16:51