首頁 系統教程 Linux 詳解CentOS下對SSD健康狀況及壽命的檢測方法

詳解CentOS下對SSD健康狀況及壽命的檢測方法

Jan 08, 2024 pm 01:18 PM
centos ssd壽命 健康判斷

整個網路上只有intel 的SSD 查看硬碟壽命的資料,像我們這種窮人,只能使用的起Crucial 和OCZ 的用戶來講是太不公平了.像我要透過RAID 卡就真沒法子看其它商家的SSD 的壽命了嗎?

研究了一下,所有查看 SSD 的命令,只要要透過 RAID 的,都需要藉助 MegaCli 和 smartCtl 獲得 ssd 盤使用情況.認真研究了一下,目前我使用的

RAID 卡是LSI Logic / Symbios Logic MegaRAID SAS 1078  和 2108 這二種.使用通常的 MegaCli 來查詢:

這個是的下載位址:

Centos5 的 MegaCli

Centos6 的 MegaCli

整個過程分二步,第一步是從過 RAID 卡來取得下面硬碟的資訊.接下來使用 smartCtl 來進行硬碟詳細資訊的顯示.

使用 MegaCli  來取得 RAID 卡下硬碟的資訊:

然後使用下面的命令:

/opt/MegaRAID/MegaCli/MegaCli64 -PDList -aALL

##這樣可以查出 RAID 卡下面的內容.會顯示如下:

Enclosure Device ID: 252

Slot Number: 7

Device Id: 28

Sequence Number: 2

Media Error Count: 0

Other Error Count: 1

Predictive Failure Count: 0

Last Predictive Failure Event Seq Number: 0

PD Type: SATA

Raw Size: 119.242 GB [0xee7​​c2b0 Sectors]

Non Coerced Size: 118.742 GB [0xed7c2b0 Sectors]

Coerced Size: 118.277 GB [0xec8e000 Sectors]

Firmware state: Online, Spun Up

#SAS Address(0): 0x1e394d57aa996b80

Connected Port Number: 7(path0)

Inquiry Data: 0000000011070303A99EC300-CTFDDAC128MAG                 

FDE Capable: Not Capable

FDE Enable: Disable

Secured: Unsecured

Locked: Unlocked

Needs EKM Attention: No

#Foreign State: None

Device Speed: 6.0Gb/s

Link Speed: 1.5Gb/s

Media Type: Solid State Device

注意上面幾個地方,上面會輸出很多這樣的資訊,只有Media Type: Solid State Device .表示這是SSD .其中Device Id: 28 這個需要記下來.這個過一會使用smartctl 查詢時會需要.我們可以看到上面都顯示了硬碟的型號:Inquiry Data: 0000000011070303A99EC300-CTFDDAC128MAG                     這個選項,所以如果你做SSD 的監控警報,直接監控這個參數基本上就行了.

使用 smartctl 來取得 SSD 硬碟的詳細資訊

要注意,不同廠商不同型號磁碟的資訊不同.象intel 的硬碟資訊就不介紹了.下面是查詢所使用的指令.其中-a 是讓顯示所有的資訊出來. -d 是用來設置硬碟的.這時需要注意不同的RAID 卡所使用的介面可能不一樣,所以可能會有小的不相同.

例如 intel 的硬碟,直接使用 -d megaraid,27 就能正常了.但我使用了上面的 raid 卡後,需要指定 sat 這個參數,就變成像下面這樣了:

smartctl -a -d sat megaraid,27 /dev/sdb1 -s on

上面這時的 sat 是指由 SCSI 轉成 ATA 的裝置,可以加象 scsi,ata 之類的參數.

這時,會顯示如下的訊息:

Model Family:     Crucial/Micron RealSSD C300/C400

Device Model:     C300-CTFDDAC128MAG

#SMART Attributes Data Structure revision number: 16

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUEUE

1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always     # 

5 Reallocated_Sector_Ct   0x0033   100   100   000    Pre-fail  Always       - # 

9 Power_On_Hours          0x0032   100   100   000    Old_age   Always     ###12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always    

170 Grown_Failing_Block_Ct  0x0033   100   100   000    故障前隨時       - 

#171 Program_Fail_Count      0x0032   100   100   000    Old_age       # 

172 Erase_Fail_Count        0x0032   100   100   000    Old_age   永遠  #  

173 Wear_Levelling_Count    0x0033   090   090   000    故障前隨時       -  #   故障前總       -  #   

174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   隨時       -  

181 Non4k_Aligned_Access    0x0022   100   100   000    Old_age         

183 SATA_Iface_Downshift    0x0032   100   100   000    Old_age   

184 End-to-End_Error        0x0033   100   100   000   

187 報告的_不正確      0x0032   100   100   000    Old_age   

188 Command_Timeout         0x0032   100   100   000    Old_age   隨時  #  

189 Factory_Bad_Block_Ct    0x000e   100   100   000    Old_age   總是       -   Old_age   

195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age 總是       -       0

196 Realated_Event_Count 0x0032   100   100   000    Old_age   隨時       -     

197 Current_Pending_Sector  0x0032   100   100   000    Old_age   總是       -#   

198 Offline_Un Correctable   0x0030   100   100   000    Old_age   離線      -   

199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age        #    Old_age    #   

202 Perc_Rated_Life_Used    0x0018   090   090   000    Old_age   離線    #  -   Old_age   #   

206 Write_Error_Rate        0x000e   100   100   000    Old_age  

如果是 OCZ 的:

設備型號:     OCZ-AGILITY3

序號:    OCZ-1OX963Q8B5X2V684

SMART 屬性資料結構修訂號:10

具有閾值的供應商特定 SMART 屬性:

ID# ATTRIBUTE_NAME          標誌     值最差門檻類型     已更新 WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate     0x000f   086   086   050    失敗前隨時       -  

5 Realated_Sector_Ct   0x0033   100   100   003    失敗前務必       -   

9 Power_On_Hours          0x0032   100   100   000    Old_age       

12 Power_Cycle_Count       0x0032   100   100   000    Old_age  與總是       -   Old_age  -5      -  

171 Unknown_Attribute       0x0032   000   000   000    Old_age   永遠  # 

172 Unknown_Attribute       0x0032   000   000   000    Old_age   永遠  # 

174 Unknown_Attribute       0x0030   000   000   000    Old_age   離線    

177 Wear_Leveling_Count     0x0000   000   000   000    Old_age    

181 Program_Fail_Cnt_Total  0x0032   000   000   000    Old_age   隨時       -  

182 Erase_Fail_Count_Total  0x0032   000   000   000    Old_age   隨時       -  

187 報告的_不正確      0x0032   100   100   000    Old_age   

194 溫度_攝氏度     0x0022   030   030   000    Old_age   始終       -   Old_age   始終       -   Old_age   始終       -  

195 Hardware_ECC_Recovered 0x001c 120 120 000 Old_age 離線      -       135388659

196 Realated_Event_Count 0x0033   100   100   003    失敗前  隨時       -    # 

201 Soft_Read_Error_Rate    0x001c   120   120   000    Old_age   離線      -  

204 Soft_ECC_Correction     0x001c   120   120   000    Old_age   離線      -  

230 Head_Amplitude          0x0013   100   100   000    預選  

231 溫度_攝氏度     0x0013   100   100   010    失敗前務必       -  #  

233 Media_Wearout_Indicator 0x0000   000   000   000    Old_age  離線      -   

234 Unknown_Attribute       0x0032   000   000   000    Old_age   永遠    

241 Total_LBA_Written      0x0032   000   000   000    Old_age   總是       -   Old_age   總是       -  

242 Total_LBA_Read         0x0032   000   000   000    Old_age  

SSD是否健康的參數分析:

注意這時的使用壽命不在是像intel ssd 的Media_Wearout_Indicator 這個參數(當然OCZ 也有,在Crucial 就變成了Perc_Rated_Life_Used).但其實我們要看SSD 是否健康,主要是要通過Wear Leveling Count(顆粒平均擦寫次數)這個參數和Grown Failling Block Ct這個參數.

注意看下面二行:

170 Grown_Failing_Block_Ct  0x0033   100   100   000    Pre-fail  Always       -    Pre-fail  Always       -  

173 Wear_Levelling_Count    0x0033   090   090   000    Pre-fail  Always       -    Pre-fail  Always       -    Pre-fail  Always  #55555

上面二個參數是關鍵:

Wear Levelling Count(顆粒平均擦寫次數): 先講這個參數.更重要.先聲明這個硬碟是使用了一年的SSD 硬碟.圖中顯示的資料為536,即這塊128G的硬碟的全盤寫入/擦除(P/E)數為536 次,顯示還有90% 的壽命.所以大約這個硬碟使用的閃存顆粒的壽命為5000 多次的樣子.536 約為5000 的10% ,所以此項值為90(CA). Grown Failing Block Count(使用中新增壞塊數): 此項代表SSD 的閃存顆粒在使用時出現的壞塊(類似於HDD的壞道)數量,此處數據為0 即尚未有出現壞塊,若你命不好.新購買回來SSD 在正常使用時,很短的時間內這個數據產生較大變化,那代表盤可能有問題,早點找售後服務吧.

MegaCli常用參數組合介紹:

MegaCli -cfgdsply -aALL | grep “Error”                  【正常都是0】

MegaCli -LDGetProp -Cache -LALL -a0                【已寫出策略】

MegaCli -cfgdsply -aALL   | grep “Memory”          【記憶體大小】

MegaCli -LDInfo -Lall -aALL                        【「已檢視RAID等級】

MegaCli -AdpAllInfo -aALL                          【的資料卡資料資料】

#MegaCli -PDList -aALL                               

MegaCli -AdpBbuCmd -aAll                          【檢視電池的資料】

「檢視電池資訊】」中所檢視

MegaCli -FwTermLog -Dsply -aALL           【檢視RAID卡片日誌】

MegaCli -adpCount                        的

MegaCli -AdpGetTime –aALL               【顯示轉接器時間】

MegaCli -AdpAllInfo -aAll                    【上所使用配備者資訊的顯示所有適配器資訊】

MegaCli -LDInfo -LALL -aAll               以【顯示所有邏輯磁碟組資訊】

MegaCli -PDList -aAll                              

MegaCli -AdpBbuCmd -GetBbuStatus -aALL |grep “Charger Status” 【查看充電狀態】

MegaCli -AdpBbuCmd -GetBbuStatus -aALL                      【顯示BBU狀態資訊】

MegaCli -AdpBbuCmd -GetBbuCapacityInfo -aALL        【顯示BBU容量資訊】

MegaCli -AdpBbuCmd -GetBbuDesignInfo -aALL            【顯示BBU設計參數】

MegaCli -AdpBbuCmd -GetBbuProperties -aALL             【顯示目前BBU屬性】

MegaCli -cfgdsply -aALL                                     【顯示RAID卡型號,RAID設置,DISK相關資訊】

磁帶狀態的變化,從拔盤,到插盤的過程:

Device                    |Normal|Damage|Rebuild|Normal

Virtual Drive       |Optimal|Degraded|Degraded|Optimal

Physical Drive    |Online|Failed –> Unconfigured|Rebuild|Online

以上是詳解CentOS下對SSD健康狀況及壽命的檢測方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

centos配置ip地址 centos配置ip地址 Apr 14, 2025 pm 09:06 PM

CentOS 中配置 IP 地址的步驟:查看當前網絡配置:ip addr編輯網絡配置文件:sudo vi /etc/sysconfig/network-scripts/ifcfg-eth0更改 IP 地址:編輯 IPADDR= 行更改子網掩碼和網關(可選):編輯 NETMASK= 和 GATEWAY= 行重啟網絡服務:sudo systemctl restart network驗證 IP 地址:ip addr

怎樣優化CentOS HDFS配置 怎樣優化CentOS HDFS配置 Apr 14, 2025 pm 07:15 PM

提升CentOS上HDFS性能:全方位優化指南優化CentOS上的HDFS(Hadoop分佈式文件系統)需要綜合考慮硬件、系統配置和網絡設置等多個方面。本文提供一系列優化策略,助您提升HDFS性能。一、硬件升級與選型資源擴容:盡可能增加服務器的CPU、內存和存儲容量。高性能硬件:採用高性能網卡和交換機,提升網絡吞吐量。二、系統配置精調內核參數調整:修改/etc/sysctl.conf文件,優化TCP連接數、文件句柄數和內存管理等內核參數。例如,調整TCP連接狀態和緩衝區大小

HDFS配置CentOS需要修改哪些文件 HDFS配置CentOS需要修改哪些文件 Apr 14, 2025 pm 07:27 PM

在CentOS上配置Hadoop分佈式文件系統(HDFS)時,需要修改以下關鍵配置文件:core-site.xml:fs.defaultFS:指定HDFS的默認文件系統地址,例如hdfs://localhost:9000。 hadoop.tmp.dir:指定Hadoop臨時文件的存儲目錄。 hadoop.proxyuser.root.hosts和hadoop.proxyuser.ro

CentOS Stream 8故障排查方法 CentOS Stream 8故障排查方法 Apr 14, 2025 pm 04:33 PM

CentOSStream8系統故障排查指南本文提供系統化的步驟,幫助您有效排查CentOSStream8系統故障。請按順序嘗試以下方法:1.網絡連接測試:使用ping命令測試網絡連通性(例如:pinggoogle.com)。使用curl命令檢查HTTP請求響應(例如:curlgoogle.com)。使用iplink命令查看網絡接口狀態,確認網絡接口是否正常運行並已連接。 2.IP地址和網關配置驗證:使用ipaddr或ifconfi

CentOS HDFS性能調優技巧 CentOS HDFS性能調優技巧 Apr 14, 2025 pm 06:00 PM

CentOS平台Hadoop分佈式文件系統(HDFS)性能優化指南優化HDFS性能是一個多方面的問題,需要針對具體情況調整多個參數。以下是一些關鍵的優化策略:一、內存管理調整NameNode和DataNode內存配置:根據服務器實際內存大小,合理配置HADOOP_NAMENODE_OPTS和HADOOP_DATANODE_OPTS環境變量,優化內存利用率。啟用大頁內存:對於高內存消耗應用(如HDFS),啟用大頁內存可降低內存頁分配和管理開銷,提升效率。二、磁盤I/O優化使用高速存

CentOS上PyTorch的GPU支持情況如何 CentOS上PyTorch的GPU支持情況如何 Apr 14, 2025 pm 06:48 PM

在CentOS系統上啟用PyTorchGPU加速,需要安裝CUDA、cuDNN以及PyTorch的GPU版本。以下步驟將引導您完成這一過程:CUDA和cuDNN安裝確定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA顯卡支持的CUDA版本。例如,您的MX450顯卡可能支持CUDA11.1或更高版本。下載並安裝CUDAToolkit:訪問NVIDIACUDAToolkit官網,根據您顯卡支持的最高CUDA版本下載並安裝相應的版本。安裝cuDNN庫:前

centos和ubuntu的區別 centos和ubuntu的區別 Apr 14, 2025 pm 09:09 PM

CentOS 和 Ubuntu 的關鍵差異在於:起源(CentOS 源自 Red Hat,面向企業;Ubuntu 源自 Debian,面向個人)、包管理(CentOS 使用 yum,注重穩定;Ubuntu 使用 apt,更新頻率高)、支持週期(CentOS 提供 10 年支持,Ubuntu 提供 5 年 LTS 支持)、社區支持(CentOS 側重穩定,Ubuntu 提供廣泛教程和文檔)、用途(CentOS 偏向服務器,Ubuntu 適用於服務器和桌面),其他差異包括安裝精簡度(CentOS 精

centos關機命令行 centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

See all articles