SMART là gì và cách sử dụng nó để dự đoán lỗi HDD hoặc SSD

Rất nhiều người trong chúng ta đã gặp phải tình trạng hỏng đĩa cứng hoặc SSD. Một số người trong chúng ta thậm chí đã cố gắng tìm hiểu thêm về độ tin cậy của ổ cứng và chức năng dự đoán ẩn(hidden prediction function) của chúng , một phần của công nghệ gọi là SMART . Người ta có thể tranh luận rằng SMART không đáng tin cậy vì nó không dự đoán được thất bại trong mọi trường hợp. Thực tế này đúng một phần, nhưng hoạt động thực tế bên trong của hệ thống tự giám sát này không đơn giản như vậy, vì vậy hãy cùng xem xét cách thức hoạt động của SMART . Chúng tôi cũng sẽ hướng dẫn bạn cách kiểm tra trạng thái SMART của ổ cứng(HDD SMART status) , cũng như trạng thái SMART(SMART status) của ổ cứng thể rắn :

SMART (HDD & SSD) là gì?

SMART là một hệ thống giám sát thông tin bên trong ổ đĩa của bạn. (SMART is a system that monitors the internal information of your drive.)Cái tên thông minh(clever name) của nó thực ra là từ viết tắt của Công nghệ tự giám sát, phân tích và báo cáo(Self-Monitoring, Analysis, and Reporting Technology) . SMART , còn được viết là SMART , là một công nghệ được tìm thấy bên trong ổ cứng HDD và SSD(HDDs and SSDs) . Nó độc lập với hệ điều hành(operating system) , BIOS hoặc phần mềm khác của bạn.

SMART làm được gì cho ổ cứng HDD và SSD(HDDs and SSDs) ?

SMART được phát minh bởi vì máy tính cần một thứ gì đó có thể theo dõi tình trạng sức khỏe(health state) của ổ cứng. Điều đó có nghĩa là, nói một cách dễ hiểu, SMART được cho là có thể cho bạn biết nếu ổ cứng hoặc ổ trạng thái rắn của bạn sắp ngừng hoạt động(SMART should supposedly be able to tell you if your hard drive or solid-state drive is about to stop working) !

Thông tin về tình trạng ổ đĩa được cung cấp bởi SMART

Làm thế nào để SMART làm được điều đó? Bạn có thể bị cám dỗ khi nghĩ rằng SMART có thể đoán một cách kỳ diệu liệu ổ đĩa của bạn có khỏe hay không. 🙂 Tuy nhiên, những gì nó làm là một câu chuyện hoàn toàn khác. SMART theo dõi một loạt các biến(SMART keeps track of a series of variables) có số lượng và kiểu khác nhau giữa các ổ, là các chỉ báo về độ tin cậy của nó(indicators of its reliability) . Nếu bạn muốn có ý tưởng chuyên sâu về tất cả các thuộc tính SMART , vì có khoảng 50 thuộc tính trong số đó ( tỷ lệ lỗi đọc thô, thời gian quay, lỗi không thể sửa được báo cáo, thời gian bật nguồn, (error rate)số chu kỳ(cycle count) tải , v.v.) , hãy truy cập trang web này(visit this webpage) .

Tuy nhiên, hãy biết rằng, ngoài một số nỗ lực đơn lẻ ( Google , Backblaze ), hầu hết các SMART . dữ liệu không có tài liệu. Hệ thống cung cấp rất nhiều dữ liệu nội bộ. Tuy nhiên, có nhiều điểm không nhất quán trong số liệu thống kê vì nhiều nhà sản xuất ổ cứng sử dụng các định nghĩa và phép đo khác nhau. Ví dụ: một số nhà sản xuất lưu trữ dữ liệu về thời gian bật nguồn dưới dạng giờ, trong khi những nhà sản xuất khác đo nó bằng phút hoặc giây. Ngoài ra, họ không giải thích thuộc tính hoặc biến nào đáng để chúng ta chú ý, khiến chúng ta chìm đắm trong dữ liệu.

Trước khi cố gắng tìm hiểu các thuộc tính SMART nào có liên quan, trước tiên chúng ta phải phân biệt giữa các loại lỗi chính của SSD và HDD: có thể dự đoán được và không thể đoán trước được(SSD and HDD failures: predictable and non-predictable) .

Thông tin chi tiết SMART cho ổ đĩa thể rắn

Các sự cố có thể dự đoán trước(Predictable failures) bao gồm các sự cố xuất hiện kịp thời và do cơ học đĩa bị lỗi hoặc do bề mặt đĩa bị hư hỏng trong trường hợp đĩa cứng. Đối với ổ đĩa thể rắn, những hư hỏng có thể dự đoán được có thể bao gồm hao mòn bình thường theo thời gian hoặc một số lần tẩy xóa cao nhưng không thành công. Các vấn đề(Problems) trở nên tồi tệ hơn theo thời gian và ổ đĩa cuối cùng bị lỗi.

Những hỏng hóc không thể đoán trước(Non-predictable failures) được gây ra bởi các sự kiện đột ngột, trong đó chúng ta có thể đề cập đến, ví dụ, nguồn điện đột ngột tăng đột ngột hoặc hư hỏng bất ngờ đối với mạch bên trong đĩa cứng hoặc ổ đĩa thể rắn. Điều quan trọng cần hiểu là SMART chỉ có thể giúp bạn phát hiện những hỏng hóc có thể đoán trước được(S.M.A.R.T. can only help you detect predictable failures) .

Bây giờ bạn đã hiểu cơ bản về SMART là gì và hoạt động, hãy xem cách kiểm tra trạng thái SMART(SMART status) của ổ đĩa của bạn từ Windows và sau đó cũng là cách đọc và diễn giải chi tiết SMART :

Cách kiểm tra trạng thái SSD và HDD SMART(SSD and HDD SMART status)

Trên máy tính và thiết bị Windows , cách dễ nhất để đọc dữ liệu SMART từ đĩa cứng hoặc từ SSD là sử dụng các ứng dụng chuyên dụng. Có khá nhiều ở đó, nhưng nhiều trong số chúng phát triển kém hoặc tốn kém tiền bạc(cost money) . Trong số tất cả các ứng dụng có thể đọc dữ liệu SMART , ứng dụng tốt nhất và ứng dụng mà chúng tôi khuyên bạn nên sử dụng là CrystalDiskInfo . Nó miễn phí, có thể đọc các thuộc tính SMART và nó cũng là một trong số ít các ứng dụng như vậy có thể lấy dữ liệu SMART cả từ IDE ( PATA ), SATANVMecũng như từ các ổ di động đang sử dụng e SATA , USB hoặc IEEE 1394 .

CrystalDiskInfo hiển thị thông tin chi tiết về ổ đĩa sử dụng SMART

Một phương pháp tuyệt vời khác để kiểm tra trạng thái SMART và thông tin chi tiết(SMART status and details) của ổ cứng HDD hoặc SSD(HDD or SSD) là sử dụng các ứng dụng do nhà sản xuất cung cấp. Ví dụ: hầu hết các ổ đĩa thể rắn đều đi kèm với các ứng dụng hỗ trợ(support apps) cho phép bạn kiểm tra thông tin về chúng, kiểm tra tình trạng của chúng, chạy chẩn đoán, v.v. Các ứng dụng này thường bao gồm các tùy chọn để kiểm tra trạng thái SMART(SMART status) .

Các nhà sản xuất Drive cung cấp các ứng dụng có thể đọc thông tin SMART

Cách thứ ba để kiểm tra trạng thái SMART(SMART status) của ổ đĩa cứng hoặc SSD(disk drive or SSD) được Windows 10 cung cấp . Nó không hiển thị chi tiết, nhưng có thể cho bạn biết trạng thái SMART(SMART status) của ổ đĩa của bạn có ổn hay không. Để kiểm tra SMART , hãy mở Command Prompt và chạy lệnh này: wmic diskdrive get model, status . Lệnh xuất ra danh sách các ổ được kết nối với PC của bạn và hiển thị trạng thái SMART(SMART status) cho từng ổ.

Windows 10 cho phép bạn kiểm tra trạng thái SMART của ổ đĩa

Phương pháp cuối cùng này để kiểm tra trạng thái SMART(SMART status) có lẽ là cách nhanh nhất trong Windows 10 để kiểm tra xem ổ đĩa của bạn có bị lỗi hay không.

Cách chạy kiểm tra SSD hoặc HDD SMART

Nếu bạn không hài lòng với việc chỉ đọc trạng thái SMART(SMART status) của ổ đĩa, bạn cũng có thể chạy kiểm tra SSD hoặc HDD SMART(SSD or HDD SMART test) . Nói thì dễ hơn làm vì bạn cần một ứng dụng chuyên biệt cho mục đích này. Theo đó, chúng tôi cho rằng đây là một chủ đề xứng đáng với một bài viết riêng, bạn có thể truy cập thông qua liên kết này: Kiểm tra ổ cứng HDD hoặc SSD(HDD or SSD) và kiểm tra tình trạng sức khỏe(health status) của nó .

Cách đọc các giá trị và thuộc tính SMART

Tình trạng sức khỏe(health status) của đĩa cứng liên tục được kiểm tra và theo dõi bằng nhiều cảm biến. Các giá trị được đo bằng cách sử dụng các thuật toán điển hình, và sau đó các thuộc tính tương ứng được tinh chỉnh theo kết quả.

Trong bất kỳ chương trình giám sát(monitoring program) SMART nào , bạn sẽ thấy các thuộc tính chứa ít nhất một số trường sau:

  • Định danh:(Identifier:) định nghĩa của thuộc tính. Nó thường có nghĩa chuẩn và được đánh dấu bằng một số từ 1 đến 250 (ví dụ: 9 là Đếm bật nguồn(Power-on Count) ). Tuy nhiên, tất cả các công cụ kiểm tra và giám sát đĩa(disk monitoring and testing tools) đều cung cấp tên và mô tả bằng văn bản của thuộc tính.
  • Threshold: giá trị nhỏ nhất cho thuộc tính. Nếu đạt đến giá trị này, thì ổ của bạn sắp bị lỗi.
  • Giá trị:(Value:) giá trị hiện tại của thuộc tính. Thuật toán tính toán con số này dựa trên dữ liệu thô. Một ổ cứng mới phải có số cao, mức tối đa theo lý thuyết (100, 200 hoặc 253 tùy thuộc vào nhà sản xuất), sẽ giảm trong thời gian tồn tại của nó.
  • Tệ nhất:(Worst:) giá trị nhỏ nhất của thuộc tính từng được ghi lại.
  • Dữ liệu:(Data:) các giá trị đo thô được cung cấp bởi cảm biến hoặc bộ đếm. Đây là dữ liệu được sử dụng bởi thuật toán do nhà sản xuất ổ cứng HDD hoặc SSD(HDD or SSD) thiết kế . Nội dung của nó phụ thuộc vào thuộc tính và nhà sản xuất ổ đĩa. Người dùng thông thường nên bỏ qua phần này.
  • Cờ:(Flags:) mục đích của thuộc tính. Điều này thường được thiết lập bởi nhà sản xuất và do đó thay đổi tùy theo(manufacturer and therefore varies) ổ đĩa. Mỗi thuộc tính đều quan trọng và có thể dự đoán sự cố sắp xảy ra (ví dụ: số lượng khu vực được phân bổ lại ID 5 ) hoặc thống kê không có ảnh hưởng trực tiếp đến trạng thái (ví dụ: số lượng mất điện(power loss count) không mong muốn của ID 174(ID 174) ).

Các thuộc tính SMART được mô tả bằng dữ liệu như ID của chúng, giá trị hiện tại, giá trị kém nhất và ngưỡng

Khi cố gắng hiểu trạng thái của bất kỳ thuộc tính SMART nào, hãy kiểm tra giá trị của ba trường sau: giá trị, ngưỡng và cờ(to understand the status of any S.M.A.R.T. attribute, check the values of these three fields: value, threshold, and flags) . Ngoài ra, hãy nhớ rằng, thông thường, các giá trị nhỏ hơn là một dấu hiệu của việc giảm độ tin cậy(smaller values are an indication of a decrease in reliability) .

Cách sử dụng SMART để dự đoán lỗi của ổ cứng HDD hoặc SSD(HDD or SSD) (các giá trị cần thiết để kiểm tra)

Không phải tất cả đều THÔNG MINH(S.M.A.R.T) . các thuộc tính rất quan trọng đối với dự đoán thất bại(failure prediction) . Hai nghiên cứu được đề cập ở trên về tỷ lệ lỗi ổ cứng(drive failure) và các nguồn khác đồng ý rằng một trợ giúp quan trọng trong việc xác định ổ đĩa bị lỗi là:

  • Số lượng khu vực được phân bổ lại(Reallocated sector counts) . Việc phân bổ lại xảy ra khi logic của ổ đĩa hoán đổi lại một khu vực bị hỏng, do lỗi mềm hoặc lỗi tái diễn, thành một khu vực vật lý mới từ các khu vực dự phòng của nó. Thuộc tính này phản ánh số lần ánh xạ lại đã xảy ra. Nếu giá trị của nó tăng lên, đó là dấu hiệu của ổ cứng HDD hoặc SSD.

  • Số lượng khu vực đang chờ xử lý hiện tại(Current Pending Sector Count) . Điều này tính các sector "không ổn định", có nghĩa là các sector bị hỏng với lỗi đọc đang chờ ánh xạ lại, một loại hệ thống "quản chế". Các thuật toán SMART có nhiều cách hiểu khác nhau về thuộc tính cụ thể này, vì nó đôi khi không thuyết phục. Tuy nhiên, nó có thể đưa ra cảnh báo sớm hơn về các sự cố có thể xảy ra.

  • Đã báo cáo các lỗi không thể sửa chữa(Reported Uncorrectable Errors) . Đó là số lượng lỗi không thể khôi phục, và nó rất hữu ích vì nó dường như có cùng ý nghĩa đối với tất cả các nhà sản xuất.

  • Xóa số lỗi(Erase Fail Count) . Đây là một chỉ số tuyệt vời cho thấy ổ đĩa thể rắn chết sớm. Nó đếm số lần xóa dữ liệu không thành công và một giá trị tăng lên cho bạn biết rằng bộ nhớ flash bên trong SSD sắp hết tuổi thọ.

  • Đếm san lấp mặt bằng(Wear Leveling Count) . Điều này cũng đặc biệt hữu ích cho SSD. Các nhà sản xuất đặt tuổi thọ dự kiến ​​của SSD trong dữ liệu SMART của nó. Đếm mức mài mòn(Wear Leveling Count) là một ước tính về tình trạng của ổ đĩa của bạn. Nó được tính toán bằng cách sử dụng một thuật toán có tính đến thời gian tồn tại dự kiến ​​được xác định trước và số chu kỳ (ghi, xóa, v.v.) mà mỗi khối flash bộ nhớ có thể thực hiện trước khi hết tuổi thọ của nó.

  • Nhiệt độ đĩa(Disk temperature) là một thông số còn nhiều tranh cãi. Tuy nhiên, người ta vẫn coi rằng các giá trị trên 60 ° C có thể làm giảm tuổi thọ của ổ cứng HDD hoặc SSD và tăng khả năng hư hỏng. Chúng tôi khuyên bạn nên sử dụng quạt để giảm nhiệt độ của ổ đĩa và hy vọng kéo dài tuổi thọ của chúng.

Giá trị SMART cao hơn ngưỡng có thể chỉ ra các lỗi ổ đĩa tiềm ẩn trong tương lai

SMART đã đề cập ở trên . các thuộc tính tương đối dễ giải thích. Nếu bạn nhận thấy giá trị của chúng tăng lên, có thể ổ đĩa của bạn đang bị lỗi, vì vậy tốt hơn bạn nên bắt đầu sao lưu. Tuy nhiên, mặc dù đây là những chỉ số hữu ích về độ tin cậy của ổ đĩa, nhưng đừng quên rằng chúng không phải là điều dễ hiểu.

Ghi chú lịch sử về SMART

SMART được phát triển bắt đầu từ năm 1992(year 1992) , mặc dù bây giờ bạn biết rằng nó được bao gồm trong tất cả các ổ đĩa thể rắn và ổ đĩa cứng hiện đại. Lịch sử của nó bao gồm một loạt các tên như Phân tích thất bại dự đoán hoặc IntelliSafe(Predictive Failure Analysis or IntelliSafe) và đầu vào từ tất cả các nhà sản xuất đĩa cứng lớn: IBM , Seagate , Quantum , Western Digital . Cuối cùng, tài liệu của nó đã được giới thiệu lần đầu tiên vào năm 2004 trong tiêu chuẩn ATA Song song(Parallel ATA) và nhận được các bản sửa đổi thường xuyên sau đó. Bản mới nhất được phát hành vào năm 2011.

Có điều gì khác bạn muốn biết về SSD và HDD SMART(SSD and HDD SMART) không?

Đây là nghiên cứu ngắn của chúng tôi về hoạt động bên trong của SMART và khả năng giám sát, kiểm tra và dự đoán các lỗi đĩa cứng. Quan điểm chính mà bạn nên nhớ là hệ thống tự giám sát này có thể giúp bạn xem xét tình trạng sức khỏe(health status) của ổ cứng(HDD) . Nếu bạn muốn sử dụng dữ liệu SMART(S.M.A.R.T data) này để xem liệu ổ đĩa của riêng bạn có gặp sự cố hay không, hãy đọc các bài viết mà chúng tôi đề xuất trong hướng dẫn này. Ngoài ra, nếu có câu hỏi, hãy sử dụng biểu mẫu nhận xét bên dưới, và chúng ta hãy thảo luận.



About the author

Tôi là Chuyên gia Windows và đã làm việc trong ngành phần mềm hơn 10 năm. Tôi có kinh nghiệm với cả hệ thống Microsoft Windows và Apple Macintosh. Các kỹ năng của tôi bao gồm: quản lý cửa sổ, phần cứng máy tính và âm thanh, phát triển ứng dụng, v.v. Tôi là một nhà tư vấn giàu kinh nghiệm có thể giúp bạn khai thác tối đa hệ thống Windows của mình.



Related posts