注    册
密 码 忘记密码
保存密码         取消
注    册
密 码 忘记密码
保存密码         取消

我的日志

寻找硬盘崩溃前的“蛛丝马迹”--S.M.A.R.T属性初探

分类:电脑
2005.1.2 21:51 作者:lk_517 | 评论:0 | 阅读:0

本文出自远望朋友,存储区斑竹--quakegirl,首先在此表示感谢!

S.M.A.R.T,英文全称Self Monitoring Analysis and Reporting Technology,直译为"自我监测、分析与报告技术"。是为了提高硬盘数据的安全性而开发的。它可以使硬盘实时检查自身的状态,通过一定机理及时分析出潜在的问题,报告给系统,有时甚至能给出预计的硬盘故障日期,实际就是一种预警技术。那么,S.M.A.R.T是如何实现这些功能的?这要从硬盘出现故障的起因说起。
一、        故障因素。
硬盘的故障有很多种,但基本可以分为两类:渐进性和偶发性。
1.        渐进性故障:是随着使用时间的推移而缓慢发生的,并且在使用期间会露出一定的蛛丝马迹。比如,硬盘的主轴马达是会逐渐磨损的,但远在彻底损坏之前,盘片运转时的声音肯定会出现异常。此外,磁盘介质的稳定性下降等故障也属于渐进性故障。
2.        偶发性故障:故障是偶然出现的,之前没有任何迹象。比如,电路板芯片烧毁,突发的撞击导致磁头、介质损坏等故障。

对于防止偶发性故障的发生,的确很难,现在比较认可的,就是硬盘读写操作时不要使硬盘受到振动或撞击,即使未通电状态下,也要尽可能避免震动;保证电源的功率以及电压的稳定;避免电路板上的芯片受静电击穿等等。即使做到了这些,有时仍然难以避免偶发性故障,主要原因在于其不可预知性。
相对来讲,渐进性故障因为有"蛛丝马迹"可循,从而具备一定的预知性,可以使重要数据的提前备份成为可能,避免了"灾难性"的后果。怎么预知呢?这就涉及到S.M.A.R.T的工作机理了。我们先来了解一下S.M.A.R.T最重要的几个组成部分。


二、S.M.A.R.T的构成。
S.M.A.R.T状态以表的形式输出结果,表中很直观的体现了S.M.A.R.T的构成。一幅完整的S.M.A.R.T表由以下几项构成。
ATTRIBUTE DESCRIPTION(属性描述)、ID(属性标识码)、THRESHOLD(阈值)、VALUE(属性当前值)、WORST(属性最坏值)、DATA(数据记录)、STATUS(状态)。
1.        ATTRIBUTE DESCRIPTION(属性描述)和ID(属性标识码)
在ATA—3规范中,IBM、昆腾(QUANTUM)等厂商制定了S.M.A.R.T技术标准。标准中定义了和硬盘不同特性相对应的各项属性(ATTRIBUTE)。而硬盘厂商不同,硬盘特性有所差异,所以,属性(ATTRIBUTE)也不尽相同。在定义各项属性的同时,也分别为这些属性赋予了唯一的标识码――ID。ATTRIBUTE DESCRIPTION对应的内容就是这些属性的具体含义。
下面是当前主流硬盘产品的S.M.A.R.T属性(ATTRIBUTE)的标识码以及含义(图1)。需要注意的是,没有任何一种品牌型号的硬盘采用图中所有的属性,基本只是采用其中的若干项而已。

 

2.        THRESHOLD(阈值)、VALUE(属性当前值)和WORST(属性最坏值)
THRESHOLD(阈值):顾名思义,界限值。是硬盘工程师根据硬盘的损坏状况做了大量鉴定、测试、总结的工作之后决定的,有着很高的科学参考价值。阈值具体是多少,依品牌不同而有所差异。
VALUE(属性当前值):是反映硬盘自身各种状况的一种量化的数值,出厂时最高,随着使用损耗而逐渐下降(有时也会上下浮动,但总体趋势是下降)。
当VALUE降低到THRESHOLD之下时,硬盘进入危险状态,同时S.M.A.R.T会凭借BIOS内建的监测指令或者第三方S.M.A.R.T监控程序向系统报告T.E.C.(Threshold Exceeded Condition)错误,这时应该立即着手备份数据。
WORST(属性最坏值):VALUE(属性当前值)曾出现过的最低值(不适用于昆腾、西数和希捷的某些属性)。一般情况下,WORST(属性最坏值)总是小于等于VALUE(属性当前值)。
3.        DATA(数据记录)
DATA(数据记录)对硬盘运行当中监测到的和所有S.M.A.R.T属性(ATTRIBUTE)关联的数据变化所做的记录。任何细微的变化都会在这里留下痕迹。
4.        STATUS(状态)
对属性的定性分析结果,OK为正常。Bad、Warning、Failed或者Pre-Failure则表示有故障。

5.        S.M.A.R.T属性(ATTRIBUTE)的种类。

根据S.M.A.R.T属性(ATTRIBUTE)本身的含义以及对硬盘故障预知的重要性不同,可以分为关键属性(Critical Attributes)和资料属性(Informative  attributes)。
⑴关键属性(Critical Attributes):对硬盘的使用寿命、各机械组件的渐进性故障具有一定的监测作用。
⑵资料属性(Informative  attributes):反馈硬盘的相关运行记录供参考。

怎么区分这两种属性呢?对任一项S.M.A.R.T属性(ATTRIBUTE)来说,阈值(THRESHOLD)不是零的,属于关键属性(Critical Attributes);阈值(THRESHOLD)是零的,则属于资料属性(Informative  attributes)。硬盘在出厂时,同一型号的硬盘S.M.A.R.T属性(ATTRIBUTE)个数是相同的。但是即使同一厂商,不同时期生产的硬盘所采用的属性(ATTRIBUTE)个数和种类都可能有所差别。Everest的状态报告也可以帮助区分这两种属性,"OK:Value is normal"对应的是关键属性(Critical Attributes);"OK:Always passing"对应的则是资料属性(Informative  attributes)。
特别注意:当某一关键属性(Critical Attributes)的属性值(VALUE)低于相对应的阈值(THRESHOLD)时,硬盘进入预前故障(PRE-FAILURE)状态。这时的硬盘,也许还能正常运行,但已经不适合存放任何有价值的数据了。

 

虽然关键属性(Critical Attributes)依品牌而异有所差别,但是有一项属性是所有品牌都看作关键属性的。这就是05项Reallocated Sectors Count,它的作用是记录重分配(映射)扇区个数。当今的硬盘本身都具备一定的自我修复功能,当出现不稳定的扇区时,固化在硬盘Firmware里的程序会自动把不稳定扇区的数据转移到同样容量的保留扇区里面,同时屏蔽掉不稳定扇区,从而实现坏道的替换。这种硬盘底层的操作虽然在操作系统里面不留任何痕迹,但是S.M.A.R.T属性的05项做了忠实的记录。05项属性值(VALUE)的大小体现了保留扇区的多少。出厂时,保留扇区最多,属性值(VALUE)最大,随着使用中坏扇区的出现,保留扇区的减少,属性值(VALUE)逐渐降低,当降到1时,说明保留扇区已经用尽,硬盘已经不具备坏扇区的自我替换能力了。
各品牌的硬盘保留扇区数量是有差异的,所以,05项阈值(THRESHOLD)控制上也有一定差异。东芝(TOSHIBA)硬盘的阈值是1,而西数(WD)硬盘的阈值则高达140。
相对关键属性(Critical Attributes)来说,资料属性(Informative  attributes)的作用不是太大,但是也可以通过资料属性发现一些问题,不过,要注意关键属性(Critical Attributes)重点看VALUE,而资料属性(Informative  attributes)重点在于Data。比如硬盘加电次数可以通过0C项Power Cycle Count的Data数值来判断;断电(非正常关机)次数可以通过C0项Power-Off Retract Count的Data数值来判断;硬盘当前的温度则可以由C2项Temperature项的Data数值来判断。注:IBM/Hitachi、富士通FUJITSU、东芝TOSHIBA、易拓ExcelStor的C0项Data数值有两个,以后面的数值为准。
下面以一幅用EVEREST测得的S.M.A.R.T属性(ATTRIBUTE)截图为例,做一下了解(图2)。


这里值得一提的是,EVEREST测得的S.M.A.R.T结果中ID属性标识码前面的小方框也可以作为状态定性的依据,如果是√,表示正常;如果是×,则表示有故障。
由此可知,渐进性故障的"蛛丝马迹"具体可以在S.M.A.R.T各项属性(ATTRIBUTE)当前值(VALUE)的变化中体现出来。从而可以见微知著,及时采取措施,避免数据灾难的发生。
S.M.A.R.T属性(ATTRIBUTE)保存在硬盘的预留区域内,操作系统是无法对该区域进行读写的。不过,S.M.A.R.T技术自身提供了访问指令,可以由主板BIOS程序以及一些工具软件通过执行该指令对硬盘的S.M.A.R.T状态进行访问,并输出结果。从而实现了对硬盘健康状态的监测,间接发挥了对数据的安全保护作用。

三、检测S.M.A.R.T的工具软件。
随着人们对S.M.A.R.T重要性的认识逐步加深,很多工具软件加入了这方面的功能,但是由于软件开发人员对S.M.A.R.T了解程度的限制,一些工具并不能客观的反映S.M.A.R.T的真实状态,甚至造成误导。特别是对于T.E.C日期的测定,即使用同一款工具,结果也可能大相径庭,比如Drive Health、HDTune等。经过长期实践证明,EVEREST和Active Smart比较客观。EVEREST优点:比较详细的检测出S.M.A.R.T各项属性的状态以及Data数据记录。缺点:只能手动运行进行检测,并且有的属性不能识别,对于属性当前值的改变不能给出一个直观的结果。Active Smart则正好弥补了EVEREST的上述缺点,能准确的识别出每款硬盘特有的属性,自动进行后台监测,对于属性当前值的改变能给出直观的比较结果。缺点则是无法看到Data数据记录,并且T.E.C预测日期也不稳定。

EVEREST的下载链接网上各大下载站点都有。

 

FAQ
Q:我的系统是win98se,已经安装了EVEREST,可是SMART检测项为灰色空白,怎么回事?
A:Windows\system\iosubsys目录下缺少smartvsd.vxd文件。Win95/98/98se下第三方SMART检测工具都是通过该文件实现S.M.A.R.T访问的。有时该文件存放在Windows\system目录下,拷贝到Windows\system\iosubsys下即可。注意:smartvsd.vxd要发挥作用,需要重启系统。附件提供下载。
Q:我的操作系统是win2000,我安装的EVEREST不能正确运行,怎么办?
A:win2000下检测S.M.A.R.T,可能需要管理员权限。
Q:我的主板是VIA芯片组,在使用EVEREST时无法检测到S.M.A.R.T,确认smartvsd.vxd在iosubsys目录下,如何解决?
A:在某些VIA芯片组,并使用VIA提供的UDMA磁盘驱动时,可能会出现这种情况,目前的解决办法是卸载VIA提供的UDMA磁盘驱动,用系统默认的磁盘驱动。
Q:新买的硬盘,操作系统是win98se,确认smartvsd.vxd在iosubsys目录下,并且用的是系统自带的磁盘驱动,可是EVEREST的SMART检测项仍然为灰色空白,怎么回事?
A:新购入的硬盘,比如昆腾(QUANTUM)、希捷(SEAGATE)默认跳线是CS(Cable Select),更改成Master即可。
Q:怎么打开主板BIOS里面的S.M.A.R.T监测选项?有何功能?

A:HDD S.M.A.R.T. Capability(硬盘S.M.A.R.T.功能选项: Enabled, Disabled),打开了这个功能之后系统能够随时监测硬盘T.E.C错误,以便在硬盘崩溃之前使你能够有足够的时间来来给你的重要资料作备份。

你可以通过这个链接引用该篇文章:http://likunarmstrong.bokee.com/viewdiary.13065685.html

            驳很多电脑论坛中存... 上一篇 | 下一篇 童年回忆 (整理自...

我的搜索

文章评论

添加评论

马上抢占沙发,进行评论
昵  称:  主  页: (选填)
验证码: