各厂商的硬盘可靠性

休假回来忙了一阵,又到了年底突击花钱的时候,每年项目花不完的钱需要还回去,和几个同事交谈发现各国的科研机构都有这个奇葩政策,那岂不是逼我们乱买东西吗。今年我们要采购的是存储服务器,已经和几个供应商面谈了,Dell 反应最积极,甚至免费提供设备让我们测试两个月,现在我们拿不定的是买专业的存储还是买普通服务器自己做存储集群。

从我们的环境和经验来看,硬盘是最容易坏的服务器部件之一,每年都有硬盘报废,我们使用的硬盘品牌、型号、容量五花八门,从来都没有统计和在意过硬盘的可靠性。我们知道硬盘迟早会坏,所以必要的冗余和备份是不可少的,数据可靠性远比硬盘可靠性重要,既然人类无法阻挡硬盘报废,那我们就只能想办法避免数据丢失。

Backblaze 上个月发布了他们的硬盘可靠性报告 Hard Drive Reliability Update – Sep 2014,他们有 34881 个硬盘,100多 PB 数据,统计的样本够大,数据和结论都值得我们参考。

hard drive annual failure rate

从图上来看,貌似 HGST(原日立), Seagate (1.5/4.0 TB), aWestern Digital (1.0 TB) 表现都不错。一个有趣的结论是,从报废率来说,企业级硬盘比桌面级硬盘好不了哪里去,考虑到其价格是对应桌面级的两倍(Seagate 3 TB 企业级硬盘价格 $235 对比 Seagate 3 TB 桌面级硬盘价格 $102),桌面级的硬盘性价比更高一些。

评论 (8 Comments)

  1. DELL的服务不错 就是价格贵了点

  2. 不知道为啥,我这里几百块硬盘的规模,但是目前坏的都是西数的盘,还都是企业级的盘,希捷的盘还比较皮实,日立的盘用的少,不知道什么情况

  3. 希捷、西数、东芝(日立)的几百块硬盘用下来,发现希捷坏的几率非常高,基本上都报废了,西数一般,东芝(日立)最好,都是桌面级硬盘,然后希捷保修时间最短。

  4. 我这的情况是,都是用的希捷的盘,基本都是2TB,而且都是小文件和打文件写入读取比较频繁。没有出现过坏盘的情况。

  5. 然后,存储我们用的服务器来做的,用的是DELL的R720的11盘位的机器,每个硬盘4TB。做了硬件raid。raid卡用R710P。

  6. @vpsee,你好,我想请问一下如果一台xen宿主机down机,你是怎样来排查错误的?

  7. @yao
    主要根据监控的数据(啥时候 down 的,down 时候的状态,down 之前发生了什么)以及系统日志(找可疑线索)排查。

  8. 我们的项目各种硬盘也挺多的,但是我个人还是觉得RE4系列的靠谱。坏的最少。
    我们都用mfs做了集群。

发表评论