存储类的物品

  1. 如果你关心你的数据,定期擦洗你ob体育下载的NAS硬盘欧宝体育直播官网

    2020年4月22日星期三

    简介

    很多人都在家里运行NAS。也许是COTS设备来自一个著名的供应商1,或者是自定义构建解决方案(DIY2)是基于你自己购买和组装的硬件。

    购买或构建NAS是一回事,但以确保不会丢失数据的方式操作它是另一回事。

    显然,防止数据丢失的最佳方法是定期备份。所以,理想情况下,即使NAS被烧毁了,你仍然有你的数据。

    由于备份存储需要花钱,人们不得不进行权衡。他们可能决定冒这个险,只备份一小部分真正重要的数据抓住机会和其他人一样。

    这是他们自己的权利。但是,如果我们能将数据丢失的风险降低到最低限度,那就太好了。

    风险在于不良行业

    问题是硬盘驱动器可能会损坏ob体育下载坏扇区随着时间的推移。坏扇区是驱动器中不可读的一小部分3..一个扇区可能有多小,如果其中存储了任何数据,就会丢失,这可能会导致数据损坏(一个或多个损坏文件)。

    事情是这样的:这些坏扇区可能永远不会被发现,直到为时已晚!

    如今有了14+ TB的硬盘驱动器,很容ob体育下载易存储大量的数据。其中大部分数据可能并不经常被访问,尤其是在家里。

    您的一个或多个硬盘驱动器可能正在开发坏扇ob体育下载区,而您甚至不知道它。你会怎么做?

    此时此刻,当您阅读本文时,您的数据可能处于危险之中。

    人们倾向于丢失数据的一个众所周知的灾难场景是双硬盘驱动器故障,其中只能容忍一个驱动器故障(RAID 1(镜像)或RAID 5,而在ob体育下载一些场景是RAID 10)。

    在这种情况下,他们的RAID阵列中的一个ob体育下载硬盘故障,第二个硬盘(剩余的一个好硬盘)出现坏扇区。这实际上意味着第二个驱动器已经失败,尽管该驱动器可能仍然可以运行。由于坏扇区的存在,重建阵列所需的数据将丢失,因为不再存在冗余4

    如果运行RAID 5(变体),您只能丢失一个磁盘,因此如果第二个磁盘故障,您将丢失所有数据5

    缓解措施:定期擦洗/检查磁盘

    判断磁盘是否出现坏扇区的唯一方法是读取所有坏扇区。是的:所有部门

    检查您的硬盘驱动器坏扇区(或ob体育下载其他问题)被称为“数据擦洗”。如果您从QNAP、Synology或其他供应商购买了NAS,有一个菜单允许您控制执行数据擦洗的频率和时间。

    RAID解决方案完全能够处理坏扇区。对于一个RAID阵列,它就相当于一个故障的驱动器,如果坏扇区开始导致读取错误,受影响的驱动器将被踢出RAID阵列。我们想要防止的大问题是多个驱动器同时开始产生坏扇区,因为这相当于多个驱动器同时故障,许多RAID阵列无法从中恢复。

    对于家庭用户,我建议每月检查一次所有硬盘。ob体育下载我建议将数据删除配置为在夜间运行(通常是默认设置),因为删除可能会以一种明显甚至不方便的方式影响性能。

    您的供应商可能已经为数据清除配置了默认计划,因此您可能一直受到保护。如果你看一看,至少你知道。

    构建了DIY NAS的人必须自己设置和配置定期擦洗,否则根本不会发生擦洗。然而,这并不完全正确:我注意到在Ubuntu上,所有Linux软件RAID阵列(MDADM)每个月都要在晚上检查一次。因此,如果您使用Linux软件RAID,您可能已经在擦洗了。

    发展坏扇区的驱动器要尽快更换。它不应该再被信任。擦除的目标是尽快识别这些驱动器。您不希望处于多个驱动器已经开始出现坏扇区的位置。您只能通过定期扫描坏扇区并更换坏驱动器来防止这种风险。

    你不应该害怕不得不花费大量的钱来更换驱动器。欧宝体育直播官网坏扇区则不是常见的。但它们很常见,你应该检查一下。NAS供应商提供运行数据擦洗的选项并推荐它们是有原因的6

    你可能忘了配置电子邮件提醒功能

    如果NAS中的磁盘发生故障,您如何知道?如果清理会发现坏扇区,你会注意到吗7?

    答案可能是:只有在太晚的时候。也许一个驱动器已经失败了,你甚至还没有注意到!

    阅读完本文后,可能是时候花点时间检查NAS和的状态了配置邮件提醒(或任何其他对你有用的报警机制)。让您的NAS发送一个测试消息,只是为了确认它实际上工作!

    关闭的话

    所以我想建议你做两件事:

    1. 确保NAS每月运行一次数据清理
    2. 确保NAS能够通过电子邮件发送关于磁盘故障或擦除的警报。欧宝体育直播官网

    这些操作允许您在问题变成灾难性之前解决问题。

    P.S. S.M.A.R.T.监控

    ob体育下载硬盘驱动器有一个内置的监控系统叫做维持——遵循S.M.A.R.T.来

    如果您有来自某个NAS供应商的NAS,它们将对指示驱动器正在故障的SMART监控信息发出警报。DIY建造者可能不得不花时间手动设置这种监控。

    关于SMART的更多信息,我推荐[这][这欧宝体育直播官网篇文章]和这一个

    这篇文章这一个

    Linux用户可以查看他们的硬盘驱动器的SMART状态ob体育下载这个工具(这是我做的)。


    1. QNAP, Synology, Netgear, Buffalo, Thecus, Western Digital等等。

    2. FreeNAS, Unraid, Windows/Linux Snapraid, OpenMediaVault,或自定义解决方案等。

    3. 坏扇区会导致“不可恢复的读错误”或ure。坏扇区与“无声的数据破坏”无关。对于不可恢复的读错误,没有什么是沉默的。欧宝体育直播官网ob体育下载硬盘报告读取错误回操作系统,他们不会被忽视。

    4. 基于ZFS的DIY NAS (FreeNAS基于ZFS)可能有助于减轻此类事件的影响。即使遇到坏扇区,ZFS也可以继续从其余驱动器读取数据。一些文件将被损坏,但大多数数据仍然是可读的。我认为这个功能本身不足以成为选择基于ZFS的NAS的理由,因为ZFS还涉及到您也需要接受的成本。为我的大型NAS我选择了ZFS,因为我准备好了“付出代价”。

    5. 有些人可能会选择RAID 6,它可以容忍两个驱动器同时故障,但他们也倾向于运行更大的阵列和更多的驱动器,这也增加了驱动器故障或其中一个驱动器出现坏扇区的风险。

    6. 企业存储解决方案(甚至是入口级存储阵列)经常在单个硬盘驱动器和它们上面的RAID阵列上运行巡逻读取。ob体育下载它们在默认情况下也是启用的。

    7. 有一段时间,我在一家小公司工作,他们有自己的电子邮件服务器。一位系统管理员意外地发现,RAID 1中的两个驱动器中的一个故障了。原来我们在用一个开了几个月才发现,因为我们忘了设置电子邮件提醒。我们没有丢失数据,但也很接近了。

    标记为: 存储
  2. 使用Fio对存储进行基准测试并生成结果图表

    2020年4月21日星期二

    简介

    Fio是用于执行存储基准测试的广泛使用的工具。Fio提供了许多选项来创建最能反映您需求的存储基准测试。Fio允许您评估您的存储解决方案是否能够完成它的任务,以及它有多大的空间。

    Fio输出. json而且. log如果你想制作精美的图表,需要进一步处理的文件。图表可以帮助你更好地将测试结果传达给其他人。

    为了制作Fio基准数据的图表,我创建了fio-plot.使用fio-plot可以生成如下图表:

    例二example2青年们

    很常见的情况是,您希望运行多个具有不同参数的基准测试来比较结果。为了生成图表的数据,需要运行许多基准测试。这个过程需要自动化。

    自动化Fio基准测试

    我选择构建自己的工具来自动化Fio基准测试。这个工具叫做bench_fio它是fio-plot.我知道,作为fio的一部分,一个叫做genfio以生成带有多个基准测试的fio作业文件。你想用什么取决于你自己。Bench-fio被定制为以与fio-plot一致的方式输出数据。

    Bench-fio允许您使用不同的iodepth、同步作业、块大小和其他参数对负载进行基准测试。一次基准测试运行可能包含数百个测试,耗时数小时。

    当你运行bench_fio时,你可以期望输出如下:

    ████████████████████████████████████████████████████+ + + + + + Fio基准脚本工作模板:fio-job-template。fio I/O引擎:libaio基准测试数量:98估计持续时间:1:38:00待测设备:/dev/md0测试模式(读/写):待测IOdepth: 1 2 4 8 16 32 64待测numjob: 1 2 4 8 16 32 64待测区块大小:4k每次测试时间:60混合工作负载(%读):75 90。

    Bench-fio实时运行并显示预期剩余时间。它还显示了为这次基准测试运行配置的所有相关参数。这样可以更容易地发现任何错误配置。

    注意,这个基准测试由98个单独的测试组成:iodepth x NumJobs x Mixed Workload参数(7 x 7 x 2)。每个基准测试的标准是60秒

    命令行语法示例:::::text ./bench_fio——target /dev/md0 -t device——mode randrw -o RAID_ARRAY——readmix 75 90

    可以找到更多的例子在这里

    标记为: Fio
  3. MDADM位图对RAID性能的影响

    2020年4月6日星期一

    简介

    我知道大多数具有密集存储工作负载的人不会再在硬盘上运行这些工作负载了,这艘船很久以前就起航了。ob体育下载ssd已经取代了它们(或“云”)的位置。

    对于那些在Linux软件RAID设置中使用硬盘驱动器并运行产ob体育下载生大量随机IOPS的工作负载的少数人来说,这可能仍然是相关的。

    我不确定位图对基于固态驱动器的MDADM软件RAID阵列的影响有多大,因为我没有测试过它们。

    位图的用途

    缺省情况下,使用MDADM创建新的软件RAID时,还会配置位图。的位图的用途是在阵列不同步的情况下加速RAID阵列的恢复。

    位图不会帮助加快从驱动器故障中恢复的速度,但是在写操作期间,由于硬复位或电源故障,RAID阵列可能会失去同步。

    性能影响

    在对各种RAID阵列进行基准测试时,我发现非常糟糕随机写操作IOPS性能。无论测试条件是什么,我都获得了单个驱动器的随机写性能,尽管RAID阵列应该表现得更好。

    然后我注意到数组配置了位图。只是为了测试目的,我删除了所有的位图:

    /dev/md0 . Mdadm——grow——bitmap=none

    随机写IOPs立即得到改善。这个资源解释了为什么:

    如果给出了单词internal,那么位图将与数组中的元数据一起存储,因此将在所有设备上复制。

    所以当你向RAID阵列写入数据时,位图也会不断更新。由于该位图位于数组中的每个驱动器上,因此很明显这会降低随机写IOPS。

    一些性能影响的例子

    位图禁用

    一个带有8 x 7200 RPM驱动器的RAID 5阵列的示例。

    nobitmap

    另一个10.000 RPM驱动器的例子:

    10 knobitmap

    启用位图(内部)

    我们观察到总体随机写IOPs性能显著降低:

    bitmapenabled

    对于10 000 RPM的驱动器也是如此。

    10 kbitmap

    外部位图

    您可以保留位图,但通过将位图放在单独的SSD上,仍然可以获得很大的随机写IOPS。因为我的启动设备是SSD,我测试这个选项是这样的:

    mddadm——grow——bitmap=/raidbitmap /dev/md0

    我注意到出色的随机写IOPS这个外部位图,类似于完全没有位图的运行。外部位图有其自身的风险和注意事项,因此请确保它真正符合您的需求。

    注意:外部位图只适用于ext2和ext3。在其他文件系统上存储位图文件可能会导致严重的问题。

    结论

    对于构建DIY NAS服务器和运行MDADM RAID阵列的家庭用户,我建议保留位图启用.对顺序文件传输的影响可以忽略不计,快速RAID重新同步的好处是非常明显的。

    只有当您的工作负载会在存储服务器上产生大量的随机写操作时,我才会考虑禁用位图。这种用例的一个例子是运行具有大量写工作负载的虚拟机。

    更新位图块

    根据评论中的反馈,我在一个新的RAID 5阵列上执行了一个基准测试,将——bitmap-chunk选项设置为128M(默认为64M)。

    结果似乎很显著更糟糕的是随机写IOPS性能比默认值高。

    bitmapenabled128

    标记为: mdadm

第2页/ 13

Baidu
map