Диски с проблемной записью

Вот как обычно проверяют диски? Правильно, прогоняют «викторией» или «mhdd». И если нет проблемных «прямоугольников», то значит диск хороший и работать будет. Мало кто задумывается, что проверка в этих программах идет только либо в режиме чтения, либо в режиме «верификация», что тоже чтение, только без передачи данных в host.

Однако, на практике попадаются диски у которых запись некоторых областей делается с ошибками, либо сильно тормозит, например:

Жёсткий диск: тест записи

При этом верификация поверхности выглядит вот так:

Жёсткий диск: тест поверхности (Verify)

Удивительно?
При этом SMART никаких признаков проблем не показывает. Переназначенных секторов нет.

Я предполагаю, что это тормозит или ошибается слишком заумно реализованная в современных дисках серво система. Но, пока это только гипотеза. Как говорится, будем посмотреть.

Обнаружилось такое на WD начиная с 2012 года и HGST с 2014.

На сегодня всё. Да хранит ваши данные бэкап!

 

Поделиться ссылкой на пост в соц. сетях

One thought on “Диски с проблемной записью

  1. Mike

    Про кардинально разные эффекты при тестах чтения и записи «на ровном месте» = подтверждаю.

    Запись — совсем иной процесс и, в идеале, не имеет права не завершаться успешно. В противном случае, это сигнализирует о достаточно серьёзных проблемах (в прошивке, серво-коде, состоянии серво-системы, состоянии механики в целом, наличие «биения» дисков, и т.п.).

    С точки зрения накопителя, ошибки записи — имеют наивысший приоритет после hardware-ошибок серво-системы.

    Относительно тестов поверхности — у PC3000 есть «тонкое место» = сильно задушенная пропускная способность каналов. На большинстве современных накопителей это технически не позволяет получить достоверные графики.

    Ещё очень не хватает информации о настройках тестов.

    Будет полезно, если все подобные графики будут снабжаться условиями тестирования:

    – размер блока чтения/записи/верификации (в секторах) = это ощутимо влияет на время обработки команд, а на подавляющем большинстве дисков даже заметно коррелирует с плотностью секторов (SPT), алгоритмом трансляции, настроек сегментирования кеша чтения/записи или наличия адаптивных алгоритмов (Сигейты умеют «привирать» результаты, распознавая тип ФС и подстраивая работу кеша), и т.д. и т.п.

    – очень важен комментарий, что уже более 10+ лет команда VERIFY вне зависимости от интерфейса реализации = перестала давать достоверные результаты. За несколько лет экспериментов, бесчисленные тесты показали, что верификация с большой вероятностью может пройти вообще без ошибок (именно ошибки, не timeout`ы), при этом тесты чтения — начнут сыпаться UNC`ами, «чихать/моргать» и активно реаллокейтить.
    Это утверждение не является аксиомой по множеству причин, однако всё же имеет место в реальных тестах с вероятностью (усредняю) 88:100 — более чем достаточно.

    – шкала LBA/s даже для профессионала имеет нулевую информативность. Честно говоря, я за 15 минут фантазирования так и придумал, как это может помочь.
    MB/s, IOPS и время доступа — самые информативные системы измерений 🙂

    В целом, описанные случаи мне крайне интересны на постоянной основе для детального анализа (FA)!

    В моей статистике очень много примеров, когда проблемы с «деградирующей сервой» создавали очень серьёзные проблемы при записи, но вообще не заметны при чтении.

    Если у тебя пылятся лишние «кролики» с подобными явными странно-проблемами для анализа (с возвратом) — дай знать! 🙂

    Всем добра.

    Reply

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *