Как недостаточное внимание к особенностям SMR привело к диагностической ошибке

Осенью 2019го года наш специалист допустил ошибку при первоначальной диагностике состояния жёсткого диска.

Он не учёл тот факт, что при определённых условиях исправный жёсткий диск, использующий технологию SMR, может глубоко погрузиться в выполнение внутренних процессов. Настолько, что будет отвечать на запросы с большими задержками. И при выполнении тестов чтения наблюдаемая картина может быть похожа на поведение диска, имеющего проблемы с поверхностью пластин.

О технологии SMR »

Специалист увидел в этом явлении подтверждение слов заказчика о неисправности диска, о чём сообщил заказчику.

Углубленное изучение состояния диска не выполнялось по следующим причинам:

  • У этой модели заблокирован технопротокол. Поэтому изучение служебных данных прошивки требует вмешательства в микропрограмму, что выходит за рамки диагностики и в случае необходимости выполняется уже в процессе выполнения работ.
  • Детальная проверка состояния поверхности в случаях, когда подозреваются её повреждения, несёт дополнительные риски усугубления повреждений. К тому же, такая проверка, по сути, аналогична вычитыванию информации, что и является работой по восстановлению данных в данном случае.

Таким образом, при подобных симптомах, состояние диска уточняется уже в процессе выполнения работ. Что и произошло бы в данном случае, если разрешение на выполнение работ было бы получено.
Ниже приведу скриншоты тестов того самого диска, который был нам в итоге предоставлен для изучения. На них видно, что именно ввело специалиста в заблуждение.

Вот так выглядит график линейного чтения с прыжками с этого диска, если дать несколько часов постоять ему включённым без обращений на чтение или запись:
smr_r_speed

smr_r_access

Вот, для сравнения, «обычный» жёсткий диск, без технологии SMR:
nosmr_r_speed

nosmr_r_access

Теперь линейная запись с прыжками. Только по первой четверти поляны, пишется суммарно меньше 10% от того объёма, который был туда записан перед тем, как нам его принесли на диагностику. Больше и не нужно, потому что эффект виден уже при таком объёме. Первая четверть – поскольку до передачи нам на диагностику на него было записано 230 Гб, порядка четверти от общего объёма.
smr_w_speed

smr_w_access

Не SMR:
nosmr_w_speed

nosmr_w_access

Резкое снижение средней скорости и возрастание времени доступа – признак заполнения кэша. По графикам сразу видно, какой из них с SMR. Теперь снова чтение:
smr_r2_speed

smr_r2_access

Обратите внимание на отличия от первого теста. Подобное поведение диска в процессе диагностики и ввело специалиста в заблуждение. Выглядело это не так, как на скриншотах, данные тесты использованы для большей визуальной наглядности.

На результаты теста чтения «обычного» жесткого диска, выполнявшаяся перед этим запись не влияет:
nosmr_r2_speed

nosmr_r2_access

Автор материала Николай Хозяинов.

Поделиться ссылкой на пост в соц. сетях

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *