본문으로 바로가기

 

IBM DS 3000,4000,5000, 계열의 스토리지  서브 시스템  A Controller의 경우 820일 마다, 또는 B Controller 의 경우 825일 마다 재부팅 된다. 

(Controller의 펌웨어가 업그레이드 되지 않았거나, 기간내 재부팅된경우에 해당)

 

 

 

1. 영향받는 구성 

  • DS4100 (FAStT100) 듀얼 컨트롤러 스토리지 서버, 유형 1724, 모든 모델
  • DS4100 (FAStT100) 단일 컨트롤러 스토리지 서버, 유형 1724, 모든 모델
  • DS4200 스토리지 서버, 유형 1814, 모든 모델
  • DS4300 (FAStT600) 듀얼 컨트롤러 및 터보 스토리지 서버, 유형 1722, 모든 모델
  • DS4300 (FAStT600) 단일 컨트롤러 스토리지 서버, 유형 1722, 모든 모델
  • DS4400 (FAStT700) 스토리지 서버, 유형 1742, 모든 모델
  • DS4500 (FAStT900) 스토리지 서버, 유형 1742, 모든 모델
  • DS4700 스토리지 서버, 유형 1814, 모든 모델
  • DS4700 스토리지 서버, 유형 1814 (DC 전원 공급 장치), 모든 모델
  • DS4800 스토리지 서버, 1815 형, 모든 모델
  • DS5020 디스크 컨트롤러 (1814-20A), 모든 모델
  • DS5100 스토리지 컨트롤러, 유형 1818, 모든 모델
  • DS5300 저장 컨트롤러, 유형 1818, 모든 모델
  • FAStT 200 저장 서버, 유형 3542, 모든 모델
  • FAStT500 RAID 컨트롤러, 유형 3552, 모든 모델
  • FAStT500, 유형 3552, 모든 모델
  • IBM System Storage DS3200, 유형 1726, 모든 모델
  • IBM System Storage DS3300, 유형 1726, 모든 모델
  • IBM System Storage DS3400, 유형 1726, 모든 모델
  • IBM System Storage DS3512, 유형 1746, 모든 모델
  • IBM System Storage DS3524, 유형 1746, 모든 모델
  • IBM System Storage DS3950 Express, 1814, 모든 모델

시스템은 다음 IBM 옵션 중 하나 이상으로 구성됩니다.

  • BladeCenter 부트 디스크 시스템 (1726-22B), 모든 모델

 

 

2. 해결책 

DS3500, DCS3700 및 DCS3860의 경우이 문제점은 8.2x 릴리스에서 수정되었습니다. 다른 모든 제품의 경우 이는 영구적 인 제한 사항이며 해결 방법이 없습니다.

 

 

3. 해결방법 

컨트롤러가 재부팅 될 때마다 펌웨어는 타이머 메커니즘을 재설정하여 타이머를 828.5 일 더 컨트롤러에 제공합니다. 다음 재부팅은 컨트롤러 A의 경우 820 일, 컨트롤러 B의 경우 825 일에 이루어집니다.

이러한 예기치 않은 재부팅을 피하는 방법은 컨트롤러 펌웨어를 업그레이드하는 프로세스가 컨트롤러를 재부팅하여 타이머 메커니즘을 재설정하므로 컨트롤러 펌웨어 업그레이드를 사용하는 것입니다. 또한 재부팅을 고객 환경에 편리한 시간에 예약 할 수 있습니다.

컨트롤러를 동시에 재부팅 할 가능성을 줄이려면 펌웨어를 아래 수준으로 업그레이드하는 것이 좋습니다.


DS3000 - 07.35.41.00 이상 
DS4000 - 07.15.07.00 이상 
DS5000 - 07.30.21.00 이상 

권장되는 IBM의 권장 사항은 펌웨어에서 구현 된 개선 사항을 활용하고 정기적으로 펌웨어를 업그레이드하여 연간 1 회 이상 환경을 유지 관리하는 것입니다.

 

이 프로세스는 컨트롤러를 재부팅하기 때문에 정기적으로 컨트롤러 펌웨어를 유지 보수하면 타이머가 재설정됩니다. 다른 이유로 재부팅하면 타이머가 재설정됩니다.

 

결론 : 유지보수 장비 인경우 미리 Controller 재부팅시간을 확인하여, 일정을 잡아 PM 작업을 한다. (알아서 해라 ~ ) 

 

 

 

4. Reboot 날짜 확인 방법

 

해당내용은 profile에서 확인 가능  > search > baseline 검색 

  CUMULATIVE ERROR COUNTS

 

                  Controller A

 

                     Baseline time set:               16. 9. 14 오후 10:56:52  

                     Sample period (days, hh:mm:ss):  769 days, 16:11:10     

                     Controller detected errors:      30                     

                     Drive detected errors:           28                     

                     Timeout errors:                  29                     

                     Link down errors:                N/A                    

                     Total I/O count:                 357337572              

 

                  Controller B

 

                     Baseline time set:               18. 8. 30 오전 7:34:43  

                     Sample period (days, hh:mm:ss):  20 days, 04:21:01     

                     Controller detected errors:      0                     

                     Drive detected errors:           9                     

                     Timeout errors:                  0                     

                     Link down errors:                N/A                   

                     Total I/O count:                 5805712               

 

 

                      

 

Tip) DS Manager 에서 접속하여 보는것이라면, 아래와 같은 방법이 더 찾기 쉬움.  통 in-band 방식 이면 이렇게 확인하는 것이 더 편하다. 

 

  • Storage Subsystem > profile > Drive Channels  >  Sample period 확인

 

  • Advanced > Trobuleshooting > Drive channels > Show Detail 로 확인 가능

 

 

 

- END -