직무명: 인시던트 매니저 – 데이터 센터 운영
직무명: 인시던트 매니저 – 데이터 센터 운영
직무 개요
미션 크리티컬 데이터 센터 운영을 위한 인시던트 관리 프로그램을 주도하고 성숙시키며 탁월함을 이끌어낼 전략적이고 실무 중심의 인시던트 매니저를 찾고 있습니다. 이 핵심 역할에서 귀하는 운영 인시던트 발생 시 단일 책임자로서 기계, 전기, 제어 시스템 전반에 걸쳐 신속하고 조율된, 규정 준수 대응을 지휘하게 됩니다. 또한 정책 설계, 팀 준비도, 근본 원인 분석, 성과 최적화까지 인시던트 관리 프레임워크의 전반적인 발전을 책임지게 됩니다. 고위험 환경에서의 회복력, 안전, 지속적인 개선에 열정을 가진 분이라면, 이 역할은 큰 영향을 미칠 수 있는 기회입니다.
주요 업무
- 인시던트 대응 리드: 중요 이벤트 발생 시 인시던트 지휘관으로서 모든 데이터 센터 시스템에 대한 신속한 탐지, 에스컬레이션, 격리, 해결을 위한 프로토콜을 엄격히 준수하며 대응을 지휘합니다.
- 인시던트 관리 프로그램 운영: ITIL, ISO 22301, 기업 리스크 기준에 맞춰 정책, 플레이북, 에스컬레이션 경로, 커뮤니케이션 템플릿, 규정 준수 문서를 포함한 인시던트 관리 프레임워크의 전체 라이프사이클을 설계, 유지, 지속적으로 개선합니다.
- 비난 없는 근본 원인 분석(RCA) 주도: 구조화된 사후 검토를 통해 시스템적 원인을 파악하고, 결과를 문서화하며 시정 조치를 할당하고 완료를 검증하여 재발 방지 및 인프라 신뢰성을 강화합니다.
- 팀 준비도 강화: 기술자, 엔지니어, 운영 인력을 위한 역할 기반 교육을 개발 및 제공하여 프로토콜 실행의 일관성, 상황 인식, 인시던트 대비 능력을 확보합니다.
- 성과 측정 및 최적화: MTTR, 인시던트 재발률, 해결 품질 등 KPI를 정의하고 추적하여 프로그램의 효과를 평가하고 데이터 기반의 대응 속도 및 회복력 개선을 추진합니다.
- 부서 간 협업 촉진: 데이터 센터 시설 엔지니어링(DCFE), 운영, 보안, 벤더 관리, 경영진과 협력하여 통합된 대응 역량과 비즈니스 연속성 목표에 대한 전략적 정렬을 확보합니다.
- 명확하고 긴급한 커뮤니케이션: 인시던트 발생 시 표준화된 템플릿과 에스컬레이션 프로토콜을 활용하여 대상에 맞춘 신속한 업데이트를 제공함으로써 투명성, 신뢰, 운영 일체감을 유지합니다.
- 목적 있는 에스컬레이션: 주요 리스크, 자원 제약, 시스템적 취약점을 선제적으로 식별하고 경영진에게 보고하여 가시성, 책임, 결정적 조치를 확보합니다.
- 데이터 기반 실행: 인시던트 트렌드 및 성과 지표를 분석하여 예방 전략, 규정 준수 보고, 인프라 강화 이니셔티브에 대한 인사이트를 도출합니다.
- 지속적 혁신: 학습된 교훈을 워크플로우, 교육, 시스템 설계에 반영하여 대응 프로토콜과 예방 유지보수 전략을 정제하고 새로운 리스크에 선제적으로 대응합니다.
자격 요건
- 하이퍼스케일 데이터 센터, 유틸리티, 통신, 산업 시설 등 미션 크리티컬 환경에서 인시던트 대응 프로그램을 성공적으로 이끈 경험
- 기계 및 전기 시스템, BMS/DCIM 플랫폼, 시설 제어 아키텍처 등 데이터 센터 인프라에 대한 깊은 기술적 이해
- RCA 방법론(예: 5 Whys, Fishbone, Apollo RCA) 및 인시던트 관리 프레임워크(ITIL, NIST, ISO 22301)에 대한 전문성
- 고압 상황에서도 침착하고 단호한 리더십—팀을 통합하고 존중을 이끌며 결과를 도출할 수 있는 역량
- 현장 기술자, 엔지니어링 리더, 경영진 등 다양한 이해관계자와의 탁월한 커뮤니케이션 및 협업 능력
- 안전, 규정 준수, 운영 탁월성 및 지속적 학습 문화를 조성하려는 끊임없는 헌신
댓글