|
|
|
|
|
 |
단순장애 대응이 아니라, 서비스의 가용성과 성능 , 보안, 데이터 품질을 책임지고, 운영을 통해 시스템을 더 좋아지게 만드는 역할입니다.
2년차에는 현대오토에버의 운영 표준과 시스템도 메인을 빠르게 체득하겠습니다.
5년차 이후에는 시스템 운영을 "플랫폼"으로 만들고 싶습니다.
현대오토에버에서 저는 운영을 수동 대응이 아니라 설계 가능한 시스템으로 바꾸는 Serv iceE ngineer로 성장하겠습니다.
제가 IT시스템 개발/운영에서 강점으로 내세울 역량은 네 가지입니다.
장애가 발생하면 원인 분석을 통해 "왜 이 장애가 시스템적으로 가능했는지"를 찾고, 재발방지를 설계합니다.
개발과 운영의 균형은 설계단계에서 결정된다고 생각합니다.
최종 적으로는 현대오토에버의 IT시스템이 "문제가 없어서"가 아니라"문제가 생겨도 빠르게 복구되고 다시는 반복되지 않아서 "신뢰받도록, 운영 품질을 제 성과로 만들겠습니다.
|
|
|
 |
현대오토에버 ServiceE ngineer-IT시스템 개발. 운영(신입) 자기소개서자소서 및 면접질문
IT시스템 개발/운영에서 "운영"이란 무엇이며, 개발과 운영의 균형을 본인은 어떻게 잡겠습니까
입 사후 1년 3년 5년 성장 계획과, 현대오토에버에서 만들고 싶은 IT시스템 운영 성과를 말해 주십시오
저는 IT시스템을 "개발해서 끝나는 결과물"로 보지 않습니다.
현대오토에버는 그룹 차원의 IT 운영과 시스템 개발을 담당하며, 규모와 복잡도가 매우 큽니다.
저는 이런 복잡한 환경에서 "예측 가능한 운영"을 만드는 일이야말로 Serv iceE ngineer의 핵 심이라고 생각합니다.
저는 기능 개발을 빠르게 끝내는 데 집중했을 때, 배포 이후 운영 이슈가 눈덩이처럼 불어나는 경험을 했습니다.
운영 문제는 개발이 끝난 뒤에 해결하는 것이 아니라, 개발 단계에서부터 운영을 설계해야 줄어든다는 것을요.
문제를 계층적으로 분해해 원인을 좁히는 진단능력.둘째, 운영을 가능하게 만드는 관측 가능성 설계.셋째, 실수를 줄이는 자동화와 표준화습관.넷째, 재발방지 중심의 사고방식입니다.
운영 이슈는 대부분 "복합원인 "입니다.
저는 운영에서 가장 비싼 장애는 "원인을 모르는 장애"라고 생각합니다.
장애가 발생하면 원인 분석을 통해 "왜 이 장애가 시스템적으로 가능했는지"를 찾고, 재발방지를 설계합니다.
작은 규모라도 서비스를 구성하고, 장애 상황을 가정해 로그와 메트릭으로 원인을 찾는 연습을 했습니다.
저는 기능을 만들 때부터 로그/메트릭/알람, 타임아웃/재시도, 장애격리, 롤백 전략을 포함해 설계하겠습니다 .
답변. 저는 MTTR을 줄이기 위해 탐지-범위 확정-우회/복구-원인 분석-재발방지 순서를 고정합니다.
복구는 사용자 영향 최소화가 우선이므로, 기능 플래그로 degrade하거나 트래픽 우회, 롤백을 즉시 고려합니다.
배포 전에는 롤백 절차를 리허설하고, 배포 후에는 핵심 지표를 모니터링해 이상 징후가 보이면 즉시 롤백할 수 있어야 합니다.
결제나 권한처럼 치명적인 영역은 강한 정합성이 필요하고, 통계나 로그처럼 약한 일관성이 허용되는 영역은 비동기 처리로 성능을 확보할 수 있습니다.
저는 도메인별로 정합성 요구를 분리하고, 필요한 곳에는 트랜잭션과락을 사용하되, 가능한 곳은 이벤트 기반 비 동기 처리와 최종일관성으로 성능을 확보하겠습니다. |
 |
운영, 배포, 시스템, 장애, 만들다, 설계, 원인, 문제, 지표, 복구, 개발, 오토, 에버, 재발, 대응, 표준, 데이터, 품질, 지연, 롤백 |
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|