|
|
|
|
|
 |
장애가 재현되지 않을 때 로 그와 계측을 어떻게 설계해 원인을 잡겠습니까
유비쿼스 SW 개발은 통신장비에서 데이터가 안정적으로 흐르도록 플랫폼과 기능을 구현하고, 운영 환경에서 장애가 나지 않도록 성능과 신뢰성을 설계로 고정하는 일이라고 이해하고 있습니다.
안정성입니다.
관측성입니다.
통신장비 개발에서 테스트는 품질이 아니라 속도를 만드는 장치입니다.
테스트는 속도를 만드는 장치입니다.
저는 기능을 만드는 사람보다, 장애를 줄이고 재발을 끊는 사람입니다.
저는 통신장비 소프트웨어를 결과가 아니라 운영 품질로 증명하는 개발자 지망생입니다.
|
|
|
 |
테스트 자동화(Python스크립트 포함)를 통신 장비 개발에 어떻게 적용하겠습니까
본인의 강점 약점과, 유비쿼스 SW 개발에서의 보완 전략을 말해보세요
유비쿼스 SW 개발은 통신장비에서 데이터가 안정적으로 흐르도록 플랫폼과 기능을 구현하고, 운영 환경에서 장애가 나지 않도록 성능과 신뢰성을 설계로 고정하는 일이라고 이해하고 있습니다.
그래서 개발 범위에는 기능개발뿐 아니라, 하드웨어 연동, 관리인터페이스, 모니터링, 테스트 자동화, 운영로그 설계까지 포함됩니다.
커널에 넣는 순간 디버깅과 배포 리스크가 커지기 때문에, 반드시 커널에 있어야 하는 기능(드라이버, 인터럽트 처리, 하드웨어 접근 최소로 직)만두고, 정책 결정과 복잡한 로직은 사용자 공간 데몬으로 올리겠습니다.
ioctl, netlink, sysfs 같은 경로 중팀의 표준에 맞춰 선택하되, 한 번 정한 인터페이스는 호환성 원칙을 지켜 장비 운영에서 혼란이 없게 하겠습니다.
예를 들어 특정 상태에서만 발생하는 문제라면 상태 전이를 코드로 강제하고, 실패시 명확한 에러코드와 로그가 남도록 하겠습니다.
순서는 1) 지표정의, 2) 병목 위치 특정, 3)가장 큰 비용부터 제거, 4) 회귀방지입니다.
미세 최적화는 마지막입니다.
우선 장애 시나리오를 상태 머신으로 정의하고, 상태 전이 지점마다 핵심 키를 남깁니다.
마지막으로 자동화 친화성입니다.
여기에 기능별로 VLAN/STP 상태 변화, 라우팅 테이블 규모 변화, ACL 히트카운트 같은 운영지표를 추가할 수 있습니다.
변화 이벤트 기반과 주기 기반을 혼합해야 하며, 특히 장애조기 탐지는 이벤트 기반이 효과적입니다.
저는 최소한 3층으로 자동화를 설계하겠습니다.
통신장비 개발에서 테스트는 품질이 아니라 속도를 만드는 장치입니다.
저는 리뷰에서 취향은 팀 규칙으로 빠르게 끝내고, 안정성 성능관 측성 같은 원칙에 시간을 쓰겠습니다.
1주차는 제품과 코드베이스 파악입니다.
3주차는 작은 버그 또는 개선과제를 하나 맡아, 재현부터 수정, 테스트, 리뷰반영까지 완결하겠습니다.
5주차는 관측성 개선을 제안하겠습니다.
6주차 이후에는 팀 목표에 맞춰 기능개발 또는 안정화에 집중하되, 인턴기간 종료 시점에 팀이 계속 쓸 수 있는 산출물 2가지를 남기겠습니다.
예를 들어 기능별 체크리스트, 회귀테스트 묶음, 장애분석가이드 같은 형태입니다.
기본기를 테스트 가능한 산출물로 보여드리겠습니다.
재현 조건을 잡고, 계측을 붙이고, 원인을 좁히고, 회귀테스트를 남기는 루틴입니다.
그래서 저는 속도를 "테스트와 관측성으로 확보"하겠습니다.
안전을 버리고 빠르게 가면 나중에 장애 대응과 롤백으로 더 느려집니다.
저는 핵심 흐름에 대해서는 최소 회귀테스트와 로그기준을 반드시 지키고, 덜 중요한 부분에서만 스코프를 조정하겠습니다.
재현이 안 되는 문제는 대개 관측이 안 되는 문제입니다.
저는 테스트를 개발 속도를 늦추는 행정이 아니라, 장애 비용을 막는 보험으로 보지 않습니다.
테스트는 속도를 만드는 장치입니다.
계측과 로그로 원인을 좁히고, 작은 변경으로 검증하며, 테스트로 고정해 팀의 운영 비용과 장애율을 낮추겠습니다. |
 |
기능, 개발, 테스트, 이다, 장애, 장비, 로그, 상태, 운영, 문제, 성능, 설정, 통신, 하드웨어, 설계, 처리, 회귀, 빠르다, 소프트웨어, 계 |
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|