|
|
|
|
|
 |
여기서 핵심은 모델만이 아니라 시스템입니다.
문제정의 능력입니다.
운영 감각입니다.
데이터 문제를 모델 문제로 착각하지 않는 역량입니다.
데이터 건강검진입니다.
데이터 최소화입니다.
운영화입니다.
오히려 그 상황이 응용AI의 현실입니다.
|
|
|
 |
응용/서비스 AI 연구개발은 논문 성능보다 더 어려운 문제를 다룹니다.
KT는 대규모 서비스와 데이터, 그리고 운영 요구가 공존하는 환경입니다.
저는 응용/서비스 AI 연구개발을 한 문장으로 정의하면, 불완전한 현실조건에서 AI를 안전하고 경제적으로 동작시키는 시스템을 설계하고 개선하는 일입니다.
문제정의 능력입니다.
성능을 올려라"는 요구를 실제 KPI로 번역하고, 실패 정의까지 명확 히 해야 합니다.
두 번째 단계에서는 최소 기능 모델을 만들고, 데이터·모델·서빙의 병목을 찾습니다.
세 번째 단계에서 연구를 투입합니다.
연구는 논문을 위한 성능이 아니라, 제품의 실패 확률을 낮추는 수단이어야 합니다.
데이터 문제를 모델 문제로 착각하지 않는 역량입니다.
실패 사례를 유형화하고, 원인 후보를 데이터·라벨·피처·모델·서빙으로 나눈 뒤, 가장 비용 대비 효과가 큰 레버부터 개선합니다.
데이터 건강검진입니다.
정확도/품질(예: NDCG, F1, BLEU 등), 안정성(세그먼트별 편차), 지연(지연분포의 상위 퍼센타일), 비용(요청당 추론비용), 안전/정책(유해응답, 개인정보 노출, 편향).
근거기반 생성(RAG), 정책 필터링, 민감정보 마스킹, 레이트리밋, 캐시, 휴먼인 더루프, 로그 감사를 묶어 운영하겠습니다.
성능을 올리는 핵심은 입력과 근거, 평가의 구조를 바꾸는 것입니다.
문서 전처리, 청킹, 임베딩 품질, 검색 스코어링을 개선하면 생성품질이 크게 좋아집니다.
금칙어, 민감정보, 정책위반을 필터링하고, 수치나 사실은 룰 기반 검증을 섞습니다.
예를 들어 더 큰 모델이 품질을 조금 올리지만 지연과 비용이 크게 늘면, 전체 서비스 품질이 오히려 나빠질 수 있습니다.
모델·프롬프트·로그의 보안입니다.
정책 준수 테스트입니다.
예를 들어 전환율을 올리자는 목표라면, 전환율의 정의와 측정 방식부터 합의합니다.
누가 무엇을 언제까지 할지 합의하지 않으면 갈등은 반복됩니다.
저는 감정싸움이 아니라 의사결정 구조로 갈등을 끝내는 방식으로 협업하겠습니다.
제약점은 초기에 문제 정의를 너무 엄격하게 잡아, 합의 속도가 느려질 위험이 있다는 점입니다.
먼저 최소 기준을 정의해 빠르게 프로토타입을 만들고, 그 결과를 근거로 확장 기준을 업데이트 합니다.
모니터링, 드리프트 감지, 안전 필터, 비용 최적화를 포함한 시스템을 구성해 실제 서비스에 가까운 형태로 만들겠습니다.
성과는 비용과 리스크를 통제하면서도 사용자 경험을 실제로 개선하는 것입니다.
저는 데이터를 만드는 방법부터 설계합니다.
또한 작은 데이터로도 검증 가능한 실험을 먼저 설계해, 데이터 투자 대비 효과를 증명하겠습니다.
데이터가 없으면 못한다는 말은 책임 회피입니다.
저는 못한다고 말하지 않고, 가능한 형태로 바꾸겠습니다. |
 |
데이터, ai, 이다, 모델, 비용, 서비스, 만들다, 정책, 운영, 정의, 설계, 학습, 성능, 가능하다, 라벨, 실험, 시스템, 기준, 지표, 방식 |
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|