|
|
|
|
|
 |
아카이빙 원칙을 어떻게 지키겠습니까
신뢰입니다.
메타데이터와 분류체계 설계·운영입니다.
진본성·버전 관리입니다.
개인정보가 포함될 수 있는 콘텐츠를 아카이빙할 때 통제 원칙은 무엇입니까
하지만 아카이빙은 검색, 연결, 권리, 보존, 책임 추적까지 포함합니다.
결국 아카이빙은 비용이 아니라 생산성을 만드는 투자입니다.
동아일보 사 콘텐츠 아카이빙 직무에 지원한 지원자입니다.
|
|
|
 |
콘텐츠 아카이빙이 언론사 경쟁력과 신뢰에 어떤 영향을 준다고 보십니까
OCR 품질이 낮아 원문 검색 정확도가 떨어질 때, 실무적으로 어떻게 개선하겠습니까
저작권·초상권·2차 사용 허가 등 권리(Rights) 관리를 아카이빙에 어떻게 녹이겠습니까
압박 : "아카이빙은 단순 저장·정리 업무 아닌가요"라는 질문에 어떻게 답하겠습니까
아카이빙 원칙을 어떻게 지키겠습니까
저는 콘텐츠 아카이빙을 "과거를 저장하는 일"이 아니라 "미래의 기사 생산을 가속하는 기반을 만드는 일"로 봅니다.
신뢰입니다.
아카이브는 기획·데이터 저널리즘·팩트 체크의 원재료입니다.
메타데이터와 분류체계 설계·운영입니다.
잘 저장'보다 '잘 찾고 잘 연결'이 핵심입니다.
예를 들어 제목·작성일·출처·권리·키워드 같은 공통 필드 위에, 영상은 러닝타임·코덱·프레 임, 사진은 해상도·촬영 정보 같은 확장필드를 붙이는 방식입니다.
입력단계에서 표준화(드롭다운, 자동완성, 필수값), 2) 기존 데이터 정제 (표준사전매핑, 중복병합), 3) 검색단계의 보정(동의어 사전, 형태소·오타교정).3개월 단위로 지표(검색성공률, 무결성 비율 를 공개해 개선이 '체감'되게 만들겠습니다.
주제(정치/경제/사회 등), 조직(기관/기업), 인물, 지역, 사건(이슈) 같은 축을 정하고, 축마다 표준표기·동의어·영문/한글 변형을 관리하는 사전을 둡니다.
운영에서는 "통제 태그"와 "자유태그"를 분리합니다.
통제 태그는 검색 품질을 위해 필수이며, 자유태그는 현업의 표현을 살리되 정제 작업으로 흡수합니다.
그 리고 태그 정책은 바뀌어야 합니다.
외부 공개는 정책에 따라 최신 본을 기본으로 하되, 내부에서는 버전 비교가 가능해야 합니다.
저는 CMS 단계부터 버전 정책을 박아 "사람이 기억으로 관리하는 위험"을 없애겠습니다.
그리고 조회·다운로드 권한을 권리 속성에 연동합니다.
원칙은 최소화, 목적 제한, 접근 통제, 감사 가능성입니다.
내부 사용과 외부 서비스 요구가 충돌할 때 우선순위는 어떻게 정합니까
그래서 내부는 검색 정확도와 버전 추적, 빠른 인입을 최우선으로 두고, 외부는 권리·개인정보 필터링과 서비스 안정성을 최우선으로 둡니다.
보존용 마스터와 서비스용 파생본을 분리하고, 마스터는 장기보존친화포맷과 규격으로 관리합니다.
저는 "끝에서 잡는 검수"가 아니라"처음부터 흔들리지 않는 계약"을 만들겠습니다.
즉, 아카이브가 보도의 속도를 올리고, 신뢰를 지키고, 사업적 확장까지 가능하게 하는 단계로 만들겠습니다.
결국 아카이빙은 비용이 아니라 생산성을 만드는 투자입니다.
즉, 서비스 오픈을 위해 기능을 줄일 수는 있어도, 보존과 권리 같은 핵심 품질을 줄이면 나중에 되돌릴 비용이 폭발합니다.
필수 메타데이터를 최소화하고, 나머지는 자동화합니다.
해당 항의가 권리·개인정보·명예훼손 등 정책 이슈인지 확인하고, 편집 원칙·법무기준에 따라 처리합니다.
스냅샷, 백업, 이중 저장본의 최신 상태를 확인하고 복구 시나리오를 선택합니다. |
 |
검색, 성, 이다, 권리, 품질, 어떻다, 버전, 카이, 빙, 보존, 콘텐츠, 만들다, 기사, 아카이브, 개선, 보다, 단계, 이슈, 관리, 서비스 |
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|