[칼럼] PDF라고 다 같은 PDF가 아니다, 보관용은 따로 있다

강일용 zero@itdonga.com

[IT동아] 우리나라 정부가 자랑스러워하는 것 중의 하나가 바로 전자정부다. ICT인프라를 기반으로 하여 정부의 업무를 전자적으로 처리하자는 취지에서 2000년대 초부터 추진이 되어 현재는 UN전자정부대상 3차례 연속 1위라는 영예를 유지하고 있다. 전자정부 덕분에 정부 내 전자문서 활용률이 99%이상인 것으로 나타났다. 오늘 전자정부를 통해 생성된 전자기록물의 중장기 보존을 위한 문서보존포맷 표준 현황과 호환성에 관련된 문제점을 제기하고자 한다.

먼저 한 가지 사실부터 얘기해야 겠다. 정부의 문서보존포맷으로 정해진 공식 표준은 'PDF/A-1'이다.

PDF
PDF

포맷(PDF/A-1)이 뭐길래?

PDF/A-1은 국제표준화기구(ISO)에서 정의된 장기전자용 문서보존포맷이라고 할 수 있다. (ISO 19005-1) 국내에서도 이러한 표준을 준용하려는 연구가 있었고 마침내 2006년 행정자치부 국가기록원은 PDF/A-1을 공공기관의 전자기록물을 영구적으로 보존하기 위한 문서보존표준 포맷으로 확정하였다. (NAK/TS 2:2008(V1.0))

문서보존포맷이란 문서가 생성된 당시의 애플리케이션이 없어도 해당 문서의 내용과 외형을 그대로 재현하여 내용을 볼 수 있는 포맷을 의미한다. 그간 다양한 문서작성도구(아리랑워드, 훈민정음 등)가 활용되었고 이를 통해 생성된 문서파일들의 장기보존 할 경우 열람환경에 대한 우려가 있어왔다. 예를 들어 보존된 문서파일이 그때 당시 운영체제 환경에서만 실행되는 특정 문서작성프로그램에서만 조회가능하다고 한다면 기록관리 측면에서 다양한 IT환경을 따로 준비해야 하므로 이에 대한 부담은 매우 높을 것이다.

이러한 문제점을 해결할 수 있는 것이 바로 표준화된 문서로 보관하는 것이고 정부에서는 공공에서 발생하는 문서(기록물)의 장기보존포맷으로 PDF/A-1을 선택했다.

표준포맷인 PDF/A-1은 잘 활용되고 있는가?

공공기록물의 관리 주체는 크게 2가지 부류로 나눌 수 있다. 각 부처, 지방자치단체(시군구)그룹과 공공기관그룹이다. 정부부처와 지방자치단체는 공공기록물법의 적용을 엄격히 받는 조직으로 보존년한이 10년 이상인 문서에 대해서는 문서보존 포맷으로 변환하여 관리하고, 특정기간이 지나면 기록물을 국가기록원으로 이관하여야 한다.

따라서 장기보존포맷인 PDF/A-1의 준수가 필수적이며, 대부분 이에 대한 대응이 잘 이루어지고 있다고 한다. 문제는 공공기관들이다. 공공기관(공사, 공단, 연구원, 학교 등을 포함하여 대부분의 공공성을 띤 기관들, 전자정부법 제2조 3항 정의)은 전문기록관리기관으로의 기록물 이관을 하지 않고 자체 보관하는 등, 기록물관리의 자율성이 높은 것으로 알려져 있다.

그리고 대부분의 전자기록물들이 PDF로 변환되어 잘 보관되고 있는 것처럼 보인다.

그런데 왜 PDF파일이 문제인가?

문제는 파일확장자가 PDF(.pdf) 라고 해서 표준포맷인 PDF/A-1과 호환되는것이 아니라는 점이다. 일반적인 오피스문서(MS, HWP 등)처럼 PDF 문서도 다양한 버전이 존재한다.

PDF 문서의 종류
PDF 문서의 종류

PDF파일 포맷도 다양한 표준이 존재한다. 예를 들어 공개된 표준인 ISO 32000-1:2008을 준수할 경우 누구나 PDF관련 제품을 개발할 수 있다. 그러나 표준규격을 준수하여 개발하였다 하더라도 PDF문서의 조회 및 생성 등의 기능에 다소간의 차이가 존재한다.

일반적인 사용에 있어서는 문제가 없을 것으로 예상되나, 공공의 주요 전자문서를 장기보존한다는 측면에서는 문제발생의 소지가 있다. 향후 수십 년, 수백 년을 바라보고 기록을 저장 관리해야 되는 입장에서, 문서표준의 미준수 또는 품질 미달의 제품으로 생성된 PDF/A-1문서들이 향후 잘 읽혀질 것으로 보장할 수 있을 것인가?

실제로 도입기관은 PDF/A-1 생성을 위한 제품 선택 기준을 공급업체의 일방적인 주장만을 근거로 하고 있고, 표준 준수 여부를 검증하는 절차나 수단이 없는 상황에서 무분별한 솔루션의 도입이 향후 전자문서/기록 관리의 문제점이 되지 않을까 우려된다.

일단 PDF파일로 만들고 나중에 PDF/A-1 변환하면 되지 않을까?

대다수의 사용자들은 PDF의 포맷 버전, 규격 등에 대해서 잘 모르는 경우가 많으며, 공공표준인 PDF/A-1에 대해서도 단순히 장기보관용 PDF 정도로 인식하고 있다. 더 나아가서 지금은 그냥 PDF라 하더라도 파일 변환하면 PDF/A-1으로 변환할 수 있지 않을까 생각할 수도 있다.

그러나 PDF/A-1은 구조상 PDF의 원래 기능 중 장기보존에 불필요하거나 제약이 되는 기능을 제거하여 정의한 것으로 PDF파일을 PDF/A-1으로 변환 시 내용상의 누락 또는 변형 등의 문제를 초래 할 수 있을 것이다.

결론은 기록물의 생산 당시에 PDF/A-1으로 변환하는 것이 가장 적합한 것이며, 임시로 PDF로 변환하였다가 나중에 PDF/A-1로 변환하는 것은 매우 위험한 시도라고 할 수 있다.

때문에 공공분야의 전자문서의 올바른 사용을 위해서는 표준의 준수 및 이를 검증하는 절차가 필요하다.

PDF/A-1은 그간 전자정부기반에서 다양한 문서생산도구를 거치면서 겪어온 프로그램 호환성 및 장기 보존환경의 조회 및 활용 문제를 해소하기 위해 제정된 공공표준이다. 전자문서의 확산을 목적으로 하는 협회 입장에서는 매우 환영할만한 일이고, 민간에도 이러한 부분이 정착되기를 기원하고 있다. 다만, 현재의 PDF/A-1사용이 표준의 미준수 또는 일반 PDF문서로 이루어지는 경우가 있다고 하여 이에 대한 3가지 대안을 제안한다.

1. 기존 공공기관 PDF/A-1사용 현황 조사: 현재 공공기관에서 사용되고 있는 기록물이 표준포맷을준수하고 있는지 조사해야 한다.

2. PDF/A-1표준 적합성을 검증하는 절차 필요: 시중의 PDF 솔루션이 PDF/A-1 표준을 준수하고 있는지 검증이 필요하다.

3. 국제표준활동의 적극적인 참여: PDF/A-1 이용기관 및 공급사업자들이 국제표준활동(ISO TC171)에 적극적으로 참여해야 한다.

한국에도 PDF를 다루는 표준위원회인 ISO TC171(문서관리응용)이 존재하고, 전자문서와 관련된 국제 표준 동향 파악이나, 국내 부합화 활동을 하고 있다. 국내에도 PDF를 사용하는 기관 및 공급자의 생태계가 형성되어 있고, 해외에서 만든 표준을 단순히 수용하는 게 아닌 국내의 우수 기술 및 사례를 표준으로 제안하는 등의 적극적인 활동이 필요한 시점이다. 앞으로도 올바른 전자문서 올바른 사용과 산업 활성화를 위해서는 전자문서 표준활동에 많은 관심을 기울여야 한다.

글 / 한국전자문서산업협회 ISO TC 171/KR 간사 전일(iljeon@dca.or.kr)

*본 칼럼은 IT동아의 편집 방향과 다를 수 있습니다.

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.