"PDF라고 다 같은 PDF가 아니다"

강일용 zero@itdonga.com

[IT동아 강일용 기자]

"전자문서 장기 보존을 위한 개방형 표준이 필요하다."

지난 1일 서울 코엑스에서 열린 페이퍼리스 2.0 컨퍼런스에서 김대용 유니닥스 이사가 한 발언이다. 김 이사는 왜 전자문서 표준으로 특정 기업에 종속되어 있는 폐쇄형 문서 대신 누구나 이용할 수 있는 개방형 문서를 채택해야 하는지, 전자문서 표준화를 위해 정부와 기업들이 어떤 준비를 해야 하는지 등을 들려줬다.

김대용 유니닥스 이사
김대용 유니닥스 이사
<김대용 유니닥스 이사>

김 이사는 전자문서 업계에 표준이 필요한 이유를 볼트와 너트의 사례를 들어 설명했다.

"볼트와 너트는 완벽하게 표준화가 되어 있다. 전 세계 어디서 볼트와 너트를 구매하든 서로 연결해서 이용할 수 있다. 스마트폰 충전 단자도 표준화가 진행되어 세계 어디서나 제품을 충전할 수 있다. 즉, 표준화를 이루면 그만큼 기업과 사용자는 더욱 편리하게 해당 제품을 이용할 수 있게 된다."

"그런데 정작 전자문서는 표준화가 잘 진행되지 않고 있다. 비표준은 많은 불편함을 초래한다. 전자문서에 표준이 존재하지 않기 때문에 정보교환과 처리가 원활하게 진행되지 않아 기업과 사용자의 비용 부담이 증가하고 있다. 특정 문서에 전자문서 산업이 종속되면 독과점 현상이 발생하고, IT 생태계가 왜곡되어 결과적으로 전체 산업 발전을 저해하게 된다."

전자문서라고 하면 흔히 사람들은 HWP(한컴), DOC(워드), XLS(엑셀), PPT(파워포인트) 같은 문서 파일을 떠올린다. 하지만 이 문서들에는 두 가지 문제가 존재한다.

첫 번째 문제는 편집에 최적화되어 있는 문서라는 것이다. 편집 기능을 강화하기 위해 지속적으로 신 버전의 문서 작성 프로그램이 등장했는데, 신 버전 프로그램에서 작성한 문서를 구 버전 프로그램에서 열면 문서의 서식이 흐트러지거나, 내용이 제대로 표시되지 않는 문제가 있다. 게다가 열람자의 PC나 스마트폰에 문서 작성 당시 사용한 폰트가 없으면 열람하려는 문서 내부의 서식이 엉망이 된다. 때문에 열람하는 사람마다 문서의 내용이 달리 보이는 문제가 종종 발생한다. 게다가 편집에 최적화되어 있기 때문에 누구나 쉽게 문서 내부의 내용을 변경할 수 있다. 즉, 보관 및 관리가 힘든 전자문서라고 평가할 수 있다.

두 번째 문제는 특정 기업에 종속되어 있는 폐쇄형 전자문서라는 점이다. HWP는 한글과컴퓨터에게, DOC와 XLS 그리고 PPT는 마이크로소프트에게 저작권이 존재한다. 새 버전 문서 개발도 이들 기업이 진행하고 있다. 결과적으로 이들의 도움이 없으면 문서의 제대로된 관리가 불가능하다. 해당 문서를 쓰면 쓸수록 두 기업에게 종속될 수 밖에 없다. 이러한 두 가지 문제를 해결하기 위해 등장한 것이 개방형 표준 전자문서다. 개방형 표준 전자문서의 대표적인 사례로 오픈 도큐먼트 포맷(ODF), XML(HTML), PDF 등을 들 수 있다.

PDF
PDF

김 이사는 이러한 개방형 표준 전자문서 가운데 PDF가 왜 보관용 문서로 적합한지 이유를 설명했다.

"현존하는 전자문서 형식은 1411종에 이른다. 이 가운데 PDF만 18종이 존재한다. 현재 국내 전자문서는 1411종의 문서 가운데 한컴오피스, MS오피스 그리고 PDF가 주류를 이루고 있다. 한컴오피스나 MS오피스 파일은 편집에 최적화되어 있다. 운영체제, 프로그램 버전, 사용자의 기기 종류에 따라 문서가 다르게 보이는 문제가 있다. 즉 문서 호환성에 문제가 있다. 반면 PDF는 애당초 열람과 보관에 최적화된 문서다. 운영체제, 프로그램 버전, 기기 종류, 폰트 유무 등과 관계 없이 언제 어디서나 동일한 형태의 내용을 보여준다."

"때문에 정부와 많은 기업이 보관용 전자문서는 PDF 형태로 변환해서 저장하고 있다. 전자정부법에 따르면 행정기관에서 생성된 전자문서는 문서 생성일로부터 1년이 경과될 경우 기록관리시스템으로 이관하게 되어 있다. 이 가운데 보존년한이 10년 이상인 기록물은 문서 생성일로부터 1년 이내에 보존포맷, 즉 PDF로 변환하도록 하고 있다."

"많은 사용자가 PDF가 어도비의 제품이라고 생각한다. 전혀 그렇지 않다. PDF는 특정 회사의 소유가 아니다. 2000년대 초반 W3C(월드 와이드 웹 컨소시엄)를 통해 PDF 문서가 누구나 이용할 수 있는 오픈 포맷으로 공개되었다. 덕분에 유니닥스를 비롯한 몇 백개의 회사가 PDF 관련 소프트웨어(SW)를 개발하고 있다."

개방형 표준 전자문서에 장점만 있는 것은 아니다. 개발 주체가 명확하고, 이들이 주도적으로 문서 작성 SW의 품질을 개선해나가고 있는 폐쇄형 전자문서와 달리 개방형 표준 전자문서는 문서 작성 SW의 품질에 관한 문제가 존재한다. 이를 해결하기 위해 김 이사는 문서 작성 SW의 품질을 검증할 수 있는 시스템을 도입해야 한다고 설명했다.

"PDF는 순수 개방형 표준이다. 누구나 관련 기술을 개발하고, 사용할 수 있다. 하지만 누구나 관련 SW를 개발할 수 있다보니 SW 품질에 관한 문제가 발생했다. PDF 기술 표준조차 제대로 지키지 못하는 저질 PDF 생성 SW가 시중에 유통되기 시작한 것이다. PDF 생성 SW라고 다 같은 생성 SW가 아니다. SW를 잘 만드는 개발사와 못 만드는 개발사가 존재한다. 하지만 어떤 SW가 잘 만들어졌는지 검증받을 수 있는 시스템은 존재하지 않는다."

"한국정보통신기술협회의 GS인증(굿소프트웨어 인증)은 SW의 적합성을 측정한 결과일 뿐이다. 해당 SW의 품질을 보여주지 않는다. 때문에 특정 SW가 제대로 동작하는지, 버그는 어느정도 존재하는지, 표준은 제대로 준수하고 있는지 여부 등을 검증할 수 있는 시스템을 도입할 필요가 있다."

"노후화된 전자문서 시스템에 대한 대비도 필요하다. 노후화된 장비는 교체하는 시스템은 존재하지만, 보관 중인 전자문서에 손상이 발생했는지 점검할 수 있는 시스템은 존재하지 않는다. 보관 중인 문서의 유실을 막기 위해 정부와 기업이 주도해서 보관 중인 전자문서의 상태를 검증할 수 있는 절차와 시스템을 도입해야 한다."

글 / IT동아 강일용(zero@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.