카카오 먹통에 무너진 일상…원인과 전망은?

김동진 kdj@itdonga.com

[IT동아 김동진 기자] 데이터센터 화재로 카카오 서비스 장애가 일어나자, 국민들의 일상이 무너졌다. 메신저와 내비게이션, 택시 호출, 백신 예약, 이메일, 게임, 결제, 검색 등 생활 속 깊숙이 스며든 카카오 서비스 전반이 먹통 상태였기 때문이다. 이번 사태로 IT 강국을 자부한 우리나라의 민낯이 여실히 드러났다는 평가가 나온다. 무엇이 문제였는지 원인과 전망을 살펴봤다.

카카오톡 오류 화면. 출처=커뮤니티
카카오톡 오류 화면. 출처=커뮤니티

이번 사태의 출발점은 지난 15일 오후 3시 19분에 발생한 SK C&C 데이터센터(경기 성남시 판교 소재) 지하 전기실 화재다. 해당 데이터센터에는 카카오 서버 3만2,000대가 입주해 있었는데, 화재 진압을 위해 전력을 차단하면서 카카오 서비스 전반이 먹통이 됐다.

경기남부경찰청 과학수사대와 국립과학수사연구원, 경기소방재난본부 등 합동감식팀은 지난 16일과 17일, 두 차례 현장 감식을 통해 현장의 폐쇄회로(CCTV)를 살폈다. 그 결과 전기실 내 배터리 1개에서 화재가 시작돼 주변으로 번진 것으로 보고 해당 배터리를 수거해 추가 분석 중이다.

카카오 먹통 관련 주요 일지. 그래픽=IT동아
카카오 먹통 관련 주요 일지. 그래픽=IT동아

배터리 1개 화재로 일상 마비…무정전 전원 장치 가동도 중단

데이터센터 전기실 내 배터리 1개에서 시작된 화재로 국민의 일상이 멈춘 셈이다. 소방당국은 초기 불길이 잡히지 않아 소방수를 써야 했고, 누전을 막기 위해 데이터센터 전체의 전원 공급 차단을 요청했다.

데이터센터에는 무정전 전원 장치(UPS, Uninterruptible Power Supply, 전자 기기의 전원이 끊겼을 때 일시적으로 전원을 유지해주는 장치. 정전 등에 대비해 전력을 일정 시간 계속해서 공급하는 역할.)가 있었다. 화재 후 30여분 동안 가동된 것으로 알려졌지만, 누전을 막으려 데이터센터 전체의 전원 공급을 차단한 탓에 이번 사태를 막지 못했다.

SK C&C 판교 데이터센터 지하 3층 전기실 내 비상 축전지가 불에 탄 모습(왼쪽), 합동감식반이 1차 현장 감식을 위해 건물로 향하는 모습. 출처=윤영찬 더불어민주당 의원 페이스북·사진공동취재단
SK C&C 판교 데이터센터 지하 3층 전기실 내 비상 축전지가 불에 탄 모습(왼쪽), 합동감식반이 1차 현장 감식을 위해 건물로 향하는 모습. 출처=윤영찬 더불어민주당 의원 페이스북·사진공동취재단

SK C&C 관계자는 “데이터센터 내 전력 공급망은 모두 연결돼 있어, 화재 층의 전원만 내려 위험을 막을 수 있는 방식이 아니다”라며 “무정전 전원 장치도 데이터센터 내의 전원을 완전 차단하면서 작동 불가 상태였다”고 설명했다.

이중화 조치했다지만…카카오 “방대한 데이터 양과 복잡한 연결로 복구 지연”

화재 발생 나흘이 지난 18일 현재에도 카카오 서비스는 아직 100% 복구되지 않았다. 전체 서비스 14개 중 11개가 복구됐다. 특히 카카오톡은 먹통 상태에서 일부 기능 정상화까지 약 12시간이 걸려, 2010년 출시 이후 최장 시간 장애라는 기록을 남겼다.

데이터센터 화재가 발생했다지만, 여러 계열사의 다양한 기능이 며칠간 먹통이 됐다라는 사실은 쉽게 납득하기 어렵다. 플랫폼 사업자들은 만일의 사태를 대비해 여러 데이터센터에 이중화 조치를 취한다. 서버와 데이터를 분산해, 한 데이터센터에서 장애 발생 시 다른 데이터센터로 즉각 전환해 서비스를 유지하는 조치다.

카카오 관계자는 “이중화 조치를 했지만 데이터의 양과 복잡도, 복구 장비의 특수성 등으로 인해 핵심 서비스의 복구가 지연되고 있다”고 해명했다. 하지만, 업계 전문가들은 납득하기 어려운 해명이라고 지적한다.

김승주 고려대 정보보호대학원 교수는 “이중화 조치를 했다 안했다로 따지기보다는, 어느 정도로했느냐로 접근해야 할 문제”라며 “이렇게까지 복구가 지연되는 것을 보면, 이중화 조치가 최고 수준은 아니었던 것 같다”고 말했다.

일례로 네이버 역시 불이 난 판교 SK C&C 데이터센터를 쓰고 있었지만, 이른 시간 안에 복구에 성공했다. 데이터센터 운영을 외주에 맡기는 카카오와 달리 네이버는 춘천 데이터센터 ‘각’ 등 자체 인프라를 운영한 덕분에 피해를 최소화했다는 평가를 받는다. 반면 카카오는 4곳의 외주 데이터센터에 서버를 분산했지만, 불이 난 SK C&C 데이터센터에 3만2,000대에 달하는 서버를 운용하며 크게 의존했기 때문에 피해를 막지 못했다는 분석이다.

네이버 데이터센터 ‘각’ 전경. 출처=네이버
네이버 데이터센터 ‘각’ 전경. 출처=네이버

제도적 허점으로 사전 차단 실패

제도적 장치로 이번 피해를 사전에 막을 순 없었을까. 현행 방송통신발전 기본법에 따르면 카카오, 네이버 등 ‘부가통신사업자’는 방송통신 재난관리 기본계획 제출 대상이 아니다.

'방송통신 재난관리 기본계획’은 과학기술정보통신부가 방송통신서비스에 관한 결함을 예방하고 방송통신재난을 신속하게 수습, 복구하기 위해 수립하는 계획이다. 현재 대상 사업자는 ▲ 기간통신사업자 ▲지상파방송 ▲종편·보도 방송채널사용사업자(PP) 등이다.

지난 2020년, 민간 데이터센터도 국가재난관리시설로 지정해 정부가 감독 조사권을 갖도록 법을 개정하려는 움직임이 있었지만, 영업 비밀과 재산권을 침해한다는 업계의 반발로 무산됐다.

사태의 재발 방지를 위해 국회 과학기술정보방송통신위원회 소속 조승래 더불어민주당 의원은 지난 17일 방송통신발전 기본법 개정안을 대표 발의했다. 카카오, 네이버 등 주요 온라인 서비스와 이들 업체의 데이터센터를 국가 재난관리 체계에 포함하는 것이 개정안의 주요 골자다.

피해 보상 논의…구상권 청구 가능성 높아

사상 초유의 서비스 먹통 사태로 카카오는 수백억 원대 손실을 본 것으로 추정된다. 여기에 브랜드 이미지 하락, 카카오톡 유저 이탈 움직임까지 보여 피해는 더 늘어날 전망이다.

카카오 측은 게임과 웹툰, 음악 등 콘텐츠 기능 장애에 관해 유료 아이템 지급, 이용 기한 연장 등의 보상안을 빠르게 발표했다. 관건은 택시기사, 자영업자 등 카카오 서비스 먹통으로 인한 소상공인의 손해를 어떻게 배상하느냐다.

이미 소상공인 연합회는 피해규모 확인을 위해 접수센터를 만들기로 했으며, 민주노총 서비스연맹 전국민주택시노동조합도 18일, 기자회견을 열어 손해배상과 재발방지 대책을 요구했다.

한편, 카카오와 데이터센터 운영사인 SK C&C 측은 이번 먹통 사태를 두고 책임 공방을 벌일 전망이다. SK C&C는 화재 진압을 위해 누전을 차단하는 과정에서 카카오를 포함한 입주사에 양해를 구하고 전력을 끊었다고 밝혔다. 반면 카카오는 일방적인 통보였고 화재 발생 직후부터 서비스 장애가 발생했기 때문에 SK C&C의 관리 소홀이라는 입장이다.

출처=각사
출처=각사

법조계에서는 카카오가 손해 배상이 시급한 소상공인 등에 선조치하고, SK C&C에 구상권을 청구하는 방식을 취할 것으로 전망한다.

윤지상 법무법인 에스 변호사는 “양사 중 어떤 쪽의 책임 소재가 더 큰지는 계약서 조항 등을 꼼꼼하게 살펴야 할 문제로, 법적 다툼이 예상된다”며 “이번 사태로 피해를 본 이용자는 유료 이용자와 무료 이용자로 나뉜다. 카카오를 기반으로 영업하거나 카카오의 유료서비스 이용자는 직접적인 피해 당사자고, 무료인 카카오톡 사용자도 메신저를 쓰지 못해 피해를 봤다고 볼 수 있다. 다만, 무료 사용자의 경우 통상적인 손해만 인정된다면 피해 액수가 아주 미미할 수밖에 없을 것으로 보여 실익이 작고, 특별손해는 카카오가 손해가 발생할 가능성을 인정했거나 알 수 있을 것으로 보여야 성립하는데 이는 인정되기 어려워 보인다”고 말했다.

이어 “카카오 서비스 약관을 보면 ‘카카오의 과실로 인해 여러분이 손해를 입게 될 경우 카카오는 법령에 따라 여러분의 손해를 배상합니다’라고 명시했다. 따라서 유료 사용자의 경우, 카카오의 과실이 인정되면, 계약상 채무불이행책임과 불법행위로 인한 손해배상을 받을 수 있다”고 말했다.

카카오 여전히 복구 중

카카오는 18일 오전 9시 기준 서비스 복구 현황 공지를 통해 ▲다음 메일 ▲다음 뉴스 일부 컬렉션 ▲톡서랍 ▲쇼핑하기 검색 기능 일부 등을 복구 중이라고 밝혔다.

지금까지 완전 복구된 서비스는 ▲카카오뱅크 ▲카카오맵 ▲카카오T ▲카카오내비 ▲카카오페이지 ▲카카오웹툰 ▲멜론 ▲카카오TV ▲카카오스타일 ▲카카오게임즈 ▲픽코마다.

현재 판교 데이터센터의 전력 공급률은 약 95%로, 카카오 측은 전력 공급률이 100%에 도달하지 못해 서비스 정상화에 어려움이 있다고 밝혔다. SK C&C 관계자는 “데이터센터 전력 공급을 내일(19일)까지 마칠 것으로 예상한다”고 말했다.

글 / IT동아 김동진 (kdj@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.