[기고] IT관리자의 휴먼에러와 업무부담, RPA 자동화로 줄일 수 있다

정연호 hoho@itdonga.com

[편집자주] IT 기술이 생활 전반에 뿌리를 깊게 내리면서, 안정적인 IT시스템 관리가 필수 요소로 인식되고 있습니다. 미래 기술이라는 자율주행차와 UAM(도심형 항공 모빌리티) , 원격의료, 스마트시티나 스마트팩토리 등도 결국 IT시스템에 의해 돌아갑니다. IT시스템에 문제가 생기면 이용자 안전도 위험해질 수 있습니다. 이에 IT시스템 운영 및 관리와 관련된 업계의 이야기를 전하려 합니다. 본문 내 의견과 내용은 본지의 편집방향과 다를 수 있습니다.

알약의 랜섬웨어 차단 알림 이미지. 출처=커뮤니티 사이트
알약의 랜섬웨어 차단 알림 이미지. 출처=커뮤니티 사이트

최근 알약 오류 사건을 겪으면서 많은 직장인들이 데이터 백업의 중요성을 실감했다고 말한다. 알약 오류 사건은 공개 버전의 알약이 업데이트 이후로 정상 프로그램을 랜섬웨어로 인식하면서 시작됐다. 윈도 운영체제에 깔린 기본 프로세스를 악성코드로 오인해 PC 먹통 현상이 발생한 것이다.

이 사건에서 도출할 수 있는 인사이트는 “언제 어디서든 데이터를 보관하는 기기가 망가질 수 있다”는 점이라고 본다. 그래서 데이터는 미래를 대비해 백업이 필요하다. 필자는 IT운영관리 업계에 있으면서 DB에 데이터를 제대로 백업하지 못해 피해를 본 기업의 사례를 꾸준히 접해왔다. 데이터 백업을 제때 하지 않아 피해를 본 경우도 있고, 데이터 백업을 위한 명령어를 잘못 쳐 백업에 실패한 사례도 있었다. 심지어 명령어 오류로 DB에 저장한 데이터까지 모두 날려버린 기업도 있었다.

안타까운 일이지만 사라진 데이터를 복구하려면 엄청난 돈이 들어간다. 손실된 데이터를 모두 복구할 수 있는 것도 아니다. 백업 날짜가 지난주 수요일이고 사고가 목요일에 났다고 해보자. 그 이후의 데이터는 리커버리가 불가능하다. 데이터 백업의 실패와 손실된 데이터를 모두 복구하지 못하는 리커버리, 생각보다 기업들이 자주 겪는 일이다. IT시스템이 모든 산업에 필수가 되면서 전 영역에 걸쳐서 발생하는 일이기도 하다.

데이터백업을 비롯한 IT운영관리 작업은 지금까지 사람의 일이었지만, 기술이 발전하면서 서서히 자동화가 도입되는 추세다. 물론, 여전히 사람이 IT시스템을 운영하고 관리하는 게 일반적이다. 그렇지만, IT인력 부족의 문제로 앞으로 자동화가 대세가 될 것이란 점에는 의심의 여지가 없다.

자동화의 가장 큰 장점은 사람이 흔히 저지르는 휴먼 에러를 피할 수 있다는 것이다. 명령어 실수로 백업한 데이터마저 날리는 일을 더는 겪지 않아도 된다. 데이터 백업을 더 자주 할 수도 있다. 백업 간격이 좁아질수록 더 많은 데이터를 안전하게 보관할 수 있다.

현재 데이터 백업 과정은 새벽에 서비스를 중지시키고, 백업을 하는 방식으로 진행된다. IT관리 인력이 그 과정을 모니터링하면서 문제가 발생하면 빠르게 대응을 해야 한다. 데이터 백업을 자동화하면 사람이 그 시간에 밤을 새우면서 작업을 할 이유도 없어진다. 그만큼 백업도 더 자주 할 수 있게 된다.

이외에도, 대부분의 IT운영관리 작업은 자동화가 가능하다. 가장 많은 관심을 받는 분야가 ‘보안’이다. 기업은 보안을 위해서 서버에 접근할 수 있는 기기를 사전에 등록해 놓는다. 기업에서 사용하는 장비가 변경될 때마다 액세스 리스트를 일일이 변경해야 한다. 이 작업도 자동화를 하는 건 생각보다 간단한 일이다.

출처=엔바토엘리먼트
출처=엔바토엘리먼트

다만, 자동화를 따라다니는 불안은 ‘AI가 우리들을 대체할 수 있는 것이 아닌가?’라는 점이다. A공항의 관계자와 나눈 대화를 전하면서 이 질문에 대한 답을 하고 싶다. 사업을 하면서 알게 된 A공항의 관계자에게 “IT운영관리 작업을 자동화하면 기존 인력들은 어떻게 되나요?”라고 물었던 적이 있다. 그는 “앞으로 IT장비는 지금 있는 것의 두배는 더 많이 들어와요. 거기에도 많은 돈이 들어가는데, 이 장비를 관리할 인력도 추가로 뽑을 예산은 없는 상황이에요”라고 말했다.

그는 “현재 우리 공항의 IT인력으로 커버할 수 있는 업무가 20가지 정도밖에 안 돼요. 여기 있는 것 중 5~6개만 자동화가 된다면, 그 일을 하던 사람들이 다른 작업도 할 수 있습니다”라고 말했다.

공항은 최첨단 IT시스템을 운영하고 있으며, 시스템의 문제는 곧바로 승객의 안전 문제로 이어진다. 그만큼 IT시스템 관리에 민감할 수밖에 없다. 가령, 공항은 수 천대의 네트워크 장비를 쓰는데 이 장비는 현재 작동하는 네트워크 연결 라인 외에도 백업 라인이 마련돼 있다. 문제가 생겼을 때 백업 시스템이 정상적으로 돌아가야 승객의 안전도 보장된다.

현장에선 이 백업 라인이 잘 작동하는지 확신할 수 없다는 게 문제다. 백업 라인 작동 여부를 확인하려면 네트워크 장비에 연결된 수십 개의 포트를 하나씩 다 점검해야 한다. 그리고, 네트워크 장비는 수천 대에 달한다. 이미 많은 업무를 담당하고 있는 IT인력이 도저히 할 수 없는 일이다.

A공항의 관계자는 다른 IT운영관리를 자동화하고 이런 필수적인 업무에 IT인력을 배치하고 싶어했던 것이다. 그의 최종적인 목표는 백업 라인을 점검하는 작업 역시도 자동화하는 것이다. 그 작업은 실제로 가능한 목표다.

출처=셔터스톡
출처=셔터스톡

최근 RPA(로봇프로세스자동화)를 통해 자동화가 보편화되면서, 자동화가 오히려 업무를 가중하는 건 아니냐는 우려의 목소리도 나온다. RPA를 사용하려면 해당 기업에서 스크립트를 작성하는 역량을 갖추어야 하기 때문이다. 이후에 RPA운영관리도 솔루션을 도입한 해당 기업의 몫이다.

필자가 몸담고 있는 회사의 경우엔 이 RPA에 대한 표준 스크립트를 미리 만들어 놓는 방식으로 기술을 개선하고 있다. 표준화된 스크립트를 변경할 필요 없이 기업 장비에 바로 적용할 수 있다. 리눅스나 윈도처럼 장비별 OS에 맞춰 표준화된 RPA 스크립트를 작성했기 때문에 가능한 방식이다.

IT운영관리 기술은 빠르게 발전하고 있지만, 그 필요성에 비해 많은 관심을 받고 있지 못하고 있다. 기업의 앱이나 홈페이지는 계속 사람의 실수로 먹통이 되고 있으며, IT인력은 과중한 업무에 시달려 번아웃 증세를 호소한다. IT시스템은 앞으로 더 중요해질 것이다. 기술들이 더 발전하면서 많은 기업들이 IT시스템을 효율적으로 관리할 수 있기를 바란다.

글 / 인포플라 최인묵 대표

(주)인포플라는 인공지능과 소프트웨어 로보틱스를 IT서비스의 운영관리에 적용하여, 그간의 장애탐지 위주의 IT운영에서 벗어나 장애를 예측하고 사전에 조치하는 미래의 장애예방 시대를 앞당기고 있는 전문 기술기업이다. 최인묵 대표는 대학원에서 인공지능을 전공했으며, 활발한 창업을 통해 응용레벨 인터넷 멀티캐스트 프로토콜, 콘텐츠 아카이브 플랫폼, 인공지능 IT운영관리 플랫폼 등을 개발해오며 국내외 IT현장에서 활동해오고 있다.

정리 / IT동아 정연호(hoho@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.