[IT운영관리] 7. "IT인프라 관리 개별 기업이 감당 어려워"...AI와 결합한 IT운영관리 필수

정연호 hoho@itdonga.com

[IT동아 정연호 기자] A 공항의 한 부서에선 50여 명의 인원이 약 6천 대에 달하는 IT장비를 관리하고 있다. 이들의 업무는 네트워크 장비 등의 IT장비가 정상적으로 작동하는지를 점검하는 것이다. 장비의 ‘Health check(헬스체크)’는 매일 진행하는 업무 중 하나인데, 관리자 20명이 함께 일을 해야 제시간 안에 끝낼 수 있다. 또한, 보안을 목적으로 장비 비밀번호도 분기별로 변경하고 있는데, 이는 관리자 20명이 달라붙어야 2주 안에 끝낼 수 있는 작업이다. 이외에도, 네트워크 설정변경, 취약점 점검, 펌웨어 업데이트 등 넘쳐나는 IT운영업무를 처리하느라 관리자 인력이 부족하다는 말이 나온다. 인건비 부담이 큰 편이라 인원을 추가로 채용하는 것도 쉽지 않다. 전체 IT시스템 관리에만 연 50억 원 이상의 인건비가 소요되고 있다. IT운영관리는 사람이 담당하는 만큼 실수가 발생할 수 있고, 인건비 부담도 점점 커지고 있기 때문에 A 공항은 IT운영관리 자동화 소프트웨어 도입에 나서게 됐다. 문제는 비용이다. 필요한 업무들을 자동화하는 데 들어가는 패키지 구매 비용만 200억 원이 넘는 것으로 추산된다.

B 기관도 늘어나는 IT운영관리 업무를 적은 인원으로 처리하면서 애를 먹고 있다. B기관에선 100여 명의 관리자가 장비 1만 대 이상을 관리 및 점검하고 있는데, 제공하는 웹서비스만 수천 개가 넘는다. 지금까지 관리자들은 웹서비스가 문제 없이 작동하고 있는지 매번 직접 모니터링해왔다. 기관 홈페이지에 들어가서 계정 로그인이 가능한지, 특정 메뉴에 접속하는데 문제가 발생하진 않는지 일일이 확인한 것이다. 모든 서비스가 정상적으로 작동하는지 실시간으로 확인하는 것은 현실적으론 불가능에 가깝다. 때문에, 문제를 보고받은 뒤 사후적인 조치를 하는 정도로 IT운영관리에 대응하는 상황이다.

IT운영관리(ITSM), 출처=셔터스톡
IT운영관리(ITSM), 출처=셔터스톡

폭증하고 있는 IT운영관리에 대한 부담은 비단 특정 기업이나 기관의 문제가 아니다. 많은 기업이 IT서비스를 제공하고 있으며, 비즈니스에 다양한 IT인프라를 도입하는 디지털전환에 나서면서 IT인프라를 최적의 상태로 관리하는 작업이 중요 이슈로 떠올랐다. IT운영관리는 IT인프라 및 서비스 전반을 관리하는 작업을 말한다. IT시스템을 작동시키는 장비와 기업의 웹서비스를 모두 관리하는 개념이다. 대표적인 IT운영관리는 장비관리, 헬스체크, 패스워드 관리, 이력관리, 백업관리, 스케줄관리, 로그관리 등이 있다. 최근의 IT운영관리는 IT시스템을 자동으로 유지하고 보수하는 것을 넘어서 장애를 예측하고 예방하는 단계까지 왔다.

최근엔 RPA(로봇프로세스자동화)를 통해서 IT운영관리를 자동화하는 방식이 널리 보급되고 있다. RPA는 단순반복 업무를 소프트웨어 로봇으로 자동화하는 기술을 말한다. 별도 장비나 하드웨어 도입 없이도 기존 시스템에 소프트웨어 봇(Bot)을 설치해 반복적인 업무를 자동화할 수 있다. Health Check나 비밀번호 변경 같은 단순반복 작업은 사람 대신 로봇이 처리하도록 자동화하는 게 더 경제적이다. IT운영관리를 맡은 담당자들은 단순반복 작업 때문에 “더 중요한 일을 하지 못한다”며 이로 인해 업무 만족도도 떨어지고 있다고 말한다. 반복되는 작업을 자동화함으로써 IT관련 인력들은 좀 더 고부가가치를 창출하는 일에 전념할 수 있게 된다.

출처=셔터스톡
출처=셔터스톡

다만, 업계에선 RPA는 단순반복 작업을 자동화하는 용도이기 때문에 IT운영관리에 최적화된 솔루션은 아니라는 지적이 나온다. 시중에서 판매되는 RPA 솔루션은 대부분 PC 윈도 운영체제에서만 작동해서 확장성이 떨어진다는 지적이다. IT운영관리의 대상은 윈도PC를 넘어 맥OS PC, 태블릿, 디스플레이, 네트워크 장비 등으로 확장되는 추세다. 다만, 범용적으로 쓸 수 있는 자동화 툴이 없어 이를 차선책으로 쓰고 있는 셈이다.

IT운영관리 서비스 ‘아이톰스’를 제공하는 인포플라의 최인묵 대표는 “IT운영관리 업무는 대개 정형화된 것들이다. 정형화된 업무별로 RPA 자동화 서비스를 만들 수 있다”면서 “아이톰스를 통해서 기업은 인력 등의 자원을 중요한 일에 집중시킬 수 있다”고 설명했다. 시중에 나온 RPA 솔루션은 제품별로 지원 가능한 기능이 다르다. 때문에, 아이톰스는 업무별로 적절한 RPA를 적용하고, 이에 대한 결과물을 기록하는 기능을 제공한다. RPA마다 기록 포맷이 달라 통합관리가 어렵다는 문제가 있었지만, 아이톰스를 통해선 작업 결과물을 통합적으로 기록해 관리할 수 있다.

인포플라는 리눅스나 윈도처럼 장비별 OS에 맞게 표준화된 RPA 스크립트를 작성하고, 이를 각 장비에 적용하는 방식을 취하고 있다. RPA를 도입하려는 기업마다 장비에 맞는 스크립트를 새로 작성할 필요 없이 표준 스크립트를 바로 사용하면 된다. 현재 아이톰스에선 패스워드 관리, 명령어 관리, 백업 관리 등의 IT운영관리 기능이 제공된다. 기존엔 이러한 관리 업무를 자동화하려면 패키지 단위로 구매를 해야 했다. 패스워드 관리를 위한 자동화 패키지를 장비 3천 대에 맞춰 구매하려면 15억 원 정도 들어간다고 한다. 아이톰스는 사용한 만큼만 비용을 지불하는 클라우드 기반이라 경제적이다. 또한, 이전처럼 자동화 업무가 필요할 때마다 개별적으로 패키지를 구매하지 않아도 된다. 아이톰스에서 업무별로 기능을 추가하면 되기 때문이다. 최 대표는 “기존 패키지 구매 방식은 비용이 많이 들어, 자동화가 널리 보급되지 않았다”고 설명했다.

최 대표는 클라우드 기반 IT운영관리 솔루션을 도입하는 것이 도입 비용 외에도 인건비와 시간을 절약하는 방법이라고 말한다. 3천 대 장비의 비밀번호를 바꾸는 데 평균적으로 14일, 패치 업데이트는 20일, 백업엔 5일이 걸리며, 이를 위한 연간 인건비만 약 4억 6천만 원 들어간다. 아이톰스를 통하면 비밀번호 변경 1일, 패치 업데이트 2일, 백업 1일로 소요시간을 10분의 1로 단축할 수 있다. 관리작업을 한 사람이 담당하면 되기 때문에 인건비는 9백 50만 원으로 줄일 수 있다. 매년 4억 5천만 원의 인건비를 아낄 수 있는 셈이다.

IT운영관리는 규모가 크면서 IT서비스를 많이 제공하는 기업만의 문제는 아닐까? 최인묵 대표의 답은 “아니다”이다. 중소기업인 C기업은 10대의 장비를 3명의 관리자가 관리하고 있다. 겉에서 보기엔 IT운영을 위한 업무부담이 그렇게 크지 않을 듯하다. 하지만, 관리자가 IT운영관리에 특화된 전문가가 아니라서 대부분의 관리를 MSP(Managed Service Provider)에 맡기고 있다. MSP는 기업의 클라우드 인프라와 클라우드 기반의 시스템을 운영 및 관리하는 IT운영서비스 사업자를 말한다. MSP는 클라우드에 대한 경험이 없고 관련 인력도 부족한 기업을 위해 IT운영관리 컨설팅과 시스템 구축, 사후관리까지 맡는다. 다만, MSP를 이용하는 기업 경영자 입장에선 IT인력이 있음에도 MSP를 통한 비용이 들어가며, 작업을 실시간 단위로 반영할 수 없다는 점이 아쉽다는 말이 나온다.

중소기업 경영진 입장에서도 IT운영관리가 매출에 직접적으로 연결이 되진 않으니 투자를 늘리기엔 어려운 측면이 있다. 그래서, 서버관리자를 뽑기보단 다른 업무도 맡고 있는 개발자가 IT운영관리 업무도 담담하도록 하는 것이다. 다만, 개발자라고 해도 IT운영관리를 위한 전문지식을 갖춘 것이 아니라 MSP를 이용하게 될 수밖에 없다. 업계 관계자들은 “이러한 중소기업이 태반이다”라고 전한다. 최 대표는 “아이톰스를 통하면 IT운영관리에 전문지식을 갖추지 않아도 버튼만 누르면 된다”고 설명했다.

AI기반의 IT운영관리 서비스 아이톰스, 출처=인포플라
AI기반의 IT운영관리 서비스 아이톰스, 출처=인포플라

최 대표는 “RPA와 인공지능(이하 AI)을 결합한 IT운영관리 서비스가 널리 보급될 것”으로 전망했다. 아이톰스도 현재 RPA를 통해서 IT운영서비스의 장애를 예측하는 기능을 제공한다. 장비 상황을 체크할 때 CPU나 메모리 자원이 얼마큼 사용되는지를 RPA가 실시간으로 점검하는 것이다. 이때, 자원에 여유가 없으면 담당인력에게 알람을 보내 이를 해결하도록 한다. 혹은, 평소 50%까지 사용되던 CPU 자원이 10%로 떨어지는 비정상적인 상황에도 이를 알린다. AI를 활용해 가까운 미래에 CPU 자원을 얼마나 쓸지도 예측할 수 있다. CPU 과부하가 예상될 때 담당인력이 사전에 대응해 IT서비스에 차질이 없도록 만드는 것이다. 이러한 운영체제의 자원을 실시간으로 관리하는 건 안정적인 IT서비스 제공을 위해선 필수적이지만, 현실적으로 담당인력이 이를 매번 모니터링할 순 없다. 그러니, 이를 AI와 RPA를 통해서 자동화하는 게 필요하다. 최인묵 대표는 이를 “문제 감지가 아니라 예측의 영역으로 넘어가는 것”이라고 설명했다.

RPA와 머신비전의 결합도 IT운영관리 서비스를 개선할 것으로 보인다. 머신비전이란 카메라 등을 이용해 대상의 이미지를 확보한 후 이를 사람처럼 검사·측정하는 기술을 말한다. 가령, 특정 홈페이지에 접속할 때 로봇이 아니라 사람임을 인증하는 ‘캡차(CAPTCHA)’의 인증코드를 RPA가 인식해, 이를 입력창에 입력할 수 있으려면 머신비전 기술이 필요하다. 기존 RPA는 홈페이지의 HTML 소스에서 홈페이지 인터페이스를 확인하는 구조였다. 이런 방식에선 웹사이트나 PC가 아닌 다른 장비에서 RPA가 동작을 하지 못한다. 최 대표 설명에 따르면, 맥OS 기반 PC, 태블릿, 디스플레이, IoT(사물인터넷) 장비 등에서도 IT운영관리 RPA를 작동시키려면 머신비전이 필요하다. 아파트에 있는 온도 조절기를 생각해보자. 이때, 영상이나 사진을 통해 온도조절기 온도를 인식할 수 있으면, 온도가 적정선보다 내려갔을 때 RPA가 온도를 조절하라는 신호를 보낼 수 있다. 최 대표는 “서버나 네트워크 장비뿐 아니라 IoT 디바이스도 함께 운영관리하는 게 인포플라의 목표이고, 기술적인 기반은 이미 갖고 있다”고 말했다.

글 /IT동아 정연호 (hoho@itdonga.com)

IT동아의 모든 콘텐츠(기사)는 Creative commons 저작자표시-비영리-변경금지 라이선스에 따라 이용할 수 있습니다.
의견은 IT동아(게임동아) 페이스북에서 덧글 또는 메신저로 남겨주세요.