[뉴스라이더] 이번엔 소방차 내비 '먹통'...행정망 연쇄 마비, 대체 왜?

[뉴스라이더] 이번엔 소방차 내비 '먹통'...행정망 연쇄 마비, 대체 왜?

2023.11.28. 오전 08:59
댓글
글자크기설정
인쇄하기
AD
■ 진행 : 안보라 앵커
■ 출연 : 염흥열 순천향대 정보보호학과 교수

* 아래 텍스트는 실제 방송 내용과 차이가 있을 수 있으니 보다 정확한 내용은 방송으로 확인하시기 바랍니다. 인용 시 [YTN 뉴스라이더] 명시해주시기 바랍니다.

[앵커]
정부 행정망 먹통사태가 연이어 발생한 데 이어서 이번에는 소방시스템이 먹통이 됐습니다. 왜 이런 일이 자꾸 발생하는지,대책은 무엇인지전문가와 함께 알아보겠습니다. 염흥열 순천향대 정보보호학과 교수와 함께이야기 나눠보겠습니다. 교수님, 어서오세요. 먼저 소방 얘기부터 해 보겠습니다. 이번에 마비된 시스템이 차량동태관리시스템, MDT 시스템이라고 하는데 이게 구체적으로 어떤 시스템인지 설명해 주세요.

[염흥열]
MDT 시스템은 서울종합방재센터가 운영하는 지역망의 일부입니다. 예를 들어서 119 신고를 접수하게 되면 서울종합방재센터에서 출동 명령하게 되고요. 그리고 소방차나 아니면 구급차의 MDT, 모바일 데이터 터미널이 있는 거고요. 그 터미널에 사고가 난 장소, 또는 화재가 난 장소를 최단 경로로 안내하는 내비게이션 시스템이라고 볼 수 있습니다.

[앵커]
보통 내비게이션에 차량이 정체된다거나 이러면 우회로로 안내해 주기도 하는데 최대한 신속하게 가는 게 목적인데 이 시스템이 마비가 됐었다는 거죠?

[염흥열]
맞습니다. 그러면 이게 보통 신속하게 사고 현장에 가서 대원들이 조치를 취하고 화재를 진압해야 되는데 그런 부분들이 늦어질 수 있는 가능성이 큰, 굉장히 중요한, 국민의 생명과 안전에 치명적인 영향을 줄 수 있는 시스템이라고 볼 수 있습니다. 보통은 지자체나 아니면 공공기관이 자기의 정보 시스템을 운영할 때 자가망을 운영하는 경우도 있고요. 자기가 별도의 네트워크를 구성해서 운영하는 경우도 있고. 외부망, KT나 아니면 다른 인터넷 사업자의 네트워크를 이용하는 경우도 있습니다. 이번 같은 경우 외부망을 이용한 경우로 알고 있습니다. 그래서 KT의 LTE 4G망이라는 것을 이용했고요.

그 4G망에 실제로 유지 보수를 하면서 장애가 발생한 걸로 생각됩니다. 그래서 실질적으로는 이 4G망이 작동하지 않으면 내비게이션 시스템이 작동하지 않은 거고요. 그러면 소방차나 아니면 구급차가 단시간 내에 현장에 출동해서 적절한 구호 조치를 취할 수 없는 그런 상황이 발생할 수 있습니다.

[앵커]
내비게이션이 한번 고장 나면 이게 얼마나 답답한지 겪어보신 분들 다 아실 것 같아요. 그런데 그게 1~2분 수준이 아니라 1시간 반이 넘게 먹통됐었기 때문에 더더욱 더 위기감이 커진 것 같습니다. 그런데 앞서 열흘 동안 정부 시스템 중에서 네 번 정도가 멈췄는데, 그중에서도 비교적 원인을 빨리 찾았습니다. 이번에는 인터넷 회선 유지관리 작업 중에 발생한 오류 때문이다는 진단이 나왔어요. 그런데 시스템이 문제라는 건지, 관리가 문제라는 건지, 어떤 게 문제라는 겁니까?

[염흥열]
저는 관리의 문제라고 보여집니다. 시스템은 언제든지 장애가 발생할 수 있습니다. 그러면 장애가 발생했을 때 얼마큼 빨리 조속한 시간 내에 원래 상태로 복구하는 게, 회복력이라고 하는데 그래서 이건 보통 단기간 내에 자동적으로 장애가 발생했을 때 바로 회복이 되어야 되는데 1시간 반 정도 지나서 회복됐다는 부분에 대해서는 소방방재본부가 네트워크 사업자들의 가용성 부분, 그러니까 서비스 가용성을 보장하기 위한 부분에서의 점검이 필요할 것으로 생각합니다.

[앵커]
교수님 말씀 중에 시스템은 언제든지 오류가 날 수 있다라고 말씀하셨잖아요. 그렇다면 이런 걸 모르지는 않았을 것 같습니다. 언제든지 작동 오류가 날 수 있기 때문에 사실상 이것이 고장 나면 이것을 백업할 수 있는 어떤 플랜B을 준비했었어야 되는데 그런 게 미흡하지 않았나 하는 지적이 나오더라고요. 왜냐하면 유선 연락을 통해서 소방대원들이 출동을 했다고 하더라고요.

[염흥열]
그렇습니다. 그래서 보통은 네트워크를 구성할 때 하나의 네트워크에서의 장비 이중화가 필요합니다. 그래서 하나의 라우터가 고장이 나면 다른 라우터를 통해서 트래픽을 잘 전달해 주는 그런 역할을 하는 부분인데요. 이번 같은 경우는 국민의 생명과 안전에 굉장히 치명적인 영향을 줄 수 있는 부분은 네트워크 이원화도 필요합니다. 그래서 예를 들어서 하나의 네트워크가 장애가 됐을 때 이번 같은 경우에는 KT의 4세대 이동통신인 LTE망이 장애가 되면 다른 통신사가 제공하는 망을 이용해서 제공할 수 있는 그런 네트워크 이원화도 장기적으로 고려할 필요성이 있지 않을까라는 생각이 듭니다.

[앵커]
교수님, 그러면 지금은 네트워크 이원화가 안 돼 있다는 말씀이신 건가요?

[염흥열]
현재는 안 돼 있는 것으로 보여집니다. 각각의 여러 어떤 부분에 있어서는 KT망을 이용하고 또 어떤 부분에 있어서 다른 망을 이용하는 그런 경우지, 두 가지를 다 이용하는 경우까지를 고려해야 한다는 생각이 듭니다.

[앵커]
그렇군요. 재발방지 대책이 무엇보다 중요할 텐데 그러면 지금 교수님께서 짚어주신 그 방법만 보완하면 이런 일이 발생하지 않을까요? 아니면 또 다른 방법이 필요할까요?

[염흥열]
네트워크를 보면 대개 어떤 서비스를 이용한 단말 부분 있고요. 그다음에 단말에서부터 서버로 트래픽을 잘 전달하는 네트워크 파트 부분이 있고요. 그다음에 그 서비스를 제공하는 서버 파트가 있습니다. 이 세 가지 부분에 장애가 발생하면 그러면 언제든지 장애는 확대될 수 있습니다. 그래서 네트워크의 이원화, 장비의 이원화를 포함해서 네트워크의 이원화도 필요하고. 또 서버에 대한 이원화도 필요하고. 장비는 항상 아까 제가 얘기했다시피 언제든지 장애가 발생할 수 있으니까 사전에 점검하고 그다음에 사전에 관리하고. 그런 사전 대응 관리 체계가 필요하고요. 장애가 발생했을 때 바로 단기간 내에 조치하는 장애 대응 체계가 고도화되어야 한다는 생각이 듭니다.

[앵커]
교수님, 앞서 라우터라는 장비를 말씀하셨는데 사실 제가 IT 쪽은 잘 알지 못해서 라우터에 대한 설명이 필요하다고 생각했습니다. 왜냐하면 지난 17일에 발생했던 행정망 마비 사태 있지 않습니까? 그때 당시 정부가 처음에 원인을 밝혔던 게 L4 스위치 때문이다, 그 문제 때문에 오류가 발생했다라고 밝혔는데 또 이게 아니래요. 이번에 새롭게 밝혀진 원인은 라우터 때문이다라고 하는데 이 라우터가 뭔지, 어떻게 문제가 된 건지 설명이 필요할 것 같습니다.

[염흥열]
그러면 라우터하고 L4 스위치를 설명을 해 보도록 하겠습니다. 우리가 라우터는 아까 얘기했듯이 단말에서부터 서버까지 네트워크를 구성하고 있고 예를 들어서 하나의 출발지에서 목적지까지 잘 전달해 주게 하는, 잘 전달하게 하는 그런 역할을 하고 있습니다.

그래서 만약에 장애가 발생하면 언제든지 우회 경로를 통해서, 라우팅 알고리즘을 통해서 우회 경로를 통해서 네트워크 트래픽이 출발지에서 목적지까지 그중에서 한 선로만 살아 있더라도, 한 경로만 살아 있더라도 잘 전달되게끔 하는 게 라우터의 역할입니다. 라우터가 망가지게 되면 트래픽이 단말에서부터 서버까지 전달이 안 되기 때문에 통신망 자체가 망가지게 됩니다.

그런데 지난번에 행안부가 얘기했던 L4 스위치라는 것은 라우터의 상위 단에서 여러 개의 서버가 존재하는데 한 서버에 트래픽이 집중되게 되면 그 서버가 감당할 수 없습니다.
그래서 노드밸런스라고 해서 서버 간에 트래픽을 균등 있게 분배해 주는 역할을 하는 게 L4 스위치입니다. 그래서 라우터는 한마디로 얘기하면 트래픽을 잘 전달하는 거, 출발지에서 목적지까지. 그게 라우터고요. 그다음에 그런 것들을 잘 균형 있게, 서버 간의 노드밸런싱을 해서 부하가 균등하게 이루어져서 서버가 잘 작동할 수 있도록 하는 게 L4 스위치라고 볼 수 있습니다.

[앵커]
교수님, 제 눈을 보고 설명해 주셨는데도 제가 이해하기가 어려워서 제가 이해한 게 맞는지 확인해 주세요. 관련 그래픽이 나가고 있습니다. 예를 들어서 지금 YTN이 있는 상암동에서 여의도까지 간다고 가정을 했을 때 갈 수 있는 교통 수단이 없잖아요. 그러면 우리가 이용할 수 있는 생각은 자가용도 있을 것이고 지하철도 있을 것이고 버스도 있을 거 아닙니까? 그러니까 이 연결하는 교통수단이 라우터라고 보면 되는 겁니까?

[염흥열]
맞습니다. 그러면 내비게이션에서 보면 여러 개의 경로를 만들어주잖아요. 예를 들어서 지하철을 타고 가는 방법 아니면 버스를 타고 가는 방법. 이런 것들을 안내해 주고 그 경로를 통해서 지나가게 해 주는 장치가 라우터라고 볼 수 있습니다.

[앵커]
그러면 L4 스위치는 여기에서 어느 역할을 한다고 보면 될까요?

[염흥열]
L4 스위치는 상암동에 도착을 했습니다. 여기 YTN에 도착했으면 어떤 트래픽이, 예를 들어서 총무부에 집중하게 오게 되면 총무부 업무가 마비될 수 있지 않겠습니까? 그러니까 총무부를 여러 개를 나눠서 거기서 여러 개 트래픽들을 분산해서 그래서 각각의 여러 개의 서버들이 각각 제 역할을 할 수 있게끔 하는 노드밸런스.

[앵커]
자가용을 많이 이용하면 차를 이용하라고...

[염흥열]
은행에서 보면 우리 은행에 도착하지 않습니까? 그러면 창구가 여러 개가 있는데 거기서 뽑아서 쓴다는 게 번호표를 뽑지 않습니까? 그게 일종의 L4 스위치의 역할을 하는 겁니다. 그래서 1번 창구로 가고 2번 창구로 가고. 똑같은 서비스를 받는데도요 그래서 1번 창구로 가서 서비스를 받고 그다음 사람이 2번 창구로 가서 서비스를 받지 않습니까? 그런 것들이 노드밸런싱의 기능입니다. 똑같이 네트워크도 트래픽들이 균등하게 분산돼야지 창구가 붐비지 않는, 마치 은행에서 창구가 붐비지 않도록 서버가 붐비지 않게끔 하는 게 L4 스위치라고 볼 수 있겠습니다.

[앵커]
제가 쉬운 개념으로 이해를 했습니다. 그렇다면 지금 당초에 정부가 문제라고 밝혔던 L4 스위치가 아니라 라우터가 원인이라고 했는데 교수님 보시기에 라우터가 원인인 것은 맞습니까?

[염흥열]
저는 태스크포스가 민관 합동으로 구성돼 있고 그래서 처음에 L4 스위치가 장애가 발생한 목요일날, 그러니까 금요일날 장애가 발생했고요. 목요일날 소프트웨어 업데이트를 했다고 했습니다. 그리고 소프트웨어 업데이트를 했기 때문에 장애가 금요일에 발생했기 때문에 L4 스위치를 의심한 것으로 보여집니다. 그리고 1차 발표할 때는 L4 스위치 장비에 오류가 있었다라고, 이렇게 장애가 있었다고 발표를 했고요.

그리고 다시 태스크포스를 구성해서 구체적으로 원인을 살펴본 모양입니다. 그런데 L4 스위치가 보통은 소프트웨어 업데이트를 하게 되면 기능이 있습니다. 원래 상태로. 우리가 윈도우11로 업데이트를 했다가 10으로 다시 되돌아가듯이요. 그래서 되돌아가는 기능이 있는데 그렇게 해서 계속 트래픽에 손실이 발생했다고 태스크포스가 조사한 모양입니다.

그래서 다시 살펴보니까 라우터 부분에 특정 포트에서 하드웨어 장애가 발생했다라고 발표를 했습니다. 그건 제가 보기에는 태스크포스가 여러 가지 다양한 시험망도 구성해 보고 그다음에 여러 가지 검증을 통해서 발표했기 때문에 저는 기본적으로 태스크포스의 결과가 타당하다고 생각합니다.

다만 전적으로 하드웨어 장애인지 아니면 포트에서... 왜 그러냐면 1500바이트 이상의 경우에는 90%는 통과 전달이 안 되고 10%만 전달됐으니까 선별적으로 트래픽이 전달됐다는 부분에 있어서는 한번 장기적인 차원에서 다시 한 번 조사할 필요성이 있지 않을까. 세밀하게 조사할 필요성이 있지 않을까 생각됩니다.

[앵커]
교수님, 전문적인 얘기를 짧은 시간 안에 다 담을 수는 없겠습니다마는 저희가 시간이 한정돼 있어서 짧게 짧게 질문을 드리면. 일단 해킹 가능성은 없는 게 맞습니까?

[염흥열]
맞습니다. 왜 그러냐면 제가 초창기부터 얘기를 했습니다마는 해킹 가능성은 상당히 낮다고 볼 수 있습니다. 왜냐하면 해킹을 하게 되면 흔적이 남는 거고요. 로그기록들이 있어서 로그기록들을 분석했을 것으로, 태스크포스가 분석을 했을 것으로 추정됩니다. 그래서 거기에서 특별하게 해킹의 흔적이 없다고 발표했기 때문에 해킹 가능성은 굉장히 낮다. 장애가 발생했다. 그 장애를 빨리 신속히 복구할 수 있는 그런 체계가 필요하다라고 볼 수 있습니다.

[앵커]
일부 전문가들이 장비가 노후돼서 그렇다, 노후화가 문제로 꼽히더라고요.

[염흥열]
네, 장비는 항상 내용연한이라는 게 있습니다. 예를 들어 7년이라는 내용연한을 지나면 기본적으로 바꿔줘야 됩니다. 왜냐하면 그게 수명이라는 거고요. 그렇지만 7년이 넘더라도 우리가 음식물 유효기간이 있지만 약간 넘어도 약속 먹듯이, 탈이 안 나듯이 7년이 넘더라도 일단 사고가 안 나면 계속 사용하는 경향이 있습니다.

왜냐하면 바꾸려고 하면 돈이 투자되고 그래서 국가정보자원관리원의 대전 분원에서 인프라하고 관련되는 정부 자원이 4200대 정도가 있다는데요. 그중에서 약 1000여 대가, 25%가 내용연한이 지났다고 보고 그중에서 7년이 넘은 내용연한이 있었던 것으로, 15대나 있었던 것으로 생각합니다.

[앵커]
예산과 관련된 문제라서 관련 논의가 더 필요할 것 같고요. 짧게, 교수님. 지금 컨트롤타워의 역할은 사실상 행안부 장관인데 장관 말고 이 분야에 전문성이 있는 전문가를 모셔서 또 다른 기구를 구성해야 되지 않느냐는 지적도 있고요. 전문가께서 보시기에 이런 사태를 막기 위해서 어떤 정부 대책이 필요한지 짧게 짚어주시죠.

[염흥열]
최근에 ISO에 정부 보안 표준이 있습니다. 거기서 중요한 개정 작업이 이뤄졌는데요. 그중에서 정보보호 이슈의 최고 책임지는 사람은 조직의 대표다. 그래서 행안부의 장관이 그 책임지는 게 맞습니다. 그렇지만 그걸 운영하는 사람들은 전문성이나 정보 보안에 대한 기본 지식이 있어야 됩니다. 미국의 경우는 각 정부 부처마다 CISO, 최고 정보보호 책임자를 운영해서 지정해 있고요.

그다음에 CISO 협의회를 백악관의 국가안보실에서 관리하고 있습니다. 그래서 가장 중요한 게 전문성, 그러니까 장애가 발생했을 때 신속히 대응할 수 있는 전문성이 있는 전문인력이 필요한 부분이 행안부예요. 그리고 그런 것들을 책임지고 항상 책임과 권한을 갖고 할 수 있는 그런 최고 CISO의 임명도 여러 가지 미국의 사례랄지 아니면 다른 표준의 사례를 고려해서 해야 될 것으로 생각합니다.

[앵커]
알겠습니다. 열흘 사이에 네 번이나 국가행정망이 마비가 돼서 국민 불안이 상당한데 이번 계기로 더 이상의 문제는 발생하지 않도록 대비책이 보완됐으면 좋겠습니다. 지금까지 염흥열 순천향대 정보보호학과 교수와 함께 말씀 나눠봤습니다. 잘 들었습니다.




※ '당신의 제보가 뉴스가 됩니다'
[카카오톡] YTN 검색해 채널 추가
[전화] 02-398-8585
[메일] social@ytn.co.kr


[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]