UPDATED. 2024-04-23 15:17 (화)
KT 전국망 마비 원인은 ‘EXIT’ 명령어 누락
상태바
KT 전국망 마비 원인은 ‘EXIT’ 명령어 누락
  • 조영욱 소비자기자
  • 승인 2021.11.01 09:53
  • 댓글 0
이 기사를 공유합니다

라우팅 교체 작업 중 발생한 ‘인재’
과기부, KT 작업관리체계 부실 지적
지난 25일 오전 KT의 네트워크 장애는 디도스 공격이 아닌 명령어 누락 때문인 것으로 드러났다.
지난 25일 오전 KT의 네트워크 장애는 디도스 공격이 아닌 명령어 누락 때문인 것으로 드러났다.

[소비라이프/ 조영욱 소비자기자] 지난 25일 KT 네트워크 장애의 원인이 발표됐다. 사고 조사반에 따르면 부산에서 KT 기업망 라우팅 교체 작업을 진행하던 작업자가 설정 명령어 입력과정에서 ‘EXIT’ 명령어를 누락시킨 게 원인으로 밝혀졌다. 사고 발생 후 내부 안전장치가 없어 부산, 서울을 거쳐 전국적으로 문제가 확산됐다.

KT 네트워크 장애 사고는 지난 25일 오전 11시 16분경부터 낮 12시 45분까지 약 89분간 발생했다. 과기부는 “패킷, 트래픽 분석 결과 디도스 공격은 없었다”, “대역폭 대비 충분히 수용 가능한 수준의 트래픽 유입만 있었다”고 밝혔다.

최초 KT DNS(도메인 네임 시스템) 서버에서 평소보다 트래픽이 급증한 것이 네트워크 장애로 이어졌으며, 부산 국사에서 기업망 라우터(네트워크 경로 설정 장비) 교체 작업 중, 작업자가 라우팅 설정 명령어 입력을 마무리하면서 명령어 ‘EXIT’를 누락한 것이 원인이었다.

이로 인해 1만개 내외의 내부 라우터간 경로 정보를 주고받는 ‘IS-IS 프로토콜’에 외부 라우터와 경로 정보를 주고받는 BGP 프로토콜의 수 십만개의 정보가 잘못 전송돼 오류가 발생했다. 특히, KT는 네트워크에 IS-IS 프로토콜의 잘못된 데이터 전달에 대한 안전장치가 전혀 없이 전국을 하나로 연결하고 있었고, 결국 30초 만에 네트워크 장애가 전국적으로 확대됐다.

이번 사건을 계기로 KT 내 작업관리체계가 도마위에 올랐다. 당초 라우터 교체 작업이 야간에 예정되어 있었지만 주간에 수행된 점, 작업관리자 없이 협력업체 직원들끼리 라우팅 작업을 수행하는 문제 등이다. 이런 문제를 방지하기 위해 1.2차에 걸친 사전검증 단계가 존재했으나, 사람이 직접 검토하기 때문에 오류를 발견하지 못했다. 그리고 네트워크가 차단된 가상 상태에서 오류 여부를 사전에 발견하기 위한 가상 테스트베드가 없었고, 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 없었다.

과기정통부는 이번 사고를 계기로 주요 통신사업자와 네트워크 안정성 확보방안을 마련할 계획이다. 방송통신위원회는 KT의 이용자 피해구제 방안 이행 여부를 점검하는 한편 통신장애 발생 시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안 마련을 검토 중이다.



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.