UPDATED. 2024-04-23 15:17 (화)
[기획] AI 챗봇 이루다, 개인정보 노출 의혹 제기되는 이유는?
상태바
[기획] AI 챗봇 이루다, 개인정보 노출 의혹 제기되는 이유는?
  • 최명진 소비자기자
  • 승인 2021.01.11 16:28
  • 댓글 0
이 기사를 공유합니다

정보 수집에 대한 사전 고지 미비와 개인 신상정보 노출로 연일 논란
데이터 경제 시대, 개인정보 유출에 대한 경각심 가질 필요 있어

[소비라이프/최명진 소비자기자] 작년 12월 23일 출시된 AI 챗봇, ‘이루다’가 연일 화제의 중심이 되고 있다. AI 전문 스타트업 ‘스캐터랩’이 제작한 이 챗봇은 페이스북 메신저를 통해 일상적인 대화를 할 수 있으며, 사용자들과 대화를 하면서 학습하는 딥러닝 기술을 이용해 만들어졌다.

출처 : 스캐터랩
출처 : 스캐터랩

이루다와 실제 대화를 해본 결과, 기존에 존재하던 챗봇들보다 훨씬 높은 수준의 맥락 이해도와 자연스러운 문장 구사 능력을 보임을 알 수 있었다. 가령 똑같은 말을 반복할 경우 입력된 답변이 계속해서 무작위로 나오는 기존 챗봇들과는 달리, 이루다는 “자꾸 똑같은 말만 하면 나 답 안 할 거야”와 같은 현실적인 반응을 보였다. 한 이용자는 이를 “친구와 말싸움하며 노는 것 같은 느낌”이라고 표현했으며, 지난 6일 기준 누적 대화량 7,000만 건, 일일 최대 이용자 수 21만 명을 기록했다.

그러나 이러한 이루다에 대한 각종 논란이 불거지고 있다. 발단은 이루다에 대한 네티즌들의 대화가 수위를 넘고 있다는 ‘AI 성희롱’ 논란이었으나, 또 다른 문제로 개인정보 노출 우려가 지적되며 네티즌들의 반응이 악화되고 있는 상황이다. 과거 개발사 측은 실제 연인들이 나눈 대화 데이터 약 100억 건을 이루다에게 학습시켜 자연스러운 대화가 이뤄지도록 했다고 설명한 바 있다. 문제는 이 데이터가 동일 개발사의 다른 어플을 통해 수집되는 과정에서 사용자들의 충분한 동의를 얻지 못했고, 심지어는 그들의 개인정보가 챗봇 이용자에게 노출되고 있다는 점이다.

데이터를 수집한 어플은 이용자가 카카오톡 대화 자료를 넘기면 업체가 분석해 연애 조언을 제공하는 시스템이다. 해당 어플 이용자들은 자신들의 사적인 대화가 공개적인 AI 서비스 개발에 사용될 줄 몰랐다며 데이터 수집에 대한 사전 정보 고지가 미비했다고 지적한다. 실제로 서비스 가입 시 동의해야 하는 개인정보 취급 방침에는 ‘수집된 개인정보는 신규 서비스 개발에 활용될 수 있다’는 내용이 있으나, 대화와 같은 데이터 사용에 대한 별도의 공시는 존재하지 않는다. 신규 출시된 이루다가 데이터를 학습했다는 사실 또한 명확히 밝히지 않았다.

출처 : 어플의 개인정보 취급 방침
출처 : 어플의 개인정보 취급 방침

그뿐만 아니라 개인 신상정보 노출 우려도 제기되는 상황이다. 네티즌과의 대화 과정에서 사람들의 실명과 애칭, 집 주소, 금융정보 등을 그대로 공개하는 대화 캡처본이 인터넷상에서 증거 자료로 나오고 있다. 업체는 학습에 사용된 모든 데이터는 비식별화가 진행됐다고 주장하지만, “OO은행 예금주 김OO”, “OO도 OO시 OO동”과 같이 노출된 정보가 상세하기 때문에 충분히 사생활 침해라는 비판의 목소리가 나올 수 있는 부분이다.

여러 논란이 이어지자 네티즌들은 이루다 서비스를 즉각 중단할 것을 요구하는 해시태그 운동을 벌이기 시작했다. 이에 업체 측은 추가적인 알고리즘 업데이트를 통해 개인정보 보호를 강화할 것이며, 명확한 고지 및 확인 절차를 빠른 시일 내에 추가할 계획이라고 밝혔으나 어플 이용자들의 비판은 사그라들지 않고 있다.

실제 해당 어플을 자주 사용했던 이씨(22)에게 인터뷰를 요청했다. 이씨는 "분명히 어플을 홍보할 때 비밀이 보장된다고 해서 안심하고 사적인 카톡을 올렸다"고 불평하며 "앞으로 무료로 제공되는 심리 테스트나 사주도 참여하는 게 꺼려진다"라고 말했다. 또한, "요즘 데이터 수집이 빈번해지면서 개인정보의 중요성에 대한 경각심이 떨어진 것 같다"는 의견을 덧붙였다.

이러한 이루다 사례는 데이터 경제 시대에 개인정보 보호 중요성에 대한 경각심을 일깨운다는 점에서 반면교사로 삼을 수 있다. 머신 러닝 기술이 수집하는 대량의 데이터로 인해 이용자의 사생활이 침해될 수 있기 때문이다. 그러나 비교적 최신 기술인 데이터 수집과 처리에 대한 규제가 아직 미흡한 수준이라는 지적이 나오고 있는 상황이다. 빠르게 진화하는 데이터 산업 발전을 저해하지 않는 동시에, 사생활과 개인정보를 보호할 수 있는 적합한 조치가 조속히 마련돼야 하는 시점이다.

 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.