AI 챗봇 '이루다' <strong>출처=이루다 페이스북(facebook.com/ai.luda)
AI 챗봇 '이루다' 출처=이루다 페이스북(facebook.com/ai.luda)
AI 챗봇 '이루다' <strong>출처=스캐터랩 홈페이지(scatterlab.co.kr)
AI 챗봇 '이루다' 출처=스캐터랩 홈페이지(scatterlab.co.kr)

AI 챗봇 ‘이루다’가 개선된 버전으로 돌아왔다. 이루다는 20대 여자 대학생의 정체성을 가진 페이스북 메신저 기반 챗봇으로, 2020년 12월 23일 처음 출시됐다. 이루다는 출시 2주 만에 약 75만 명에 달하는 이용자 수를 기록했지만 개인정보 침해, 소수자 혐오, 비속어 사용, 성희롱 등의 문제로 3주 만에 서비스를 중단한 바 있다. 

약 1년의 시간이 지난 17일, 개발사 ‘스캐터랩’은 개선된 버전의 ‘이루다 2.0’을 출시했다. 스캐터랩은 “첫 출시 당시 이루다는 20살이었으나, 시간이 흘러 현재는 21살”이라고 이루다를 소개한다. 현재 이루다는 ◆오픈 베타 서비스의 형태로 운영 중이며 예약을 통해 만나볼 수 있다. 

 

혐오 발언, 개인정보 침해… 스무 살 이루다가 소홀했던 지점들

2020년 첫 출시 직후 이루다는 여성과 퀴어, 장애인에 대한 혐오 발언으로 논란의 중심에 섰다. 여성 인권에 대해 “그렇게 중요하지 않다"고 말하고, 동성애자에 대해 “소름이 끼친다”거나 “혐오스럽다”고 표현했다. 장애인에 대해서도 혐오 발언을 일삼았다. 일부 사용자들이 챗봇을 대상으로 언어 성폭력을 행하는 현상도 나타났다.

개인정보 관련 논란도 불거졌다. 스캐터랩이 기존 채팅 서비스인 ‘연애의 과학’과 ‘텍스트앳’ 사용자의 대화 기록을 동의 없이 이루다 데이터베이스(DB)로 이용한 것이다. 스캐터랩은 기존 채팅 이용자들에게 대화 자료 수집에 대한 명시적 동의를 받지 않았을 뿐만 아니라, 개인정보를 수집 목적 외 무단으로 사용하는 불법 행위를 저질렀다. 

더욱 심각한 문제는 대화 기록에 포함된 이름, 전화번호, 계좌번호, 주소 등의 개인정보를 삭제하거나 암호화하는 등의 조치를 전혀 취하지 않았다는 것이다. 20대 여성의 대화 문장 약 1억 건은 챗봇의 응답 DB로 구축돼 발화에 사용됐으며 실제 채팅 내용에서 일반인의 개인정보가 유출되기도 했다. 스캐터랩은 이를 비롯해 총 8건의 개인정보 보호법 위반으로 개인정보위원회로부터 총 1억 330만 원의 과징금, 과태료와 함께 시정 조치를 명령받았다. 

 

스물한 살 이루다, 일년 새 모든 문제 해결됐나

2021년 4월 1일, 법무법인 태림은 이루다 개인정보 유출 피해자 254명을 대리해 스캐터랩에 손해배상 청구 소송을 제기했다. 무단으로 수집된 기존 DB가 폐기 없이 이루다2.0에도 계속 활용됐기 때문이다. 이루다2.0이 출시된 현재도 소송은 여전히 진행 중이며 피해자들의 구제는 전혀 이뤄지지 않았다. 법무법인 태림은 “피해자들의 추가적 권리 침해가 우려되는 상황”이라며 이루다의 운영 재개는 시기상조라는 견해를 밝혔다. 

이에 스캐터랩은 “이루다2.0은 새로 생성한 문장만을 활용해 말한다”고 해명했다. 대화 내용은 가명 처리와 개인정보 필터링을 거칠 뿐만 아니라 대화 문장 그대로 답변에 사용되지도 않는다는 것이다. 

 

'이루다2.0'의 답변 생성 구조 <strong>출처=스캐터랩 홈페이지(scatterlab.co.kr)
'이루다2.0'의 답변 생성 구조 출처=스캐터랩 홈페이지(scatterlab.co.kr)

해당 논의에 대해 본교 강은성 교수(사이버보안전공)는 “아쉬운 부분이 있지만 분명히 개선된 것도 많다”고 총평했다. 그는 “이루다2.0의 답변 DB 생성 구조와 절차는 잘 마련됐다”며 “개인정보 보호에 힘쓴 점이 긍정적”이라고 평했다. 하지만 동시에 “이전에 개인정보 보호법을 위반한 채 수집한 94억 건의 정보를 여전히 활용하고 있다는 점은 짚어 볼 필요가 있는 문제”라며 이루다 2.0이 법적으로 완전무결하지 않음을 지적했다. 

이루다2.0은 혐오 발언에 대해서도 이전보다 강력한 규제를 적용한다. 스캐터랩은 ‘어뷰징 탐지 모델'을 개발해 챗봇이 특정 개인 또는 집단을 모욕하거나 차별하는 표현, 선정적이거나 공격적인 표현을 사용하지 않도록 조치했다. 챗봇에 어뷰징 발언을 하면 사용자는 경고 조치를 받고, 이를 반복할 시에는 서비스 이용이 제한된다. 이러한 규제의 결과 지난 버전과 달리 이루다 2.0은 특정 집단에 대한 혐오 발언 없이 “모든 존재를 존중한다"는 발화 내용을 유지하고 있다. 

전반적 시스템 개선에 대해 강 교수는 “필터링을 거치고 이후에도 문제가 있으면 바로 신고할 수 있도록 시스템을 구축한 점은 칭찬할 만하다”면서도 “절차는 잘 거쳤지만 결과는 더 지켜봐야 한다”고 말했다. 그는 “딥러닝과 인공지능은 인풋(input)으로 아웃풋(output) 예측이 어려운 게 특징”이라며 “결과에 문제가 없을지는 아직 알 수 없다”고 덧붙였다.

 

계속해서 직면해야 할 문제 “왜 20대 여대생인가”

스캐터랩은 20대 여자 대학생이라는 이루다의 설정에 대해 “친구처럼 소통할 수 있는 챗봇을 만들고자 했다”며 “주요 소비자인 10대와 20대에게 친근하게 느껴지도록 나이와 성별을 부여했다”고 밝혔다. 하지만 일각에서는 챗봇이 20대 여대생으로 설정된 이유에 추가적인 설명을 요구했다. 강 교수도 “AI의 성별과 나이대를 규정하고 운영을 시작하는 건 특이한 현상이고 그 이유가 충분히 설명돼야 한다”고 말했다.

 

AI 챗봇 '이루다'의 모습  <strong>출처=이루다 페이스북(facebook.com/ai.luda)
AI 챗봇 '이루다'의 모습  출처=이루다 페이스북(facebook.com/ai.luda)

본교 백승민 교수(사회학과)는 “현실 서비스 직군에 여성이 많다는 사실과 여성은 친절해야 한다는 통념이 이루다에 적용된 것 같다”며 “이루다가 기존의 성역할을 답습할 뿐만 아니라 젊음에 대한 프레임을 재생산한다”고 지적했다. 그는 이루다뿐만 아니라 ◆버추얼 인플루언서 ‘로지’와 ‘릴 미켈라(Lil Miquela)’, ‘이마(Imma)’의 설정이 모두 젊은 여성이라는 것을 언급하며 가상 인간의 다양성 결여를 비판했다. ‘아름다운 20대 여성’이라는 특성이 곧 상품적 가치임을 획일화된 AI 캐릭터가 증명한다는 것이다. 또한 그는 모든 캐릭터의 외적 모습이 잘 꾸며 ‘보기 좋은’ 여성이라는 점에서 “바비의 시대를 크게 벗어나지 못하고있다”고 꼬집었다.  

강윤서(철학·21)씨는 “처음부터 주요 소비자를 정해 20대 여자 대학생으로 설정한 것은 ‘친구'라는 목적에 알맞지 않은 것처럼 보인다”며 “뿐만 아니라 이후 생겨날 문제들을 고려하지 못했다는 것도 아쉽다"고 말했다. 

염지선(커미·21)씨 역시 “20대 여성이라 이용자들에게 성희롱의 대상이 된 점이 아쉬웠다"고 말했다. 이어 “성과 연령에 구애받지 않을 때 더 다양한 사람들이 이용하지 않을까 생각했다”는 의견을 밝히기도 했다.

백 교수는 이루다의 시스템 개선에 대해 “사람들의 반응을 민감하게 받아들이고 빠르게 조치한 점”과 “사회의 비판을 수용하고 시정하려고 노력한 점”을 긍정적으로 평가했다. 

한편 그는 이루다를 둘러싼 논란이 이루다에서 끝나지 않을 것으로 예측했다. 

“기술이 발전하는 한 우리는 앞으로 계속 이런 문제들에 직면할 거예요. 가상 인간 개발은 단순하지 않습니다. 사회적 함의와 파장을 고려해야 하고, 복잡한 사회적 맥락을 반영하기 위한 노력이 중요해요.”

 

◆오픈 베타 서비스: 인터넷 기반 프로그램 출시 전 불특정 다수에게 실시하는 시범 운영

◆버추얼 인플루언서: 인공지능과 컴퓨터 그래픽을 합쳐 만든 가상의 인물 중 사회적 영향력이 큰 인물

저작권자 © 이대학보 무단전재 및 재배포 금지