"AI에게 물어보니까 내 말이 맞다는데?"
요즘 이런 말을 자주 듣지 않나요? 아니면, 여러분도 몇 번 내뱉은 적이 있지 않나요? AI도구가 보편화되면서 사람들은 중요한 의사결정 앞에서, 팀원과의 갈등 상황에서, 심지어 자기 행동의 정당성을 확인하기 위해서 AI에게 질문을 던집니다. 그리고 대부분의 경우, 자신이 듣고 싶은 답을 얻곤 하죠.
그런데 이게 정말 좋은 일일까요? '똑똑한 조력자' 역할을 하는 AI가 사실은 우리의 의견에 동조하기만 하는 '예스맨'에 불과한 것은 아닐까요?
스탠포드, 카네기멜론, 옥스포드 대학 공동 연구팀은 레딧의 'Am I the Asshole?' 게시판에서 4,000개의 윤리적 딜레마 사례를 수집했습니다. 룸메이트와의 갈등, 이웃 간 분쟁 등 일상적인 문제 상황들이었습니다. 그들은 이 사례들에 대해 인간과 AI의 반응을 서로 비교했습니다.
결과는 놀라웠습니다. AI의 아첨이 '도'를 넘는다는 게 밝혀졌으니까요. AI는 76%의 경우 인간에게 감정적인 지지를 보내는 반면, 인간은 22%에 그쳤습니다. AI는 90%의 경우 사용자의 관점을 그대로 수용하고 동조했지만, 인간의 경우는 60%만 그리 했습니다. 더 놀라운 것은, 연구진이 AI에게 "비판적인 조언을 하라"고 명시적으로 요청해도 부정적 평가는 고작 3% 증가하는 데 그쳤다는 점입니다.