이는 죄수의 딜레마라는 단어로 설명할 수 있다. 먼저 죄수의 딜레마란, 두 사람의 협력적인 선택이 둘 모두에게 최선의 선택임에도 불구하고 자신의 이익만을 고려한 선택으로 인해 자신뿐만 아니라 상대방에게도 나쁜 결과를 야기하는 현상을 말한다. 죄수의 딜레마 또는 수인(囚人)의 딜레마는 1950년 미국 국방성 소속 RAND(Research and Development) 연구소의 경제학자 메릴 플로드와 멜빈 드레셔(Flood & Dresher, 1950)의 연구에서 시작된 것으로 알려져 있다. 이들은 사람들의 협력과 갈등에 관한 게임 이론과 관련된 연구와 실험들을 진행했고, 서로 협력하는 것이 가장 좋은 상황에서 서로를 믿지 못해 협력하지 않는 현상을 설명했다.
이후 1992년에 프린스턴 대학교의 수학자 앨버트 터커(Albert W. Tucker)가 게임 이론을 설명하는 강연에서 유죄 인정에 대한 협상을 벌이는 두 죄수의 상황에 적용하면서 이후 ‘죄수의 딜레마’라는 이름으로 불리고 있다. 터커가 말한 상황은 아래와 같다.
두 명의 범죄 조직원이 체포되어 왔다. 이 범죄자들은 각각 독방에 수감되었다. 경찰로서는 두 명의 공범을 기소하기 위한 증거가 부족한 상황이다. 이러한 상황에서 경찰은 이들에게서 자백을 받아 범죄를 입증할 계획을 세우고 각 범죄자들을 대상으로 신문을 한다. 이때 경찰은 두 공범에게 동일한 제안을 한다. 다른 한 명의 공범에 대해 자백을 하면 자백한 그 사람은 석방하는 반면, 다른 공범은 징역 3년을 받게 된다는 것이다. 이는 상대편 공범이 자백을 했을 경우에도 마찬가지이다. 즉, 누구든 자백을 하면 자백을 한 그 사람은 석방되지만, 상대편 공범은 3년의 징역을 받는다. 그러나 두 공범이 모두 자백을 하면 각각 징역 2년을 받으며, 둘 다 자백하지 않고 묵비권을 행사하면 각각 징역 6개월을 받게 된다.
▲경우의 수를 표로 정리함
[이미지 제작=대한민국청소년기자단 9기 하예원기자]
이것은 매우 고전적인 형태의 사례이다. 만약 자신이 이 상황에 처해있다면 어떤 선택을 할 수 있을까? 상대방이 '나'를 배신하지 않고 또한 자백하지 않을 것이라는 강한 믿음을 가지고 있다면 '나'는 묵비권을 행사할 가능성이 높다. 또한 상대편 공범도 '나'를 믿고 동일한 선택을 한다면 서로에게 최선인 결과(즉, 징역 6개월)를 얻을 것이다.
그러나 상대방을 믿지 못하면 상대방이 자백을 해서 '나' 혼자만 구형을 받는 일이 일어날까 봐 두려울 것이다. 결국 두 사람은 서로를 믿지 못하고 서로를 배신하는 자백을 하게 되고 두 사람 모두 징역 2년을 선고받을 가능성이 높다. 대부분의 사람들은 자신의 이익만을 고려하여 서로가 아닌 ‘자신’에게 최선인 선택을 한다. 그래서 서로를 배신하지 않고 협조했을 때의 결과보다 나쁜 결과를 맞게 된다.
그렇다면 끊임없이 찾아오는 죄수의 딜레마 상황에서 우리는 어떤 전략을 세워 대처해야 할까?
죄수의 딜레마는 이론으로만 존재하는 딜레마 상황으로 그치지 않는다. 개인적으로 또는 사회적으로 이와 유사한 상황은 언제든지 발생할 수 있다. 그렇다면 죄수의 딜레마 상황에서 개인이 선택할 수 있는 최선의 전략은 무엇일까? 정치 과학자 로버트 액설로드(Robert Axelrod)는 1984년에 출판한 저서 『협력의 진화(The Evolution of Cooperation)』에서 죄수의 딜레마와 같은 상황이 무수히 반복될 때 어떠한 전략이 가장 효과적인지 기술하고 있다. 액설로드는 컴퓨터 프로그램을 통해 처음부터 적대적인 선택을 하는 것 또는 상대방의 배반과 같은 선택을 용서하는 전략, 처음부터 끝까지 자신의 이익만을 위해 선택하는 전략, 상대방을 위한 이타적인 전략 등의 다양한 전략을 포함하여 죄수의 딜레마를 시행했다. 이러한 반복적인 시행 끝에 가장 효과적인(가장 많은 이득이나 점수를 획득한) 전략은 단순한 ‘팃포탯(tit-for-tat)’ 전략인 것으로 나타났다.
이것은 우리말로 쉽게 하면 ‘눈에는 눈, 이에는 이’ 전략이다. 즉, 이전에 상대방이 했던 선택을 그대로 따라 하는 것이다. 상대방이 배반을 한다면 자신도 배반을 하고, 상대방이 협동을 선택하면 나 또한 상대방을 따라 협력을 선택했을 때 가장 효과가 좋다. 팃포탯 전략에도 중요한 점이 있다. 이 전략이 효과를 발휘하려면 반드시 ‘첫 번째’ 선택에서 협동적인 선택을 해야 한다는 것이다. 액설로드는 그 밖의 효과적인 전략으로, 상대방이 배신하기 전까지 나 역시 상대방을 배반하지 않는 전략, 상대방이 설령 자신을 배반하는 선택을 한 경우에도 지속적으로 배반하는 것이 아니라면 상대방의 ‘실수’를 용서해 주는 전략 등을 제시한다.
실생활에도 죄수의 딜레마 상황은 자주 등장한다. 친구들과 삼삼오오 모여 저녁식사를 하는 상황을 떠올려 보자. 이때 자기가 주문한 음식의 값을 각자 내기로 할 수도 있고, “다같이 먹으니까 1/n로 계산하자”는 제안에 따라 돈을 똑같이 나누어 낼 수도 있다. 글랜스와 허버만(Glance & Huberman, 1994)은 이러한 상황에서 발생할 수 있는 딜레마를 ‘뻔뻔한 저녁식사의 딜레마(unscrupulous diner’s dilemma)’ 또는 ‘저녁 식사의 딜레마(diner’s dilemma)’라고 불렀다. 이것은 의사 결정 과정에서 여러 사람이 참여하는 일종의 죄수의 딜레마와 같다. 여럿이 식사를 하는 상황에서 값을 똑같이 나누어 치르기로 했다면, 옆의 친구는 비싼 스테이크를 주문하는데 나는 샐러드를 주문할 이유가 없다. 그래서 모든 사람이 상대적으로 값비싼 메뉴를 주문하고 그 결과 혼자 밥을 먹을 때보다 더 비싼 저녁식사를 하게 되는 현상을 설명한다.
딜레마 상황에 빠져 결국 모든 참가자가 손해를 보는 결과를 초래하는 것은 교육 같은 사회적 문제에도 적용될 수 있다. 옆집, 뒷집, 앞집 아이들이 모두 학원을 다니거나 사교육을 받을 때 우리 집 아이만 안 받을 수 없어 사교육을 시키고, 그 결과 사교육 과열 현상으로 인한 폐해가 모두에게 영향을 미치는 것이다. 죄수의 딜레마 상황은 상대방의 선택에 응수하기 위해 선택한 자신의 선택을, 상대방이 다른 전략을 사용하거나 다른 선택을 하기 전에 자신도 변경할 필요가 내쉬균형을 이룬다는 점에 주목해야 할 필요가 있다. 모든 사람에게 최선인 내쉬균형을 이루려면 서로에 대한 신뢰를 회복할 필요가 있으며, 상호 신뢰를 바탕으로 배반하지 않겠다는 약속이 지켜질 때 서로에게 가장 좋은 결과를 얻을 수 있다.
이렇듯 죄수의 딜레마 상황이 불쑥 찾아오더라도 대처하는 방법은 분명 있다. 로버트 액설로드가 제시한 팃포탯 전략이 무조건 정답이라는 것은 아니다. 이는 상대방과의 신뢰 관계, 처한 상황 등에 따라 얼마든지 변할 수 있다. 그러기에 순간의 기지를 발휘하여 합리적인 의사 결정을 하는 것이 가장 중요하며, 동시에 후회가 남지 않는 깔끔한 결정일 것이다.
[대한민국청소년기자단 사회부=9기 하예원기자]