전통문화대전망 - 전통 미덕 - 게임 이론이란 무엇인가요? 비윤리적인가? 전문가들이 온다! !

게임 이론이란 무엇인가요? 비윤리적인가? 전문가들이 온다! !

게임 이론

1. 게임 이론이란 무엇입니까

게임 이론이라고도 하는 게임 이론은 투쟁이나 경쟁의 성격을 지닌 현상을 연구하는 이론이자 방법입니다. 이는 현대 수학의 새로운 분야일 뿐만 아니라 운영 연구의 한 분야.

2. 죄수의 딜레마 게임

같은 범죄를 저지른 두 명의 도둑이 경찰서에 끌려가 따로 구금됐다. 일방이 경찰에 협조해 자신과 상대방이 저지른 불법 행위를 자백하면 상대방은 경찰에 붙잡혔다. 자백하지 않으면 한쪽은 석방되고, 다른 쪽은 3년 형을 선고받게 되며, 두 쪽 모두 자백하면 양쪽 모두 1년 형을 선고받게 됩니다. 경찰 증거 불충분으로 징역 1개월을 선고받아야 한다. 두 도둑은 어떤 선택을 하게 될까요?

3. 게임이론의 발전

게임이론의 사상은 고대부터 존재해 왔으며, 고대 우리나라의 손자가 지은 『손자병법』은 군사저작일 뿐만 아니라 최초의 게임이기도 하다. 이론 논문. 게임이론은 처음에는 체스, 브릿지, 도박 등의 승패 문제를 주로 연구했지만, 게임 상황에 대한 사람들의 이해는 경험에 기초한 것일 뿐 이론으로 발전하지 못한 채 20세기 초에 정식으로 발전했습니다. . 1928년 폰 노이만은 게임이론의 기본원리를 증명하여 게임이론의 탄생을 알렸다. 1944년 폰 노이만 모겐슈테른(Von Neumann Morgenstern)의 획기적인 걸작 『게임 이론과 경제적 행동』은 2인 게임을 N인 게임 구조로 확장하고 게임 이론을 경제 분야에 체계적으로 적용함으로써 이에 대한 토대를 마련했다. 징계 시스템. 게임 이론을 논할 때, 내쉬의 대표적인 논문인 "Non-player Game"(1950), "Non-Cooperative Game"(1951) 등은 게임 이론의 천재인 내쉬(Nash)를 무시할 수 없습니다. 그리고 정리의 존재. 또한 셀튼(Selton)과 하사니(Hassani)의 연구는 게임이론의 발전을 촉진하는 데에도 한 몫을 했다. 오늘날 게임 이론은 비교적 완전한 주제로 발전했습니다.

4. 게임이론의 기본 개념

1) 게임 요소

(1) 플레이어(Player): 경쟁이나 게임에서는 의사결정권을 가진 모든 참가자가 플레이어피플이 됩니다. 2명이서 하는 게임 현상을 '2인용 게임'이라고 하고, 2명 이상인 경우를 '멀티플레이어 게임'이라고 합니다.

(2) 전략: 게임에서 각 플레이어는 실용적이고 실현 가능한 완전한 행동 계획을 가지고 있습니다. 즉, 계획은 특정 단계의 행동 계획이 아니라 다음 단계를 안내하는 계획입니다. 전체 행동, 게임 내에서 플레이어가 처음부터 끝까지 계획한 실행 가능한 행동 계획을 게임 내 플레이어의 전략이라고 합니다. 게임에 참여하는 모든 사람이 항상 제한된 수의 전략을 갖고 있는 경우 이를 "유한 게임"이라고 하고, 그렇지 않으면 "무한 게임"이라고 합니다.

(3) 이익과 손실: 결국 게임의 결과를 이득 또는 손실이라고 합니다. 게임이 끝날 때 각 플레이어의 이득 또는 손실은 플레이어 자신이 선택한 전략과 관련될 뿐만 아니라 게임에서 플레이어가 채택한 일련의 전략과도 관련됩니다. 게임 전반에 걸쳐 각 플레이어의 "득실"은 모든 플레이어가 채택한 일련의 전략에 따라 달라지며 일반적으로 보상 기능이라고 합니다.

(4) 게임 참여의 경우. 플레이어에게는 게임 결과가 있습니다.

(5) 게임에는 균형이 포함됩니다. 경제학에서 균형은 수요와 공급 관계에서 해당 수량의 안정적인 값을 의미합니다. , 특정 가치가 존재합니다. 상품 시장에서 특정 가격으로 상품을 사고 싶은 사람은 누구나 그것을 살 수 있고, 그것을 팔고 싶은 사람은 누구나 그것을 팔 수 있습니다. 그러면 우리는 상품의 수요와 공급이라고 말합니다. 소위 내쉬 균형에 도달했습니다.

내쉬 균형: 전략 조합에서 모든 참가자는 다른 사람들이 자신의 전략을 바꾸지 않는 상황에 직면합니다. 즉, 이때 전략을 변경하면 지불금이 감소하게 됩니다. 내쉬 균형점에서는 모든 합리적인 플레이어가 혼자서 전략을 변경하려는 충동을 갖지 않습니다. 증명은 "게임 균형 쌍"이라는 개념의 도입입니다. 소위 "균형 쌍"은 2인 제로섬 게임에서 플레이어 A가 최적의 전략 a*를 채택하고 플레이어 B도 최적의 전략을 채택한다는 것을 의미합니다. 전략 b. *, 플레이어 A가 여전히 b*를 채택하지만 플레이어 A가 다른 전략 a를 채택하는 경우 플레이어 A가 원래 전략 a*를 채택하면 지불금을 초과하지 않습니다.

이러한 방식으로 "균형 쌍"은 다음과 같이 명확하게 정의됩니다. 전략 a*(전략 집합 A에 속함)와 전략 b*(전략 집합 B에 속함)를 균형 쌍이라고 합니다. 임의의 전략 a(전략 세트 A에 속함) 및 전략 b(전략 세트 B에 속함)에는 항상 짝수 쌍(a, b*) ≤ 짝수 쌍(a*, b*) ≤ 짝수 쌍(a*, b)

넌제로섬 게임에 대해 다음과 같은 정의도 있습니다. 전략 a*(전략 세트 A에 속함)와 전략 b*(전략 세트 B에 속함) 쌍을 호출합니다. 제로섬이 아닌 게임의 균형 쌍 모든 전략 a(전략 집합 A에 속함)와 전략 b(전략 집합 B에 속함)에는 항상 다음과 같은 쌍이 있습니다. 플레이어 A(a, b*) ≤ 쌍( a*, b*); 플레이어 B의 쌍(a*, b) ≤ 쌍(a*, b*)입니다.

위의 정의를 통해 우리는 즉시 Nash의 정리를 얻습니다.

유한 순수 전략을 사용하는 2인 게임에는 적어도 하나의 균형 쌍이 있습니다. 이 균형을 내쉬 균형점이라고 합니다.

내쉬 정리의 엄밀한 증명에는 경제 균형 연구의 주요 도구인 고정점 이론의 활용이 필요합니다. 일반인의 관점에서 보면 평형점의 존재를 찾는 것은 게임의 고정점을 찾는 것과 같습니다.

내쉬 균형점 개념은 게임 이론 연구가 게임 구조에서 보다 의미 있는 결과를 찾을 수 있도록 하는 매우 중요한 분석 방법을 제공합니다.

그러나 내쉬 균형점의 정의는 일방적으로 전략을 변경하고 싶지 않은 모든 플레이어에 국한되며, 다른 플레이어가 전략을 변경할 가능성을 무시하므로 많은 경우 내쉬 균형이 성립됩니다. point 설득력이 없어 연구자들은 이를 '순진하고 귀여운 내쉬 평형점'이라고 생생하게 표현하고 있다.

R. Selten은 다중 균형에서 특정 규칙에 따라 불합리한 일부 균형점을 제거하여 두 가지 세련된 균형 개념, 즉 하위 게임 완전 균형과 떨리는 손 균형을 형성했습니다.

2) 게임의 종류

(1) 협력 게임 - 협력할 때 협력을 통해 얻은 이익을 어떻게 배분하는지, 즉 소득 분배의 문제를 연구한다.

(2) 비협조적 게임 - 이해관계가 서로 영향을 미치는 상황, 즉 전략 선택 문제에서 사람들이 자신의 이익을 극대화하기 위해 어떻게 결정을 선택하는지 연구합니다.

(3) 완전한 정보와 불완전한 정보 게임: 참가자가 전략 공간과 모든 참가자의 전략 조합에 따른 지불에 대해 충분한 지식을 갖고 있는 경우 이를 완전 정보라고 하며, 그렇지 않은 경우에는 불완전한 정보라고 합니다. 정보.

(4) 정적인 게임과 동적인 게임

정적인 게임: 플레이어가 동시에 행동을 취하거나 순서가 있지만 후자의 플레이어가 전략을 알지 ​​못하는 것을 말한다. 첫 번째 배우.

다이나믹 게임: 양측의 행동이 순차적으로 이루어지며 뒤의 행위자가 첫 번째 행위자의 전략을 알 수 있음을 의미합니다.

재산 분배 문제와 샤플리 가치(Shapley value)

이런 협동 게임을 생각해 보세요: a, b, c, 100만 달러를 어떻게 분배할지 투표로 결정하고, 그들은 각각 50%를 소유합니다. , 40%, 10% 권력, 특정 계획은 투표의 50% 이상이 승인해야 통과될 수 있다고 규정하고 있습니다. 그렇다면 분배는 어떻게 합리적일까요? b200,000, c0...

힘 지수: 결정을 내릴 때 각 의사 결정자의 힘은 승리하는 동맹에 있는 "핵심 참가자"의 수에 반영됩니다. 참가자"를 권력 지수라고합니다.

Shapley 값: 다양한 동맹 주문에서 참가자의 동맹에 대한 한계 기여도의 합을 다양한 가능한 동맹 조합으로 나눈 값입니다.

시퀀스 abc acb bac bca cab cba

주요 참가자 a c a c a b

이로부터 a, b, c의 Shapley 값은 다음과 같이 계산됩니다. 각각 4/6, 1/6, 1/6

따라서 a, b, c는 각각 1백만의 2/3, 1/3, 1/3을 받아야 합니다.

5. 게임 이론의 중요성

게임 이론의 연구 방법은 수학적 도구를 사용하여 사회 및 경제 현상을 연구하는 다른 많은 학문과 동일합니다. 그들은 복잡한 현상에서 기본 요소를 추출하고 이러한 요소의 수학적 모델을 공식화합니다. .분석을 수행한 후 상황에 영향을 미치는 다른 요소를 점차 도입하여 결과를 분석합니다.

다양한 추상화 수준을 바탕으로 표준형, 확장형, 특성함수형의 세 가지 게임 표현 방식이 형성되어 있으며, 이 세 가지 표현 형식을 활용하여 다양한 문제를 연구합니다. 따라서 이를 '사회과학의 수학'이라 부른다. 이론적으로는 게임이론은 이성적 행위자들의 상호작용을 연구하는 형식이론으로, 실제로는 경제학, 정치학, 사회학 등에 침투하여 사용되고 있다. 사회과학에 다양하게 적용된다.

1. 게임 이론은 개인이나 조직이 특정 환경 조건과 특정 규칙에 따라 자신의 행동이나 전략을 선택하고 그에 상응하는 결과를 얻는 과정을 의미합니다. 서로 이익을 얻는다는 것은 경제학에서 매우 중요한 이론적 개념이다.

게임이론이란 무엇인가? 옛말에 있듯이, 세상의 모든 것은 체스와 같습니다. 인생의 모든 사람은 체스 선수와 같으며, 그들이 취하는 모든 행동은 보이지 않는 체스판 위에 말을 놓는 것과 같습니다. 만든 체스 게임. 게임이론은 체스 선수의 수법 중 이성적이고 논리적인 부분을 연구하고 이를 과학으로 체계화하는 학문이다. 즉, 개인이 복잡한 상호작용 속에서 어떻게 가장 합리적인 전략에 도달하는지에 대한 연구이다. 실제로 게임이론은 고대 게임이나 체스, 포커 등의 게임에서 파생되었습니다. 수학자들은 자체 완성형 논리적 프레임워크와 시스템을 구축하여 특정 문제를 추상화하고 해당 법칙과 변화를 연구합니다.

이것은 쉬운 일이 아닙니다. 가장 간단한 2인 게임을 예로 들어보겠습니다. 잠시 생각해 보면 여기에는 많은 미스터리가 있다는 것을 알 수 있습니다. 두 당사자가 모든 움직임을 정확하게 기억한다고 가정합니다. 체스 선수의 경우 A가 움직일 때 이기기 위해서는 B의 생각을 신중하게 고려해야 하고 B도 움직일 때 A의 생각을 고려해야 합니다. A 또한 B가 자신의 생각을 생각하고 있다고 생각해야 하며, 물론 B도 A가 자신이 A에 대해 생각한 것을 생각했다는 것을 알고 있습니다...

그런 혼란에 직면한 게임 이론은 어떻게 시작될 수 있습니까? 문제를 분석하고 해결하며 현실의 요약으로서 추상적인 수학적 문제에 대한 최적의 솔루션을 찾는 방법을 이론적으로 안내 실습이 제공하는 가능성은 무엇입니까? 현대 게임 이론은 1920년대 헝가리의 위대한 수학자 폰 노이만(von Neumann)에 의해 창시되었으며, 1944년 그와 경제학자 오스카 모겐슈테른(Oscar Morgenstern)은 현대 시스템의 발전을 알리는 걸작인 "게임 이론과 경제적 행동"을 출판했습니다. 비협조적이고 순수한 경쟁 게임의 경우, 노이만은 두 사람이 체스나 탁구를 하는 것처럼, 한 사람이 이기면 다른 사람은 손해를 봐야 하는 것처럼 2인 제로섬 게임만 해결할 수 있습니다. 여기서 추상화된 게임 문제는 플레이어 세트(두 당사자), 전략 세트(모든 움직임) 및 이익 세트(승자와 패자)가 주어지면 이론적 "해결책" 또는 "균형"을 찾을 수 있는 방법과 방법입니다. ", 즉 관련된 양 당사자 모두에게 가장 "합리적"이고 최적의 구체적인 전략은 무엇입니까? "합리적"이란 무엇입니까? 전통적인 결정론의 "최소 최대" 기준을 적용하면, 즉 게임의 각 당사자는 모든 상대 전략의 기본 목적이 자신의 손실을 최대화하고 그에 따라 자신의 전략을 최적화하는 것이라고 가정하고 있으며, 이는 특정 선형을 통해 수학적으로 증명되었습니다. 모든 2인 제로섬 게임에서는 "최소-최대 솔루션"을 찾을 수 있습니다. 특정 선형 연산을 통해 두 경쟁 당사자는 확률 분포 형태의 최적 전략의 각 단계를 무작위로 사용하고 궁극적으로 서로 최대의 동등한 이익을 얻을 수 있습니다. 물론, 이 최적의 전략이 게임 내 상대의 작전에 의존하지 않는다는 것이 함축된 의미입니다. 일반인의 관점에서 보면, 이 유명한 최소-최대 정리에 구현된 기본 "합리적" 사고는 "최선을 희망하고 최악에 대비"하는 것입니다.

2. 경제학에서 '돼지의 보수'는 게임이론의 유명한 예이다.

이 예는 돼지우리에 돼지 두 마리, 큰 돼지 한 마리, 작은 돼지 한 마리에 관한 것입니다. 돼지우리 한쪽에는 페달이 있습니다. 페달을 밟을 때마다 소량의 사료가 돼지우리 반대편의 먹이 공급 포트에서 떨어져 나옵니다. 한 마리의 돼지가 페달을 밟으면 다른 돼지가 반대편에 떨어지는 먹이를 먼저 먹을 기회를 얻게 됩니다. 작은 돼지가 페달을 밟으면 큰 돼지는 여물통으로 달려가기 직전에 모든 음식을 먹습니다. 큰 돼지가 페달을 밟으면 큰 돼지가 먹이를 향해 달려갈 가능성이 여전히 있습니다. 작은 돼지가 떨어진 음식을 다 먹기 전에 여물통을 뒤져 남은 음식의 절반을 차지하기 위해 싸우고 있습니다.

그렇다면 두 돼지는 각각 어떤 전략을 취하게 될까요? 대답은 다음과 같습니다. 작은 돼지는 "히치하이킹" 전략을 선택할 것입니다. 즉, 물통 옆에서 편안하게 기다리는 반면, 큰 돼지는 약간의 스크랩을 위해 지칠 줄 모르고 페달과 물통 사이를 돌진합니다.

이유는 무엇인가요? 왜냐하면 돼지가 페달을 밟으면 아무것도 얻지 못하지만, 페달을 밟지 않으면 음식을 얻을 것이기 때문입니다. 작은 돼지의 경우, 큰 돼지가 페달을 밟든 안 밟든 항상 페달을 밟지 않는 것이 좋은 선택입니다. 반면에 큰 돼지는 작은 돼지가 페달을 밟지 않을 것이라는 것을 이미 알고 있었기 때문에 페달을 밟지 않는 것보다 스스로 페달을 밟아야 했습니다.

'작은 돼지가 누워있고, 큰 돼지가 달리는' 현상은 스토리 속 게임 규칙 때문에 발생한다. 규칙의 핵심 지표는 매번 떨어지는 물건의 수와 페달과 공급 포트 사이의 거리입니다.

핵심지표가 바뀌어도 돼지우리에는 '작은 돼지가 누워있고, 큰 돼지는 달리는' 장면이 계속 나올까? 시도 해봐.

변경 계획 1: 감축 계획. 원래 양의 절반만 먹이세요. 그 결과 작은 돼지도, 큰 돼지도 페달을 밟지 않았습니다. 작은 돼지가 밟으면 큰 돼지가 음식을 다 먹고, 큰 돼지가 밟으면 작은 돼지가 다 먹습니다. 페달을 밟는 사람은 상대방에게 음식을 제공한다는 의미이므로 누구도 페달을 밟을 동기가 없습니다.

돼지를 더 많이 페달을 밟게 만드는 것이 목적이라면 이 게임 규칙의 설계는 분명히 실패한 것입니다.

변경 계획 2: 점진적 계획. 원래 양의 두 배를 먹이십시오. 결과적으로 작은 돼지와 큰 돼지가 모두 페달을 밟게 됩니다. 먹고 싶은 사람은 누구나 페달을 밟을 것입니다. 어쨌든 상대방이 음식을 한 번에 끝내지 않거든요. 작은 돼지와 큰 돼지는 상대적으로 물질이 풍부한 '공산주의' 사회에 살고 있는 것과 같기 때문에 그들의 경쟁의식은 그리 강하지 않습니다.

게임 룰 설계자 입장에서는 이 룰의 비용이 상당히 높으며(매번 음식의 두 배 제공) 경쟁이 심하지 않기 때문에 돼지를 더 많이 페달을 밟게 하는 효과가 있습니다. 효과적이지 않습니다.

변경 계획 3: 축소 및 교대 계획. 원래 양의 절반만 공급하되 공급 포트를 페달에 더 가깝게 이동하십시오. 그 결과, 작은 돼지와 큰 돼지 모두 페달을 밟기 위해 필사적으로 안간힘을 쓰고 있었습니다. 기다리는 사람은 아무것도 얻지 못하지만, 더 열심히 일하는 사람은 더 많이 얻습니다. 각 수확물은 소비됩니다.

게임 디자이너에게는 이것이 최고의 솔루션입니다. 비용은 높지 않지만 이익은 최대입니다.

원작 '스마트 돼지 게임' 스토리는 경쟁에서 가장 약한 플레이어(돼지)가 기다리는 것이 최선의 전략이라고 생각하도록 영감을 주었습니다.

그러나 사회적으로는 돼지가 경쟁에 참가하지 못하여 히치하이크를 했을 때 사회적 자원의 배분이 최적의 상태가 아니었습니다. 자원을 가장 효율적으로 배분하기 위해 규칙을 설계하는 사람들은 누구도 무임승차하는 것을 원하지 않으며, 이는 정부에게도 해당되며 회사의 상사에게도 마찬가지입니다. '무임승차' 현상이 완전히 해소될 수 있을지는 게임 룰의 핵심 지표가 적절하게 설정되었는지에 달려 있다.

예를 들어 회사의 인센티브 시스템은 주식보유와 옵션을 포함한 너무 많은 보상으로 설계되어 있습니다. 회사 직원 모두가 백만장자가 되었습니다. 높은 비용은 말할 것도 없고 직원들의 열정도 높지 않습니다. 매우 높아야 합니다. 이는 '똑똑한 돼지 게임'

증분 계획에서 설명한 상황과 동일하다. 그러나 보상이 강하지 않고 모든 사람이 그것을 본다면(일하지 않는 "작은 돼지"도 있습니다), 한때 열심히 일했던 큰 돼지는 동기를 갖지 못할 것입니다. "똑똑한 돼지 게임" 감소 계획처럼 설명된 상황. 최고의 인센티브 메커니즘 설계는 계획 3을 변경하는 것과 같습니다. 보상은 모든 사람이 공유하지 않고 개인을 직접 대상으로 하며(예: 비례적인 비즈니스 수수료) 비용을 절감할 뿐만 아니라(회사의 경우) 예를 들어) '무임승차' 현상도 제거하고 효과적인 인센티브를 얻을 수 있습니다.

많은 사람들이 '스마트 돼지 게임'의 스토리를 읽지 않았지만 의식적으로 Piggy의 전략을 사용하고 있습니다. 딜러가 세단 의자를 들어주기를 기다리는 주식 시장의 소매 투자자; 산업 시장에서 수익성 있는 신제품의 출현을 기다리고 이를 대규모로 모방하여 이익을 창출하지는 않지만 회사의 사람들. 결과 등을 공유합니다. 따라서 다양한 경제 경영 게임 규칙을 수립하는 사람들은 '스마트 돼지 게임'의 지표 변화에 대한 원리를 철저히 이해해야 합니다.

3. 배경 지식: 내쉬 게임 이론의 원리와 적용

2002년 3월 21일 17:44 베이징 이브닝 뉴스

1950년과 1951년의 내쉬 비협조적 게임 이론에 관한 두 가지 중요한 논문은 사람들이 경쟁과 시장에 대해 생각하는 방식에 혁명을 일으켰습니다. 그는 비협조적 게임과 그 균형해를 증명했고, 그 유명한 내쉬균형인 균형해의 존재도 증명했다. 이는 게임 균형과 경제적 균형 사이의 본질적인 관계를 드러냅니다. 내쉬의 연구는 현대 비협조적 게임 이론의 초석을 놓았고, 후속 게임 이론 연구는 기본적으로 이 주요 노선을 따랐습니다. 그러나 내쉬의 천재성 발견은 폰 노이만에 의해 단호히 거부되었고, 그 이전에는 아인슈타인으로부터 냉대를 받았다. 하지만 마음속으로 권위에 도전하고 권위에 반항하는 성격이 내쉬를 자신의 관점에 고수하게 만들었고 결국 마스터가 되었습니다. 30년 넘게 심각한 정신질환을 앓지 않았다면 그는 노벨상 시상대에 섰을 것이고, 이 영광을 누구와도 공유하지 못했을 것입니다.

내쉬는 매우 재능 있는 수학자였습니다. 그의 주요 공헌은 1950년부터 1951년까지 프린스턴에서 박사 학위를 취득하는 동안 이루어졌습니다. 그러나 그의 천재적인 발견, 즉 비협조적 게임의 균형, 즉 "내쉬 균형"이 항상 순조롭게 진행된 것은 아닙니다.

1948년 내쉬는 수학 박사 학위를 취득하기 위해 프린스턴 대학교에 진학했습니다. 그해 그는 아직 20세가 되지 않았습니다. 당시 프린스턴에는 뛰어난 사람들과 거장이 가득했습니다. Einstein, von Neumann, Levshetz(수학과장), Albert Tucker, Alonzo Church, Harold Kuhn, Norman Steenroed, Elf Fox...등이 모두 여기에 있습니다. 게임이론은 주로 von Neumann(1903-1957)에 의해 창안되었습니다. 그는 헝가리 태생의 재능 있는 수학자였습니다. 그는 경제 게임 이론을 만들었을 뿐만 아니라 컴퓨터도 발명했습니다. 20세기 초부터 체르멜로(Zermelo), 보렐(Borel), 폰 노이만(von Neumann)은 게임의 정확한 수학적 표현을 연구하기 시작했습니다. 폰 노이만이 경제학자 오스카(Oskar Morgenstern)를 만나고 그의 협력으로 게임 이론이 세상에 등장했습니다. 경제학의 넓은 분야.

1944년 오스카 모르겐스턴과 공동 집필한 그의 걸작 『게임 이론과 경제적 행동』의 출판은 현대 시스템 게임 이론의 초기 형성을 알렸습니다. 게임 속성 문제에 대한 연구는 19세기 또는 그 이전까지 거슬러 올라갈 수 있습니다. 예를 들어, 1838년 Cournot의 단순 이중 독점 게임, 1883년 Bertrand 및 1925년 Edgeworth는 2,000여 년 전 중국의 유명한 군사 전략가 Sun Wu의 후손인 두 명의 과두제의 생산량과 가격 독점을 연구했습니다. Tian Ji가 경마에서 승리하도록 돕는 방법 등은 초기 게임 이론의 모든 세균으로 산발적이고 단편적인 연구가 특징이며 기회가 많고 체계적이지 않습니다. von Neumann과 Morgenstern이 저서 "Game Theory and Economic Behavior"에서 제안한 표준, 확장 및 협동 게임 모델 솔루션의 개념과 분석 방법은 이 분야의 이론적 토대를 마련했습니다. 협력 게임은 1950년대에 정점에 이르렀습니다. 그러나 노이만의 게임 이론은 너무 추상적이기 때문에 그 적용 범위가 점점 더 많이 제한되어 왔습니다. 따라서 수학자들은 제한적인 영향력을 갖고 있습니다. 비협조적 게임인 "내쉬 균형(Nash Equilibrium)"이 탄생한 것은 바로 이때였으며, 이는 게임 이론의 새로운 시대의 시작을 알렸습니다! 내쉬는 단계별 학생이 아니었고 종종 수업을 빼먹었습니다.

그의 반 친구들의 회상에 따르면 그들은 Nash와 함께 완전한 필수 과정을 수강한 때를 기억할 수 없었지만 Nash는 적어도 Steenrod의 대수 위상수학을 수강했다고 주장했습니다. Steenrod는 이 주제의 창시자였습니다. 그러나 몇 번의 수업 후에 Nash는 이 과정이 자신의 취향에 맞지 않는다고 결정했습니다. 그래서 그는 다시 떠났다. 그러나 내쉬는 결국 비범한 재능을 지닌 비범한 사람이었습니다. 그는 위상수학, 대수기하학, 논리학, 게임이론 등 수학계의 모든 분야에 폭넓게 손을 대었고 그것에 깊이 매료되었습니다. 내쉬는 공격적인 학문적 야망으로 가득 찬 특유의 자신감과 오만함을 자주 보여주었습니다. 1950년 여름 내내 내쉬는 스트레스가 많은 시험을 처리하느라 바빴고, 그의 게임 이론 연구 작업은 이것이 엄청난 낭비라고 느꼈습니다. 그들은 이 일시적인 "포기"가 원래 모호하고 지저분하며 실이 없는 아이디어를 잠재의식의 지속적인 생각 아래 점차적으로 명확한 실마리로 만들고 갑자기 영감이 왔다는 사실을 거의 알지 못했습니다! 올해 10월, 그는 갑자기 생각과 꿈이 급증하는 것을 느꼈다. 가장 눈부신 하이라이트 중 하나는 나중에 "내쉬 균형"이라고 불리는 비협조적 게임 균형 개념입니다. 내쉬의 주요 학문적 기여는 1950년과 1951년에 작성된 두 편의 논문(박사 학위 논문 포함)에 반영되어 있습니다. 1950년에 그는 자신의 연구 성과를 '비협조적 게임'이라는 제목의 장문의 박사학위 논문으로 집필했고, 1950년 11월 국립과학원 월간지에 이를 게재해 즉각 센세이션을 일으켰다. 그러고 보니 이게 다 형 데이비드 게일 덕분이었다. 폰 노이만에게 얕잡아 본 지 불과 며칠 만에 게일을 만나 폰 노이만의 '최소 최대 원리'(미니맥스 솔루션)를 변형시켰다고 했다. 비협조적 게임 분야를 연구하여 일반화된 방법과 균형점을 찾았다. Gale은 주의 깊게 들었고 마침내 Nash의 아이디어가 von Neumann의 협동 게임 이론보다 실제 상황을 더 잘 반영한다는 것을 깨달았고, 그 엄격하고 아름다운 수학적 증명에 깊은 인상을 받았습니다. 게일은 먼저 출판되는 것을 피하기 위해 그것을 편집하고 즉시 출판할 것을 제안했습니다. 어린 소년 내쉬는 경쟁의 위험성에 대해 전혀 몰랐고 이런 일을 할 생각도 한 번도 해본 적이 없었습니다. 결국 게일은 그의 '대리인' 역할을 맡아 그를 대신해 과학아카데미에 문자 메시지 초안을 작성했고, 학과장 레브셰츠는 직접 원고를 과학아카데미에 제출했다. Nash는 많은 기사를 쓰지 않고 몇 개만 썼지만 그것만으로도 충분했습니다. 왜냐하면 그것들은 모두 최고 중의 최고였기 때문입니다. 이것은 또한 우리가 깊이 생각해 볼 가치가 있는 것입니다. 중국의 한 교수는 '핵심 저널'에 다수의 논문을 게재해 달라는 요청을 받았습니다. 이 표준에 따르면 Nash가 반드시 자격을 갖춘 것은 아닐 수도 있습니다.

1996년 노벨 경제학상 수상자인 모리스는 옥스퍼드대학교 에지워스 경제학과 석좌교수로 재직할 당시 어떤 논문도 발표하지 않았다. 특별한 재능을 가진 사람은 특별한 선발 방식을 가지고 있을 것이다.

내쉬는 대학 시절부터 순수 수학적 게임 이론 연구에 전념하기 시작했고, 1948년 프린스턴 대학에 입학한 뒤 더욱 편안해졌다. 20대 초반에 그는 세계적으로 유명한 수학자가 되었습니다. 특히 경제 게임 이론 분야에서 그는 획기적인 공헌을 했으며 폰 노이만 다음으로 가장 위대한 게임 이론의 대가 중 한 사람입니다. 그가 제안한 유명한 내쉬 균형 개념은 비협조적 게임 이론에서 중심적인 역할을 합니다. 게임 이론에 대한 후속 연구자들의 기여는 모두 이 개념에 기초를 두었습니다. 내쉬 균형의 제안과 지속적인 개선은 게임 이론이 경제, 경영, 사회학, 정치학, 군사학 및 기타 분야에서 널리 사용될 수 있는 탄탄한 이론적 기반을 마련했습니다.

죄수의 딜레마:

"죄수의 딜레마" 정보

게임 이론에서 지배적인 전략적 균형의 유명한 예는 Tucker가 제시합니다. "죄수의 딜레마" " 게임 모델이 개발되었습니다. 이 모델은 경찰관과 도둑에 관한 이야기를 특별한 방식으로 알려줍니다. 두 명의 도둑 A와 B가 공동으로 범죄를 저지르고 개인 주택에 침입하여 경찰에 체포되었다고 가정해 보겠습니다. 경찰은 심문을 위해 두 사람을 서로 다른 두 방에 배치했으며, 각 용의자에 대해 경찰 정책은 범죄 용의자가 범죄를 자백하고 훔친 물건을 넘겨주면 증거가 확정되고 두 사람 모두 유죄로 판결된다는 것입니다. 만약 상대방 피의자도 자백하면 두 사람 모두 징역 8년을 선고받고, 상대방 피의자가 자백하지 않고 부인하면 공무방해죄로 추가 2년을 선고받는다. 는 그가 유죄라는 증거입니다.) 고해인은 형량을 8년 감형받고 즉시 석방되었습니다. 두 사람 모두 범행을 부인할 경우 경찰은 증거불충분으로 절도 혐의로 유죄를 선고할 수 없지만, 민가에 들어간 경우 각각 징역 1년을 선고받을 수 있다. 표 2.2는 이 게임의 보수 매트릭스를 제공합니다.

표 2.2 죄수의 딜레마 게임

B

고백과 부인

A 고백 –8, –8 0, –10

p >

거부 –10, 0 –1, –1

이 게임의 예측 가능한 균형이 무엇인지 살펴보겠습니다. A의 경우 B가 무엇을 선택할지 모르지만 B가 무엇을 선택하든 그의 "고백" 선택은 항상 최적이라는 것을 알고 있습니다.

당연히 대칭성을 바탕으로 B도 '자백'을 선택할 것이고, 그 결과 두 사람 모두 징역 8년을 선고받는다. 그러나 모두가 "부인"을 선택하면 각 사람은 1년의 징역형만 선고받게 됩니다. 표 2.2의 네 가지 행동 선택 조합 중에서 (거부, 거부)는 파레토 최적입니다. 왜냐하면 이 행동 선택 조합에서 벗어나는 다른 행동 선택 조합은 적어도 한 사람을 더 나쁘게 만들 것이기 ​​때문입니다. 모든 범죄 용의자의 지배적인 전략은 '자백'이고, (자백, 자백)은 지배적인 전략 균형이라는 점을 쉽게 알 수 있습니다.

------------------------------- -- -----Jing Zumin 작성 및 제공

큰 이론 속의 작은 이야기

Nash의 기여를 이해하려면, 옳고 그름 협동 게임 문제를 먼저 알아야 합니까? 요즘은 거의 모든 게임이론 교과서에서 '죄수의 딜레마'라는 예를 다루게 되는데, 각 책에 나오는 예는 비슷하다.

게임 이론은 결국 수학, 더 정확하게는 운영 연구의 한 분야입니다. 당연히 수학적 언어는 고전과 교리를 이야기하는 데 없어서는 안 될 요소입니다. 일반인들에게는 그저 수많은 수학 공식처럼 보입니다. 다행히 게임이론은 일상적인 경제생활 문제에 관심을 두고 있기 때문에 세상의 불꽃을 무시할 수는 없다. 사실 이 이론은 체스, 포커, 전쟁 등 경쟁과 대결, 의사결정의 본질에 관한 문제에서 차용한 용어로, 다소 신비롭게 들리지만 실제로는 중요한 실천적 의미를 지닌다. 게임 이론의 대가들은 체스 게임과 같은 경제적, 사회적 문제를 바라보며 종종 게임에 심오한 진실을 담고 있습니다. 그러므로 일상생활의 작은 것부터 시작하여 주변의 이야기를 예로 들어 이야기하는 것이 지루하지 않습니다. 어느 날, 한 부자가 집에서 살해당하고 그의 재산을 빼앗겼다고 합니다. 경찰은 사건 수사 과정에서 용의자 스카페이스(Scarface)와 나쿨스(Nakuls) 2명을 체포했고, 피해자의 자택에서 사라진 물건을 발견했다. 그러나 이들은 부자가 살해된 사실을 처음 발견한 뒤 물건을 훔쳤을 뿐이라며 자신들이 사람을 죽인 적이 없다고 부인했다. 그래서 경찰은 두 사람을 격리하고 서로 다른 방에 가두어 심문했습니다. 지방 검사는 각 사람에게 개별적으로 이야기합니다. 검찰은 "절도죄에 대한 결정적인 증거가 있으므로 징역 1년을 선고할 수 있다. 하지만 합의는 할 수 있다"며 "살인죄만 자백하면 형만 선고하겠다"고 말했다. 징역 3개월, 공범은 10년형을 선고받는다. 자백을 거부하고 공범이 신고하면 본인은 10년, 공범은 3개월만 선고받는다. 두 사람 다 자백하면 둘 다 징역 5년을 선고받게 된다." 스칼페이스와 나쿨스는 어떻게 해야 할까요? 그들은 딜레마에 직면합니다 - 고백하거나 거부합니다. 분명히 최선의 전략은 양측 모두가 부인하는 것이며, 그 결과 모든 사람이 고작 1년형을 선고받는 것입니다. 하지만 두 사람은 고립된 상태였기 때문에 함께 고백할 수는 없었다. 그러므로 아담 스미스의 이론에 따르면 모든 사람은 자기 이익에서 출발하고 솔직한 고백을 선택하는 것이 최선의 전략이다. 자백하면 3개월이라는 짧은 징역형을 받을 것으로 예상할 수 있지만, 공범이 이를 부인한다는 것이 전제이고, 스스로 부인하는 경우 징역 10년보다 훨씬 낫습니다. 이 전략은 다른 사람을 희생하여 자신에게 이익을 주는 전략입니다. 그뿐만 아니라 정직하면 더 많은 이점이 있습니다. 상대방이 자백했는데 본인이 부인하면 10년 징역형을 받게 된다. 정말 나쁜 거래입니다! 따라서 이 경우에도 두 사람이 동시에 자백하더라도 최대 5년형을 선고받는 것이 10년형보다 낫다. 그러므로 두 사람의 합리적인 선택은 원래 쌍방에게 유리한 전략(부인)과 결과(징역 1년)는 일어나지 않을 것입니다. 이렇게 두 사람 모두 자백 전략을 선택해 징역 5년을 선고받았다. 이를 '내시균형', 비협조균형이라고도 한다. 왜냐하면 각 정당은 전략을 선택할 때 '공모'(담합)하지 않고 단지 사회복지나 다른 상대방의 이익을 고려하지 않고 자신에게 가장 이익이 되는 전략을 선택할 뿐입니다. 즉, 이 전략 조합은 모든 플레이어(파티 및 참가자라고도 함)의 최상의 전략 조합으로 구성됩니다. 어느 누구도 더 큰 이익을 얻기 위해 전략을 바꾸려고 주도권을 잡지 않을 것입니다. "죄수의 딜레마"는 광범위하고 심오한 의미를 담고 있습니다. 개인의 합리성과 집단의 합리성의 갈등, 그리고 모두가 사리사욕을 추구하는 행위로 인해 발생하는 궁극적인 결과는 '내쉬균형'이며, 이 또한 모두에게 불리한 결과이다. 두 사람 모두 자백과 부인의 전략에서 자신을 먼저 생각했기 때문에 긴 형을 선고받을 수밖에 없었다. 서로를 먼저 생각하거나, 공모(담합)한 경우에만 최단기간 징역이라는 결과를 얻을 수 있다. "내쉬 평형"은 먼저 아담 스미스의 "보이지 않는 손" 원리에 도전합니다. 스미스의 이론에 따르면 시장경제에서는 모든 사람이 자기 이익에서 출발하여 궁극적으로 사회 전체가 이타적 효과를 달성한다. 국부론(The Wealth of Nations)에서 이 경제 현자의 유명한 말을 검토해 보겠습니다. "(개인의) 이익을 추구함으로써 그는 종종 자신이 실제로 원하는 것보다 더 효과적으로 사회의 이익을 증진합니다." "는 우리를 '보이지 않는 손' 원리의 역설로 이끈다. 즉, 사리사욕에서 출발하면 그 결과는 남에게 해를 끼치고 자신에게도 이익이 되지 않고, 자신에게도 남에게도 이익이 되지 않는다는 것이다. 두 수감자의 운명도 마찬가지였다. 이런 의미에서 '내쉬 균형'이 제시하는 역설은 실제로 서구 경제학의 근간을 뒤흔든다. 그러므로 우리는 "내쉬 균형"에서 진리를 깨달을 수도 있습니다. 협력은 유익한 "이기심 전략"입니다.

하지만 이는 다음의 황금률을 따라야 합니다. 다른 사람이 당신을 대접해주기를 바라는 방식으로 다른 사람을 대하십시오. 단, 다른 사람도 당신을 같은 방식으로 대할 경우에만 그렇게 하십시오. 중국인들은 이렇게 말합니다. “다른 사람이 당신에게 하기를 원하지 않는 일을 다른 사람에게 하지 마십시오.” 하지만 전제는 다른 사람들이 나에게 하기를 원하지 않는 일을 나에게 하지 말라는 것입니다. 둘째, "내쉬 균형"은 비협조적인 게임 균형입니다. 실제로는 비협조적인 상황이 협력적인 상황보다 더 흔합니다. 따라서 '내쉬 균형'은 폰 노이만과 모르겐슈테른의 협동 게임 이론의 주요 발전이자 혁명이라고도 할 수 있다.

'내시균형'의 보편적인 의미에서 우리는 경제, 사회, 정치, 국방, 경영, 일상생활 전반에 걸쳐 흔히 나타나는 게임 현상을 깊이 이해할 수 있다. 죄수의 딜레마와 유사한 예를 많이 들겠습니다. 가격전쟁, 군사경쟁, 오염 등

일반적인 게임 문제는 세 가지 요소, 즉 파티, 참가자, 전략 등으로 알려진 플레이어 세트, 전략 세트, 각 플레이어 쌍의 선택으로 구성됩니다.