Lí thuyết trò chơi chủ yếu nghiên cứu tác dụng tương hỗ giữa các yếu tố đã được công thức hoá, là lí luận và phương pháp toán học để nghiên cứu hiện tượng có sẵn tính chất đấu tranh hoặc cạnh tranh. Lí thuyết trò chơi suy xét hành vi dự liệu và hành vi thực tế, đồng thời nghiên cứu sách lược ưu hoá của chúng. Các nhà sinh vật học sử dụng lí thuyết trò chơi để lí giải và suy đoán một số kết quả của học thuyết tiến hoá.
Lí thuyết trò chơi đã trở thành một trong những công cụ phân tích tiêu chuẩn của kinh tế học. Trước mắt đều có ứng dụng rộng khắp ở tài chính học, chứng khoán học, sinh vật học, kinh tế học, quan hệ quốc tế, khoa học máy tính, chính trị học, chiến lược quân sự và rất nhiều ngành học khác.[1] Nguồn gốc của lí thuyết trò chơi hiện đại là do John von Neumann đưa ra ý tưởng và chứng minh điểm cân bằng của sách lược hỗn hợp đối với trò chơi có tổng bằng không của hai người.
Bài đăng này sẽ được chia thành ba phần chính:
- Lý thuyết trò chơi là gì?
- Nó được sử dụng như thế nào?
- Phân loại trò chơi.
Mục Lục
Lý thuyết trò chơi là gì
Khi thiết kế các hệ thống cho tổ chức, mục tiêu là cấu trúc các tương tác xã hội theo cách dẫn đến trật tự xã hội và kết quả tốt. Để làm như vậy, chúng ta cần một khuôn khổ để thiết kế hệ thống tiếp cận tinh thần cho con người.
Rất may, trong vài thập kỷ qua, các nhà kinh tế đã phát triển một kho công cụ cho mục đích này. Giờ đây, chúng ta có các phương pháp tiếp cận toán học và lý thuyết để dự đoán mọi người sẽ hành động như thế nào, với những điều kiện bất lợi nhất định.
Lý thuyết trò chơi là khoa học về việc ra quyết định hợp lý ở người, động vật và máy tính.
- Trong chính sách công, lý thuyết trò chơi được sử dụng để dự đoán các quốc gia sẽ hành động và phản ứng như thế nào.
- Trong chiến tranh, lý thuyết trò chơi được sử dụng để dự đoán nước đi của đối thủ.
- Trong mật mã, lý thuyết trò chơi được sử dụng để dự đoán các cuộc tấn công mạng tiềm năng.
- Trong thiết kế mã thông báo, lý thuyết trò chơi được sử dụng để dự đoán hành động của những người nắm giữ mã thông báo để đáp lại các khuyến khích được nhúng.
- Trong thị trường tài chính, lý thuyết trò chơi được sử dụng để dự đoán các quyết định của thị trường chứng khoán.
Những dự đoán này xuất phát từ xu hướng của con người là tối đa hóa lợi ích và giảm thiểu thiệt hại, và do đó có thể được tính toán. Biết được ‘người chơi’ sẽ hành động như thế nào sau đó dẫn đến kết quả cuối cùng của ‘trò chơi’. Kết quả thu được này được đặt tên là Chiến lược thống trị và chúng ta có thể sử dụng nó để dự đoán những quyết định mà người chơi sẽ đưa ra.
Làm thế nào để chúng tôi sử dụng nó?
Dưới đây là một số ví dụ để giúp giải thích thuật ngữ:

Trong mỗi trận đấu, chúng tôi phải chỉ định người chơi, chiến lược của họ và phần thưởng. Đây là cách thiết lập một bài toán Lý thuyết trò chơi cơ bản bằng cách sử dụng một ví dụ về mối đe dọa phóng hạt nhân:

- Chỉ định người chơi, chiến lược, phần thưởng
- Tạo một trò chơi dạng bình thường
Trong tài liệu học thuật, người chơi thường được viết tắt là i, hồ sơ chiến lược được viết tắt thành s và phần thưởng được viết tắt thành u hoặc π. Một cách quen thuộc phổ biến để mô tả những gì đang xảy ra là:
Với bất kỳ hồ sơ chiến lược nào, mỗi người chơi tôi sẽ nhận được (các) phần thưởng, phụ thuộc vào toàn bộ vectơ chiến lược trong hồ sơ đó.
Ngoài ra, phần thưởng có thể có nghĩa là một số điều khác nhau. Nó có thể có nghĩa là sự hài lòng hoặc tiện ích của một cá nhân; nó có thể đại diện cho phần thưởng bằng tiền mà anh / cô ấy nhận được; nó có thể đại diện cho giá trị dự kiến của phần thưởng hoặc tiện ích tiền tệ trong một tình huống không chắc chắn.
Để dự đoán kết quả của tương tác giữa Hoa Kỳ và Liên Xô ở trên, chúng ta cần tìm Cân bằng Nash của trò chơi.
Giới thiệu về trạng thái cân bằng Nash
Cân bằng Nash là một kết quả mà mỗi người chơi không có động cơ để thay đổi hành vi của mình dựa trên hành động của những người chơi khác.

Cách chúng tôi tính toán Cân bằng Nash như sau:
Xin nhắc lại: phần thưởng được cấu trúc với US là đầu tiên, SU thứ hai. Như thế này – (Hoa Kỳ trả, Liên Xô trả)
- Chỉ nhìn vào thành quả của Hoa Kỳ nếu họ tấn công. Chúng tôi thấy -1 và 0. 0 tốt hơn, chúng tôi gạch chân 0
- Chỉ nhìn vào thành quả của Hoa Kỳ khi họ không tấn công. Chúng tôi thấy 4 và 2. 4 tốt hơn, chúng tôi gạch chân 4
- Chỉ nhìn vào thành quả của Liên Xô khi họ tấn công. Chúng tôi thấy -1 và 0. 0 thì tốt hơn, chúng tôi gạch chân 0
- Chỉ nhìn vào thành quả của Liên Xô khi họ không tấn công. Chúng tôi thấy 4 và 2. 4 tốt hơn, chúng tôi gạch dưới 4
Các chiến lược chủ đạo của trò chơi là (Tấn công, Không tấn công) hoặc (Không tấn công, Tấn công).
Chúng ta sẽ xem xét lại ví dụ này sau khi đưa ra kết luận và đưa ra các dự đoán trong đời thực. Điều quan trọng là chúng tôi duy trì phương pháp tiếp cận chuẩn hóa khi đánh giá các vấn đề lý thuyết trò chơi.
Phân loại trò chơi
Khi xem xét trò chơi:
- Người chơi có thông tin đầy đủ hoặc bình đẳng không?
- Lợi ích của người chơi có xung đột hoàn toàn hay có sự giống nhau nào đó không?
- Các thỏa thuận hợp tác có khả thi không?
- Các bước di chuyển trong trò chơi là tuần tự hay đồng thời?
- Trò chơi được chơi một lần hay nhiều lần, với những đối thủ giống nhau hay thay đổi?
Người chơi có thông tin đầy đủ hoặc bình đẳng không?
Thông tin không hoàn hảo và hoàn hảo
Thông tin không hoàn hảo tồn tại khi trò chơi có sự không chắc chắn bên ngoài (không chắc chắn về hoàn cảnh bên ngoài như thời tiết hoặc chất lượng của hàng hóa) hoặc sự không chắc chắn về chiến lược (khi mỗi người chơi không chắc chắn về các nước đi của đối thủ trong quá khứ hoặc đang thực hiện cùng một lúc anh ta tự di chuyển).
Thông tin hoàn hảo tồn tại nếu trò chơi không có sự không chắc chắn bên ngoài hoặc chiến lược.
Thông tin không đầy đủ và đầy đủ
Thông tin không đầy đủ tồn tại khi một người chơi biết nhiều hơn người khác biết (tình huống thông tin không cân xứng). Trong những tình huống như vậy, việc người chơi cố gắng suy luận, che giấu hoặc đôi khi truyền đạt thông tin cá nhân của họ trở thành một phần quan trọng của trò chơi.
Thông tin đầy đủ tồn tại khi người chơi có thông tin đầy đủ và bình đẳng.
Lợi ích của người chơi có xung đột hoàn toàn hay có sự giống nhau nào đó không?
Trò chơi cơ bản
Bạn có nhớ hai biểu đồ lý thuyết trò chơi cơ bản ở phần trước không? Một bên thường được gọi là xung đột thuần túy và một bên là lợi ích chung thuần túy khác

Ùn tắc giao thông là một ví dụ về mối quan tâm chung: ùn tắc nói chung là kết quả không tốt và việc tránh được chúng sẽ có lợi cho tất cả mọi người.
Trong các tương tác khác, chẳng hạn như giải quyết giá của một hàng hóa sẽ được trao đổi hoặc các trò chơi có tổng bằng không khác nhau, nhiều hơn cho một có nghĩa là ít hơn cho kia. Đây là những ví dụ về xung đột.
Bi kịch của Commons
Tuy nhiên, hầu hết các trò chơi đều có cả hai yếu tố xung đột và lợi ích chung.
Bi kịch của Commons là một vấn đề phổ biến trong đó Cân bằng Nash của một cá nhân áp đảo nguồn cung và tiêu thụ thêm một đơn vị trực tiếp gây hại cho những người khác.
Điều này xảy ra khi một số tài nguyên nhất định được coi là miễn phí đối với người chơi trò chơi. Các kết quả xảy ra như:
- Đánh bắt quá mức
- Ô nhiễm không khí
- Không có đồng cỏ công cộng
- Giao thông trên đường công cộng
- Tăng dân số theo cấp số nhân
- Tình trạng thiếu nước ngầm ở Los Angeles
- Rác đại dương
Chúng tôi sẽ sử dụng các ví dụ như thế này trong bài viết sau để chỉ ra cách Cân bằng Nash mâu thuẫn trực tiếp với Kết quả tối ưu Pareto và do đó dẫn đến sự thất bại trong phối hợp / hợp tác.
Giới thiệu về phân loại trò chơi
Câu hỏi về quyền lợi của người chơi có xung đột hoàn toàn không hay có một điểm chung nào đó là công cụ cơ bản nhất để phân loại trò chơi– Nó sẽ giúp chúng ta bắt đầu phân biệt giữa
- Trò chơi bàn tay vô hình
- Tình thế tiến thoái lưỡng nan của tù nhân
- Trò chơi phối hợp thuần túy
- Trò chơi đảm bảo
- Trận chiến giới tính
- Hawk-Dove
- Trò chơi đá gà
- Tổng quan đầy đủ về phân loại lý thuyết trò chơi ngay sau đây.
Các thỏa thuận hợp tác có khả thi không?
Trò chơi hợp tác và không hợp tác
Trò chơi hợp tác: Hãy tưởng tượng một tương tác trong đó mọi thứ mà cả hai đều bị ảnh hưởng bởi hành động của người chơi và liên quan đến bất kỳ người chơi nào đều phải tuân theo thỏa thuận ràng buộc (nghĩa là có thể thi hành miễn phí). Đây được gọi là một trò chơi hợp tác. Thuật ngữ này không đề cập đến cảm xúc của các bên về nhau mà chỉ đơn giản là các thỏa thuận thể chế điều chỉnh các tương tác của họ.
Trò chơi không hợp tác: Tuy nhiên, thông thường hơn, điều gì đó về tương tác không phải tuân theo thỏa thuận ràng buộc. Những tình huống như vậy được mô phỏng như trò chơi bất hợp tác.
Lưu ý rằng điều này không nhất thiết đề cập đến khả năng hoặc mong muốn hợp tác, Trò chơi hợp tác chỉ đơn giản là đề cập đến mức độ thực thi được tìm thấy trong các thỏa thuận ràng buộc và không ràng buộc.
Trong thỏa thuận xã hội giữa người sử dụng lao động và người lao động, một phần của sự tương tác có thể được giải quyết một cách hợp tác, như khi người sử dụng lao động và người lao động mặc cả về tiền lương và giờ làm việc. Các khía cạnh khác của cùng một tương tác có thể không hợp tác vì không thể viết hoặc thực thi các hợp đồng liên quan.
Ví dụ bao gồm mức độ chăm chỉ của người lao động hoặc liệu người sử dụng lao động có đầu tư lại lợi nhuận thu được vào công ty hay không. Khi người sử dụng lao động đang đo lường năng suất, anh ta / cô ta chơi một trò chơi hợp tác nếu anh ta / cô ta có một biểu ngữ ở cửa để theo dõi khi nhân viên ra vào. Tuy nhiên, nếu nhà tuyển dụng không thể xác minh chất lượng công việc hoặc nỗ lực đã bỏ ra, thì trò chơi không hợp tác.
Trong các công việc công nghệ và đặc biệt là bên trong các công ty khởi nghiệp, việc theo dõi năng suất của nhân viên tại nơi làm việc thường khó khăn và tốn kém → biến nó thành một trò chơi bất hợp tác. Đây là lý do tại sao chúng ta thường nghe nói về “văn hóa công ty” và thiết lập một “sứ mệnh” chung. Khi người sử dụng lao động không có cách nào thực thi một số thỏa thuận nhất định và những nhân viên có lý trí có thể chểnh mảng mà không bị ảnh hưởng, do đó, một câu chuyện về ‘văn hóa’ được sử dụng để tạo dấu ấn cho các hợp đồng xã hội đã lập.
Thông thường, các tương tác xã hội được phân loại dựa trên việc trò chơi đại diện cho nó là hợp tác hay bất hợp tác và liệu phần thưởng của trò chơi là lợi ích chung hay xung đột.

Các bước di chuyển trong trò chơi là tuần tự hay đồng thời?
Có hai trò chơi chính khác nhau dựa trên thứ tự các quyết định – Trò chơi Hình thức Thông thường và Trò chơi Hình thức Mở rộng.
Trò chơi dạng bình thường

Điều này có nghĩa là chuỗi thời gian của các hành động được thực hiện bởi mỗi người chơi không được thể hiện rõ ràng, giả định được đặt ra là mỗi người chơi di chuyển mà không biết bước di chuyển của những người khác.
Trình tự của các hành động ở đây không quan trọng vì chúng tôi cho rằng người chơi đang di chuyển cùng một lúc. Giả định là một người chơi sẽ có đầy đủ thông tin về các bước di chuyển của người chơi khác.
Trò chơi dạng mở rộng
Các trò chơi đưa ra thứ tự rõ ràng của các bước di chuyển và người chơi nào biết những gì ở mỗi giai đoạn trong trò chơi. Những chuyển động được thực hiện sớm hơn trong thời gian không cần biết bởi những người thực hiện di chuyển sau.

Dạng mở rộng truyền tải thêm thông tin về sự tương tác theo nghĩa là nhiều trò chơi dạng mở rộng có thể được thể hiện bằng cùng một trò chơi dạng bình thường. Khi, như thường lệ, biểu diễn dạng bình thường được sử dụng, điều này là do thông tin bổ sung ở dạng mở rộng được cho là không liên quan đến cách trò chơi sẽ được chơi.
Trò chơi được chơi một lần hay nhiều lần?
Trò chơi lặp lại là một trò chơi dạng mở rộng bao gồm một số lần lặp lại một số trò chơi cơ bản. Các trò chơi lặp lại ghi lại ý tưởng rằng một người chơi sẽ phải tính đến tác động của hành động hiện tại của họ đối với hành động trong tương lai của những người chơi khác.
Trò chơi lặp đi lặp lại là một trong những công cụ mạnh mẽ nhất để giữ gìn trật tự xã hội.
Đó là lý do tại sao quan hệ tình dục với bạn bè thường không có giá trị, tại sao tình trạng khó xử của tù nhân có thể được khắc phục thông qua thiết kế hệ thống, tại sao tham chiến lại rất tốn kém (nhưng đe dọa chiến tranh lại rất có lợi) và tại sao chế độ quân chủ đôi khi hoạt động tốt.
Tiếp theo: Tình trạng tiến thoái lưỡng nan của tù nhân, Cân bằng Nash và những lý thuyết sâu hơn.
Nguồn: Medium Viktor Makarskyy
TADATek Insights biên dịch
Comments (No)