Lý thuyết trò chơi

Lý thuyết trò chơi là việc nghiên cứu làm thế nào để tìm được các chiến lược tối ưu trong hoàn cảnh mâu thuẫn, đối địch. Ở góc độ học thuật, lý thuyết trò chơi là nghiên cứu các mô hình toán học về các tương tác chiến lược. Lý thuyết trò chơi có ứng dụng trong nhiều lĩnh vực khoa học xã hội và được sử dụng rộng rãi trong kinh tế, logic, khoa học hệ thống và khoa học máy tính.  Các mô hình khác nhau của trò chơi được phân lớp bởi số người tham dự và tổng số điểm (hoặc tiền) thắng và thua của các người chơi. Do tính phức tạp về mặt toán học nên ở đây ta chỉ xét đến các trò chơi với hai người chơi và tổng bằng không.

Tham khảo thêm: Lý thuyết ra quyết định

Ta ký hiệu X và Y là hai người chơi, khi đó tổng bằng không nghĩa là tổng số điểm (hoặc số tiền) của người thắng nhận được bằng tổng số điểm (hoặc số tiền) mà người thua bị mất.

Ví dụ: Giả sử ở một thành phố chỉ có hai công ty X (hocthue.net), Y cùng kinh doanh một loại dịch vụ viết tiểu luận. Nói khác đi là chỉ có hai đối thủ cạnh tranh. Từ trước đến nay thì phần phân chia thị trường của hai công ty là ổn định. Nhưng công ty Hocthue.net đã quyết định tăng cường quảng cáo bằng cách thực hiện hai chiến lược: trên facebook và tiktok nhằm mở rộng thị phần của công ty mình. Người chủ công ty Y khi nghe được điều này cũng chuẩn bị kế hoạch đối phó và giả sử ông ta cũng dự định chọn hai chiến lược quảng cáo như công ty X là trên Facebook và Tiktok.

Bảng dưới đây là một ma trận vuông cấp 2x2 chỉ điều gì sẽ xảy ra nếu hai công ty thực hiện các chiến lược quảng cáo.

Bảng1- Kết quả thay đổi thị phần của các công ty theo các chiến lược quảng cáo

 Y1 (Facebook)Y2 (Tiktok)
X1 (Facebook)27
X2 (Tiktok)6-4

 

Bảng trên được gọi là bảng Xss Payoff matrix. Các điểm số thắng hoặc thua ở đây nghĩa là số phần trăm của phần thị trường sẽ dành thêm được hoặc sẽ bị mất đi. Ví dụ, nếu X dùng chiến lược X2 (quảng cáo trên Tiktok còn Y sử dụng chiến lược Y1 (quảng cáo trên Facebook) thì X sẽ thắng 6 điểm (tức là sẽ dành thêm được về mình 6% thị phần). Vì giả thiết tổng bằng 0 nên lúc này Y sẽ thua 6 điểm. Nhvậy, X’s payoff matrix chỉ tính thắng hoặc thua về phía X nhưng vì tổng bằng 0 nên ta suy ra được điểm thua hoặc thắng của bên Y. Như vậy trò chơi hoàn toàn phụ thuộc vào X’s payoff matrix.

1. Dạng trò chơi với chiến lược duy nhất

Để dễ hiểu ta hãy xét trò chơi với X’s payoff matrix như sau:

Bảng 2- Bảng X’s Payoff matrix

 Y1Y2
X135
X21-2

 

Nhìn vào bảng 2 ta thấy ngay là chỉ sau một vài lần chơi người chơi thứ nhất X sẽ luôn luôn chọn một chiến lược cố định là X1 vì khi đó thì khả năng xấu nhất xảy ra anh ta cũng thắng 3 điểm hơn khả năng tốt nhất xảy ra khi anh ta chọn chiến lược X2 (1 điểm).

Khi biết là X sẽ luôn luôn chọn chiến lược X1 thì Y sẽ luôn chọn chiến lược Y1 nhằm làm nhỏ nhất số điểm mà mình bị thua (3 điểm) vì nếu chọn Y2 thì sẽ bị thua 5 điểm.

Vậy X luôn chơi chiến lược X1 còn Y luôn luôn chơi chiến lược Y1 và lúc này trò chơi được gọi là trò chơi với chiến lược duy nhất cho cả hai người chơi còn điểm 3 trên ma trận gọi là điểm yên ngựa. Ta dễ dàng thấy điểm yên ngựa là điểm có giá trị nhỏ nhất trong dòng của nó nhưng lại có giá trị lớn nhất trong cột chứa nó. Để thử xem một trò chơi có tồn tại chiến lược duy nhất cho cả hai người chơi không tức là có tồn tại điểm yên ngựa không người ta dùng thuật toán sau đây:

Bước 1: Ở mỗi dòng của X’s payoff matrix ta chọn ra số nhỏ nhất sau đó ta chọn ra số lớn nhất trong các số nhỏ nhất này. Hay nói khác đi là ta dùng tiêu chuẩn maximin đối với người chơi thứ nhất X.

Bước 2.: Ở mỗi cột ta chọn ra số lớn nhất (chính là số điểm cao nhất của Y) sau đó ta chọn ra số nhỏ nhất trong các số lớn nhất này. Nói khác đi là ta dùng tiêu chuẩn minimax đối với cột (người chơi thứ hai Y).

Bước 3: Nếu hai số đã được chọn ở bước 1 và bước 2 là trùng nhau thì đó là điểm yên ngựa và trò chơi là có một chiến lược duy nhất cho cả hai người chơi. Nếu hai số đã được chọn ở bước 1 và bước 2 là khác nhau thì trò chơi không có chiến lược duy nhất.

Ví dụ: Hãy tìm điểm yên ngựa của trò chơi X’s payoff matrix sau đây:

Bảng 3- Bảng X’s Payoff matrix

 Y1Y2
X1106
X2-122

 

Bước 1: Số nhỏ nhất của ở dòng 1 là 6 và ở dòng 2 là -12 vậy theo tiêu chuẩn maximin theo dòng ta chọn được số 6.

Bước 2: Số lớn nhất ở cột 1 là 10 còn số lớn nhất ở cột 2 là 6, theo tiêu chuẩn minimax theo cột ta cũng chọn được số 6.

Bước 3: Hai số chọn được ở hai bước trên là trùng nhau, vậy 6 là điểm yên ngựa nghĩa là X luôn chọn chiến lược X1 còn Y luôn chọn chiến lược Y2.

2- Dạng trò chơi với các chiến lược hỗn hợp

Khi không tồn tại điểm yên ngựa thì mỗi người chơi sẽ chơi với mỗi chiến lược với tỷ lệ phần trăm nào đó và lúc đó ta sẽ có trò chơi với các chiến lược hỗn hợp, vấn đề được đặt ra là xác định tỷ lệ phần trăm mà mỗi người chơi sẽ cho mỗi chiến lược.

Nếu mỗi người chơi chỉ có hai chiến lược thì X’s payoff matrix sẽ là ma trận vuông cấp 2x2 có dạng:

Bảng 4- Bảng X’s payoff matrix

 Y1 : PY2 : 1-P
X1 : Q  
X2 : 1-Q  

 

Trong bảng 4 thì Q và 1-Q là tỷ lệ số lần mà X sẽ chơi các chiến lược X1 và X2 tương ứng. Ví dụ, nếu Q = 0,25 và 1-Q = 0,75 nghĩa là X sẽ chơi chiến lược X2 nhiều gấp 3 lần chơi chiến lược X1 . Tương tự như vậy đối với P và 1-P của người chơi Y.

Mục tiêu của người chơi là X phải tìm Q còn Y phải tìm P để hoặc cực đại hóa số điểm thắng hoặc cực tiểu hóa số điểm thua của mình bất kể đối thủ của mình chơi chiến lược nào.

Ví dụ: Giả sử X’s payoff matrix của một trò chơi là:

Bảng 5- Bảng X’s Payoff matrix

 Y1 : PY2 : 1-P
X1 : Q42
X2 : 1-Q110

 

Ta thấy ngay lã sẽ chắc chắn thắng do đó X cần tìm Q và 1- Q để cực đại hóa số điểm thắng của mình còn Y dù chơi thế nào cũng thua nên cần tìm P và 1-P dể cực tiểu hóa số điểm thua của mình.

Một phương pháp đơn giản để xác định Q và 1- Q là tìm Q để số điểm thắng trung bình của cả X là không đổi và không phụ thuộc vào Y chơi chiến lược Y1 hay Y2.

Nghĩa là tìm Q và 1-Q sao cho:

4Q + 1(1- Q) = 2Q + 10(1- Q)

Giải phương trình này ta được Q = 9/11 do đó 1- Q = 1 – 9/11 = 2/11

Tương tự như vậy đối với Y sẽ tìm P và 1- P để số điểm thua trung bình của mình là không đổi bất kể X chơi chiến lược X1 hay X2 , tức là tìm P và 1-P sao cho:

4P + 2(1- P) = 1P + 10(1- P)

Giải phương trình này được P = 8/11 và suy ra 1- P = 3/11

Ta đi đến kết quả:

Bảng 6- Bảng X's Payoff matrix

 Y1 : P=8/11Y2 : 1- P=3/11
X1 : Q=9/1142
X2 : 1- Q=2/11110

 

Bây giờ ta đi tính giá trị trung bình của trò chơi. Nếu gọi Z là giá trị của trò chơi thì Z là biến ngẫu nhiên có bảng phân phối xác suất như sau:

Bảng 7 – Bảng phân phối xác suất giá trị của trò chơi

Z42110
P(Z)9/11.8/119/11.3/112/11.8/112/11.3/11

 

Ta giải thích ý nghĩa của bảng phân phối xác suất trên như sau:

Ví dụ Z nhận giá trị 4 nếu X chơi X1 còn Y chơi Y1 tức xảy ra biến cố X1 ∩ Y1 nhưng đây là hai biến cố độc lập nên xác suất để xảy ra X1∩Y1 là tích của hai xác suất tức là bằng 8/11.9/11 = 72/121.

Vậy ta có giá trị trung bình của trò chơi là:

E(Z) = 4. 72/121 + 2.27/121 + 1.16/121 + 10.6/121 = 3,45

Nói cách khác thì nếu chơi nhiều lần thì số điểm thắng trung bình bên X là 3,45 còn số điểm thua trung bình của Y là 3,45.

Hocthue.net hy vọng bạn sẽ hiểu rõ lý thuyết trò chơi. Còn khó khăn gì thì hãy liên hệ chúng tôi nhé.

Tham khảo thêm
Quý vị có thể tham khảo thêm slide về lý thuyết trò chơi sau: ly-thuyet-tro-choi-hocthuenet.pdf

Thẻ