ทฤษฎีเกมอัลกอริทึมคืออะไร? อธิบายด้วยตัวอย่าง

เผยแพร่แล้ว: 2020-10-01

ในปี พ.ศ. 2542 เมื่อ Nisan และ Ronen ได้เสนอแนวคิดร่วมกันในบทความ โลกได้เห็นแนวคิดการออกแบบกลไกอัลกอริธึมใหม่ มันพยายามที่จะลบล้าง The Price of Anarchy ซึ่งความสนใจในตนเองมักส่งผลให้ระบบเสื่อมโทรม

เอกสารของพวกเขาพิสูจน์ว่าฝ่ายที่สนใจตนเองหลายฝ่ายสามารถสร้างระบบการผลิตที่สมดุลได้ ดังนั้น แทนที่จะดูที่เศรษฐกิจที่เสื่อมโทรม เราจะดูที่สวัสดิการสังคมและการเพิ่มรายได้ให้สูงสุด

ทฤษฎีเกมอัลกอริทึม (AGT) ขึ้นอยู่กับความเข้าใจใน การออกแบบกลไกอัลกอริทึม (AMD)

ในขณะที่ AMD อธิบายว่าความสนใจในตนเองอาจนำไปสู่ระบบที่ดี AGT มีเป้าหมายที่จะวิเคราะห์และออกแบบการตั้งค่าเชิงกลยุทธ์ที่อธิบายการกระทำของผู้เข้าร่วมที่ให้ความสนใจตนเอง

ก่อนที่เราจะดูว่า AGT ทำงานอย่างไรในสภาพแวดล้อมเชิงกลยุทธ์ มาดูว่าทฤษฎีเกมทำงานอย่างไร!

สารบัญ

มาทำความเข้าใจทฤษฎีเกมด้วยตัวอย่างกันเถอะ
อธิบายภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ
ทฤษฎีเกมอัลกอริทึม
ความคิดสุดท้าย
ทฤษฎีเกมมีความสำคัญอย่างไร?
ในทฤษฎีเกม กลยุทธ์ล้วนๆ คืออะไร?
ทฤษฎีเกมคืออะไร และทำไมนักเศรษฐศาสตร์ถึงมีความสำคัญ?

มาทำความเข้าใจทฤษฎีเกมด้วยตัวอย่างกันเถอะ

ในโลกที่สมบูรณ์แบบ ที่ทุกการเคลื่อนไหวเป็นความพยายามที่คำนวณได้ ทฤษฎีเกมจะไม่สมเหตุสมผลมากเท่ากับที่เป็นอยู่ในทุกวันนี้

แนวคิดในการคำนวณการเคลื่อนไหวครั้งต่อไปของพลเมืองที่ชาญฉลาดและมีเหตุผลนั้นทั้งน่าตื่นเต้นและน่ากลัว

ทฤษฎีเกมกำหนดว่าในสถานการณ์ทางสังคมใดก็ตาม ฝ่ายที่แข่งขันกันสามารถตัดสินใจอย่างมีเหตุมีผลโดยการประเมินความถูกต้องของความเป็นไปได้และประมาณการการเคลื่อนไหวสุทธิของคู่แข่ง

แม้ว่าจะดูเหมือนเป็นการพนัน แต่นักทฤษฎีได้นำกลยุทธ์ที่อธิบายได้กลับมาใช้ใหม่ ซึ่งถอนรากความเชื่อที่ว่ามันคือการพนัน

ตัวอย่างที่อ้างถึงบ่อยที่สุดคือ ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

เรียนรู้: 8 โครงการยอดนิยมที่นักพัฒนาทุกคนควรลองโดยไม่ล้มเหลว

อธิบายภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ

หลักฐานนั้นเรียบง่าย – เมื่อตำรวจจับผู้ต้องหาสองคนและซักถามพวกเขาเกี่ยวกับอาชญากรรม ทั้งคู่ก็จะไม่ทำลายความเงียบของพวกเขา

ดังนั้น DA จึงตัดสินใจทำให้สิ่งนี้ง่ายขึ้นโดยวางเงื่อนไขสามประการไว้ข้างหน้าพวกเขา ขณะที่พวกมันนั่งติดกัน

เงื่อนไขที่ 1: ถ้าไม่มีใครสารภาพผิด พวกเขาจะถูกจำคุกเป็นเวลาหกปี
เงื่อนไข 2: ถ้าตัวใดตัวหนึ่งออกตัวอีกตัวหนึ่ง ผู้เป่านกหวีดจะเดินเตร่อย่างอิสระในขณะที่อีกตัวหนึ่งเข้าไปอยู่เป็นเวลาสิบปี
เงื่อนไขที่ 3: ถ้าทั้งคู่สารภาพ พวกเขาจะถูกจำคุกเป็นเวลาหนึ่งปี

ทันทีหลังจากฟังเงื่อนไข พวกเขาจะถูกพาไปที่ห้องแยกต่างหากเพื่อทำการตัดสินใจ

เราสามารถถ่ายโอนข้อมูลนี้ในรูปแบบของเมทริกซ์เช่นนี้

แหล่งที่มา

วิธีแก้ปัญหานี้ตรงไปตรงมา

นักโทษแต่ละคนจะพิจารณาบอกความจริงเกี่ยวกับอาชญากรรม ทั้งสองไม่สามารถพูดอย่างเคร่งครัดว่าอีกคนหนึ่งจะเงียบ ดังนั้น เมื่อยอมจำนนต่อความน่าจะเป็น ทั้งคู่จึงตัดสินใจสารภาพความผิดและติดคุกเพียงปีเดียว

ทฤษฎีเกมเป็นอาวุธที่ทรงพลังในมือของผู้ครอบครอง เราสามารถถอดรหัสสถานการณ์ที่ซับซ้อนที่สุดได้ด้วยการทำความเข้าใจธรรมชาติของตัวเลขและการจัดวางทางสังคม

ทฤษฎีเกมอัลกอริทึม

ตอนนี้ ให้พิจารณาแผนภาพเวนน์ของทฤษฎีเกมและวิทยาการคอมพิวเตอร์ ลองนึกภาพระดับความแม่นยำที่เพิ่มขึ้นอย่างมากว่าทำไมจึงสร้างแผนภูมิความน่าจะเป็นที่จะได้คำตอบ

และนี่คือสิ่งที่ ทฤษฎีเกมอัลกอริทึม (AGT) ทำ!

มันพยายามที่จะแก้ปัญหาในยุคปัจจุบันด้วยการสร้างสมดุลที่สมบูรณ์แบบระหว่างอัลกอริธึมของคอมพิวเตอร์และทฤษฎีเกม

กล่าวอีกนัยหนึ่ง ทฤษฎีเกมอัลกอริธึมพยายามกำหนดสมดุลทางเศรษฐกิจและสังคมระหว่างการปฏิบัติงาน นอกจากนี้ยังใช้หลักการของ Nash Equilibrium; โดยระบุว่าเมื่อผู้เข้าร่วมพบกลยุทธ์ที่เหมาะกับพวกเขาแล้ว พวกเขาจะไม่ต้องการเบี่ยงเบนจากกลยุทธ์นี้จนกว่าจะหยุดทำงานเพื่อประโยชน์ของตน

มาดูตัวอย่างเล็กๆ น้อยๆ เพื่อทำความเข้าใจการทำงานของทฤษฎีเกมอัลกอริทึม

ย้อนเวลาไปโรงเรียนกันดีกว่าเมื่อเราเล่นเกมอย่างเกาะค้อ Ice & Water, Chain-Cut เป็นต้น แต่ละเกมมีดีไซน์และกลไกการเล่นที่สวยงาม

ลองพิจารณา Ice & Water ตัวอย่างเช่น;

มีผู้เล่นหลายคนและหนึ่งคนจับ ตัวจับควรจะทำให้ทุกคนกลายเป็นน้ำแข็ง
ผู้เล่นคนอื่นๆ มีพลังที่จะทำให้ใครบางคนกลับคืนสู่ผืนน้ำเมื่อสัมผัส
มีโซนอิสระที่ผู้เล่นสามารถพักได้ 30 วินาที

ตอนนี้ ถ้าคุณดูดีๆ คุณจะเห็นว่ากฎแต่ละข้อเหล่านี้ประกอบขึ้นเป็นกลไกของเกมและกำหนดการออกแบบ

ผู้เล่นสามารถเล่นเกมนี้ได้ตราบเท่าที่พวกเขาพบว่าน่าสนใจ ในที่นี้ The Nash Equilibria อธิบายว่าตราบใดที่ผู้เล่นพบว่ากลยุทธ์ของตนได้ผลและเกมน่าสนใจ พวกเขาจะเล่นได้
ปันส่วนของผู้เล่นจะไม่ถูกจับ และเธอดำเนินการปันส่วนนั้นโดยเข้าใจการตั้งค่า เธอใช้แนวทางที่เน้นวัตถุประสงค์เป็นหลัก ซึ่งเธอชนะเกมโดยไม่ถูกจับได้ และสิ่งนี้เป็นที่รู้จักกันอย่างแพร่หลายในชื่อ การออกแบบกลไกหรือทฤษฎีเกมย้อนกลับ
ในกรณีที่ผู้เล่นแต่ละคนพิจารณาเพียงแรงจูงใจเดียว – “ไม่ถูกจับได้” – และไม่ได้พิจารณาส่วนที่สองของมัน – “ในการช่วยชีวิตผู้เล่นคนอื่นๆ” แนวคิดนี้เรียกว่า ราคาของอนาธิปไตย มันอธิบายว่าประสิทธิภาพของระบบใด ๆ จะลดลงเนื่องจากพฤติกรรมที่เห็นแก่ตัวของผู้เล่น

ตอนนี้ มีแนวคิดเพิ่มขึ้นอีกมากจากแนวคิดสามข้อที่กล่าวถึงข้างต้น แม้ว่าทั้งหมดจะเกี่ยวข้องกับทฤษฎีเกมทั้งหมดหรือปานกลาง แต่ก็สร้างพื้นฐานการทำงานสำหรับทฤษฎีเกมอัลกอริธึม

ชำระเงิน: 42 แนวคิดและหัวข้อโครงการ Python ที่น่าตื่นเต้นสำหรับผู้เริ่มต้น

ตอนนี้ คำถามเกิดขึ้น: “เราจะแสดงสภาพแวดล้อมเชิงกลยุทธ์ในแง่ของอัลกอริทึมได้อย่างไร”

ตอนนี้เรามาดูกันว่าเราจะใช้ Python เพื่อกำหนดสภาพแวดล้อมเชิงกลยุทธ์ได้อย่างไร และเข้าใจการนำ Nashpy ไปใช้งานในสถานการณ์ที่กำหนดได้อย่างไร

ลองนึกภาพว่าคุณกำลังเล่นเกมเป่ายิ้งฉุบกับเพื่อนคนหนึ่งของคุณ คุณแต่ละคนมีทางเลือกสามทาง

หิน
กระดาษ
กรรไกร

และรูบริกที่จะชนะเกมนี้คือ

กรรไกรทุบหิน
กรรไกรตัดกระดาษ
กระดาษครอบคลุมร็อค

และนี่หมายความว่าถ้าผู้เล่นทั้งสองคนนำเสนอร็อค มันจะเป็นการทำโอเวอร์

เราสามารถแสดงสิ่งนี้ในรูปแบบของเมทริกซ์ 3 × 3 โดยที่ Aij อยู่;

แหล่งที่มา

หมายเหตุ: ในที่นี้ i และ j คือผลัดกันเล่นของผู้เล่นสองคน

ที่นี่,

Zero แสดงว่าคุณทั้งคู่เล่นวัตถุเดียวกัน (rock-rock หรือ paper-paper)
หนึ่งแสดงว่าคุณคนหนึ่งตีอีกคน (เช่นกรรไกรหิน)
เครื่องหมายลบหนึ่งแสดงว่าคุณสองคนแพ้เพราะอีกคนหนึ่งตบหน้าคุณ (เหมือนกระดาษหิน)

ทีนี้ เพื่อแสดงสิ่งนี้บน Nashpy คุณจะต้องเขียนโค้ดที่มีลักษณะดังนี้

แหล่งที่มา

ความคิดสุดท้าย

ทฤษฎีเกมอัลกอริทึมเป็นหลักการที่สมบูรณ์แบบในโลกปัจจุบันที่การแข่งขันเกิดขึ้นจากความสนใจตนเอง และชัยชนะคือการบรรลุผลสำเร็จของผลประโยชน์ตนเอง

ดังนั้น ในฐานะผู้จัดการ ครู องค์กร CXO หรือนักธุรกิจในยุคปัจจุบัน หากคุณเข้าใจความโดดเด่นของทฤษฎีเกมอัลกอริธึม ก็อนุญาตให้ฉันเปลี่ยนคำพูดของ Severus Snape จาก Harry Potter ได้

“ทฤษฎีเกมอัลกอริธึมสามารถสอนคุณถึงวิธีสร้างชื่อเสียง สร้างชื่อเสียง หรือแม้แต่หยุดยั้งการสูญเสีย”

การทำความเข้าใจทฤษฎีเกมอัลกอริธึมสามารถช่วยให้คุณจัดการกับตัวเลขได้อย่างเด็ดขาดกว่าที่เคย ในยุคปัจจุบันที่เราตัดสินใจเรื่องต่างๆ จนถึงรายละเอียดสุดท้ายเพื่อพัฒนาแผนอย่างยั่งยืน AGT ได้พิสูจน์แล้วว่าเป็นแง่มุมของการเปลี่ยนแปลง

เรารู้อยู่แล้วว่า Data Science สามารถเปลี่ยนธุรกิจให้เป็นเวทีที่ทำกำไรได้ แต่ AGT มีพลังที่จะยกระดับธรณีประตู

สมมติว่าคุณยังสงสัยเกี่ยวกับทฤษฎีเกมและวิทยาการข้อมูลเป็นอาชีพที่ทำกำไรและมีการแข่งขันสูงที่สุดในปัจจุบันได้อย่างไร

หากคุณอยากเรียนรู้เกี่ยวกับวิทยาศาสตร์ข้อมูล ให้ลองดูประกาศนียบัตร PG ด้านวิทยาศาสตร์ข้อมูลของ IIIT-B และ upGrad ซึ่งสร้างขึ้นสำหรับมืออาชีพด้านการทำงานและเสนอกรณีศึกษาและโครงการมากกว่า 10 รายการ เวิร์กช็อปภาคปฏิบัติจริง การให้คำปรึกษากับผู้เชี่ยวชาญในอุตสาหกรรม 1- on-1 กับที่ปรึกษาในอุตสาหกรรม การเรียนรู้มากกว่า 400 ชั่วโมงและความช่วยเหลือด้านงานกับบริษัทชั้นนำ

ทฤษฎีเกมมีความสำคัญอย่างไร?

ทฤษฎีเกมปฏิวัติเศรษฐศาสตร์ด้วยการเอาชนะปัญหาสำคัญๆ ในรูปแบบเศรษฐศาสตร์เชิงปริมาณก่อนหน้านี้ นักเศรษฐศาสตร์มักใช้ทฤษฎีเกมเพื่อทำความเข้าใจพฤติกรรมของธุรกิจผู้ขายน้อยราย เมื่อบริษัทมีส่วนร่วมในการดำเนินการบางอย่าง เช่น การตรึงราคาและการสมรู้ร่วมคิด สามารถช่วยคาดการณ์ผลลัพธ์ที่น่าจะเป็นไปได้

ในทฤษฎีเกม กลยุทธ์ล้วนๆ คืออะไร?

ทฤษฎีเกมคือการศึกษาการตัดสินใจเชิงโต้ตอบ ซึ่งชะตากรรมของผู้เข้าร่วมหรือผู้เล่นแต่ละคนถูกกำหนดโดยการกระทำของทุกคน เมื่อตัดสินใจดำเนินการหรือ 'กลยุทธ์' ในฐานะผู้เล่นในเกมดังกล่าว คุณต้องพิจารณาการตัดสินใจของผู้อื่น ข้อกำหนดที่ครอบคลุมเกี่ยวกับวิธีการเล่นเกมของผู้เล่นนั้นมาจากกลยุทธ์ล้วนๆ กลยุทธ์ที่บริสุทธิ์อาจถือได้ว่าเป็นแผนที่อิงจากการสังเกตตลอดทั้งเกม โดยเฉพาะอย่างยิ่งจะส่งผลต่อการตอบสนองของผู้เล่นในสถานการณ์ใดก็ตาม

ทฤษฎีเกมคืออะไร และทำไมนักเศรษฐศาสตร์ถึงมีความสำคัญ?

ทฤษฎีเกมเป็นเครื่องมือที่นักเศรษฐศาสตร์ใช้ในการวิเคราะห์ ทำนาย และอธิบายพฤติกรรมของมนุษย์ มันถูกใช้ในการวิจัยการประมูล การเจรจาต่อรอง การกำหนดราคาการควบรวมกิจการ ผู้ขายน้อยราย และหัวข้ออื่นๆ ที่หลากหลาย มีความคืบหน้าไปสู่เกมผลรวมที่เป็นบวกแบบผู้เล่นหลายคน ซึ่งผู้เข้าร่วมทั้งหมดอาจได้รับประโยชน์จาก 'กำไรจากการแลกเปลี่ยน' (การแลกเปลี่ยน) ระหว่างบุคคล