Traveler's Dilemma: เมื่อทฤษฎีวิวัฒนาการจะมาช่วยไขปัญหาของทฤษฎีเกม

By: terminus
Writer
on Sun, 07/10/2012 - 21:48

ทฤษฎีเกมแบบคลาสสิก (classical game theory) สามารถทำนายการแข่งขันหรือเกมในสถานการณ์จริงได้หลายเกม แต่มันก็มีเกมอีกไม่น้อยที่ทฤษฎีเกมทำนายผลออกมาไม่ตรงกับผลการทดลอง หนึ่งในนั้น คือ เกมที่มีชื่อว่า "Traveler's Dilemma"

Traveler's Dilemma มีสถานการณ์สมมติตามนี้ (เกมฉบับดั้งเดิมไม่มีชื่อตัวละครและไม่ได้ระบุหน่วยเงินเป็นบาท แต่ผมจำเป็นต้องสมมติขึ้นเพื่อให้เห็นภาพในการอธิบาย)

คุณเต้นกับคุณตู่เดินทางไปเยี่ยมนายใหญ่ที่ต่างประเทศ แต่เกิดอุบัติเหตุขึ้นระหว่างทางจนทำให้แจกันที่ทั้งคู่ต่างคนต่างซื้อไปฝากนายใหญ่แตกพังเละเทะ สายการบินจึงขอรับผิดชอบชดใช้ค่าเสียหายที่เกิดขึ้น โดยสายการบินตั้งราคาประเมินของแจกันทั้งสองไว้ที่ใบละไม่เกิน 100 บาท (แจกันทั้งสองใบเหมือนกันทุกประการ) คุณตู่และคุณเต้นถูกจับแยกห้องให้เสนอราคาค่าเสียหายทีละคน หลังจากทั้งสองคนเสนอราคาแล้ว สายการบินจะเลือกเอาราคาของคนที่เสนอต่ำกว่าเป็นตัวตั้ง สายการบินจะให้รางวัลโบนัสค่าความซื่อสัตย์แก่คนที่เสนอราคาต่ำกว่าเพิ่มอีก 2 บาทจากราคาแจกัน และคนที่เสนอราคาสูงกว่าก็จะได้รับค่าชดเชยแจกันในราคาเดียวกับคนที่เสนอต่ำกว่า แต่ไม่ได้โบนัสและจะต้องถูกปรับ 2 บาทด้วยข้อหาไม่ซื่อสัตย์

ทันทีที่สัญชาตญาณความโลภทำงาน คุณเต้นก็อ้าปากจะเสนอราคา 100 บาทซึ่งเป็นราคาสูงสุดทันที แต่ก่อนที่จะเอ่ยปากออกไปเสี้ยววินาที คุณเต้นก็ฉุกคิดได้ว่า "อืม ถ้าเราเสนอ 99 บาทหละ เราก็จะเก็บโบนัสได้รวมเป็นเงิน 99+2 = 101 และไอ้ตู่เพื่อนเราก็จะได้ 99-2 = 97 บาท งั้นเราเสนอ 99 ดีกว่า," ขณะกำลังจะเสนอราคา 99 บาท คุณเต้นก็คิดทวนรอบสองได้ว่า "อ้ายเกลอตู่ก็ต้องคิดได้และเสนอ 99 แน่เลย งั้นเราก็ควรจะเสนอ 98 สินะ," และเมื่อคิดทวนรอบสาม "เฮ้ย ไอ้ตู่มันก็ต้องคิดเหมือนกันหนิ งั้นเราเอา 97 เอ๊ะ ไม่สิ 96 - 95 - 94 ..." สุดท้ายคุณเต้นก็คิดได้ด้วยสติปัญญาอันชาญฉลาดว่า "เราควรจะเสนอ 2 บาทซึ่งเป็นราคาต่ำสุด เพราะหากเป็นราคานี้ ตู่มันไม่มีทางเสนอได้ต่ำกว่าและขโมยโบนัสไปกินคนเดียวแน่นอน" (2 เป็นราคาต่ำที่สุดที่เสนอได้ ถึงจะมีใครเสนอน้อยกว่า 2 บาท ก็ไม่ได้โบนัสแล้ว เพราะสายการบินไม่สามารถจะปรับคุณตู่หรือคุณเต้นจนติดลบได้)

ช่างน่าอัศจรรย์มากๆ! คุณตู่ก็คิดเหมือนกันกับคุณเต้น และได้ข้อสรุปเดียวกันว่าควรเสนอ 2 บาท ตกลงวันนั้นทั้งคู่จึงได้รับชดเชยค่าเสียหายคนละ 2 บาทไปโม้ให้นายใหญ่ฟัง

อ่านบทความเกี่ยวกับ Traveler's Dilemma ได้จาก Scientific American

เรื่องทั้งหมดอาจจะฟังดูงี่เง่า คนสติดีที่ไหนจะเลือกเอาเงิน 2 บาทแทนที่จะรับ 100 บาท? แต่วิธีคิดของคุณตู่-คุณเต้นข้างต้น มีชื่อว่า "Backward Induction" ซึ่งเป็นวิธีที่นักทฤษฎีเกมใช้คิดแก้ปัญหาทฤษฎีเกมมาแล้วหลายต่อหลายเกม การที่ทั้งคู่เสนอราคา 2 บาทเป็นจุดที่อยู่ในสมดุล Nash Equilibrium (ชื่อเรียก Nash Equilibrium ตั้งตาม John Forbes Nash Jr. นักคณิตศาสตร์ผู้โด่งดัง ภาพยนตร์เรื่อง Beautiful Mind ก็อิงมาจากชีวประวัติของนักคณิตศาสตร์คนนี้)

กำหนดให้ ราคาประเมินสูงสุดแทนค่าด้วย M, และรางวัล-ค่าปรับความซื่อสัตย์แทนค่าด้วย R (ซึ่งก็จะเป็นค่าต่ำสุดของราคาที่เสนอได้ไปโดยปริยาย) เราจะได้ว่า Nash Equilibrium ของ Traveler's Dilemma คือ ทั้งสองคนจะต้องเลือกเสนอราคา R บาทเสมอ ไม่ว่า M และ R จะมีค่าเท่าไรก็ตาม

(หมายเหตุ: คำอธิบาย Nash Equilibrium ที่ผมคิดว่าสั้นและดีที่สุดสำหรับคนทั่วไปที่ไม่ใช่นักคณิตศาสตร์ กล่าวได้ดังนี้ "Nash Equilibrium เป็นจุดที่ไม่จะมีใครมานั่งเสียใจภายหลังกับการเลือกของตัวเอง" ตัวอย่างในกรณีนี้ ทั้งคุณตู่และคุณเต้นก็ไม่ควรเสียใจที่ได้เงิน 2 บาท เพราะต่างคนต่างคิดอย่างเป็นเหตุเป็นผลมาแล้วว่าอีกฝ่ายต้องเลือกเสนอราคา 2 บาทเช่นกัน ฉะนั้นทางเดียวที่จะไม่เสียเปรียบอีกฝ่ายก็คือ การเสนอราคา 2 บาท)

นับตั้งแต่ที่ Traveler's Dilemma ถูกเสนอขึ้นมาโดย Kaushik Basu ในปี 1994 (The American Economic Review, 84:391-395) นักทฤษฎีเกมก็ปวดหัวกับเกมนี้มาโดยตลอด นักทฤษฎีเกมทดลองสาธิต Traveler's Dilemma กับกลุ่มตัวอย่างหลายครั้ง แต่ก็ไม่มีการทดลองไหนให้ผลตรงกับ Nash Equilibrium คนส่วนใหญ่ก็เลือกเสนอราคาสูงๆ ไว้ก่อนทั้งนั้น และการทดลองหลายอันก็แสดงให้เห็นว่าค่าเฉลี่ยของราคาเสนอนั้นแปรผกผันตามค่าของ R (ยิ่งเสนอรางวัลความซื่อสัตย์สูง คนยิ่งเลือกเสนอราคาให้ต่ำลง)

และที่น่าตลกที่สุด คือ เมื่อนักทฤษฎีเกมสามคน Tilman Becker, Michael Carter, และ Jörg Naeve ลองให้เพื่อนๆ นักทฤษฎีเกม 51 คนมาลองเล่น Traveler's Dilemma โดยมีเงินจริงๆ เป็นรางวัล ผลปรากฏว่า 20% ในกลุ่มนักทฤษฎีเลือกเสนอราคาสูงสุด $100, และเกือบ 50% เสนอ $95-$99, และมีเพียงสามคนเท่านั้นที่ยืนหยัดมั่นคงในหลักวิชาเลือกเสนอ $2 ทุกรอบ นอกนั้นก็เป็นพวกที่เปลี่ยนราคาที่เสนอไปเรื่อยๆ ในแต่ละรอบ จะเห็นว่าแม้แต่นักทฤษฎีเกมก็ยังไม่เชื่อในทฤษฎีของตัวเองเลย!

นักทฤษฎีเกมหลายคนก็คิดหาทางแก้ปัญหาของ Traveler's Dilemma โดยเสนอขึ้นมาว่าในระหว่างเล่นเกม ผู้เล่นจะเกิดการเรียนรู้ว่าผู้เล่นอีกฝ่ายก็มีแนวโน้มจะเลือกเสนอราคาในค่าที่สูงขึ้น และผู้เล่นแต่ละคนจะมี "cognitive noise" ที่ทำให้การตัดสินใจเลือกเสนอราคาไม่เป็นไปตามหลักที่ classical game theory ทำนาย (เช่น Am. Econ. Rev. 89:678–690)

แต่ทีมนักวิจัยที่นำโดย Martin A. Nowak นักทฤษฎีชีววิทยาชื่อดังแห่งมหาวิทยาลัยฮาร์วาร์ด รู้สึกว่าทางแก้ปัญหา Traveler's Dilemma ที่เคยใช้ๆ กันมา ยังไม่ใช่คำตอบที่สมบูรณ์ แนวคิดเรื่องการเรียนรู้ระหว่างเกมและ cognitive noise ไม่สามารถใช้อธิบายได้ว่าทำไมคนถึงเลือกเสนอราคาค่าสูงๆ ตั้งแต่ในรอบแรกๆ ของเกม และมันก็ไม่สามารถใช้อธิบาย Traveler's Dilemma ที่เกิดในระหว่างสัตว์ที่ไม่ได้มีสติปัญญาชาญฉลาดและยืดหยุ่นเหมือนมนุษย์ (เช่น การวางไข่ของแม่นกสองตัวที่ใช้รังร่วมกัน - Proc. R. Soc. B 278:1728-1735)

ทีมของ Martin A. Nowak เลยเสนอมุมมองใหม่ในการแก้ปัญหา Traveler's Dilemma ขึ้นมาซะเลย นั่นก็คือ การเอาทฤษฎีเกมเชิงวิวัฒนาการ (evolutionary game theory) เข้ามาอธิบายแทนการใช้ classical game theory

แทนที่จะมองการแข่งขันใน Traveler's Dilemma แยกเป็นคู่เดี่ยวๆ ทีมของ Martin Nowak กลับมองหาคำตอบอันเป็นกลยุทธ์ที่มีแนวโน้มจะถูกคัดเลือกเก็บไว้ในประชากร สมมติว่ามียีนกลยุทธ์สองแบบในประชากร คือ A และ B ซึ่งกระจายตัวเท่าๆ กัน คนที่มียีน A ก็จะเสนอราคาเป็น a ตลอด และ B ก็จะเสนอราคา b ตลอด (หากใครไม่ชอบการใช้คำว่า "ยีน" ในบริบทนี้ อาจจะใช้คำว่า "meme" แทนก็ได้นะ) ซึ่ง b < a ถ้าไม่มีการกลายพันธุ์เลย (no mutation) และแรงในการคัดเลือกอ่อนมาก (weak selection) เราจะได้ว่า

  • เมื่อ A เจอ A ทั้งคู่จะได้รับเงิน a

  • เมื่อ B เจอ B ทั้งคู่จะได้รับเงิน b

  • เมื่อ A เจอ B คนที่มียีน A จะได้รับเงิน b-R ส่วนคนที่มียีน B จะได้รับเงิน b+R

ดังนั้นค่าเฉลี่ยเงินที่ A ได้รับจากการแข่งขันกับสมาชิกคนอื่นๆ ในประชากรก็จะเท่ากับ a+b-R และค่าเฉลี่ยเงินที่ B ได้รับเท่ากับ b+b+R

ในกรณีที่ R มีค่าน้อยเมื่อเทียบกับความแตกต่างระหว่าง a กับ b เราก็จะได้ว่าคนที่มียีน A ได้เปรียบยีน B และมีแนวโน้มจะถูกคัดเลือกเก็บไว้ในประชากรมากกว่า (เพราะ a+b-R > b+b+R) ยีน A เป็นกลยุทธ์ของการเสนอราคาสูงๆ ดังนั้นประชากรจึงเต็มไปด้วยคนที่เสนอราคาสูงสุดหรือราคาสูงๆ เข้าใกล้ค่า M

ในทางตรงกันข้าม กรณีที่ R มีค่าสูงเมื่อเทียบกับความแตกต่างระหว่าง a กับ b คนที่มียีน B ก็จะได้เปรียบและมีแนวโน้มถูกเก็บไว้ในประชากร (เพราะ a+b-R < b+b+R) ค่าเฉลี่ยของราคาที่ถูกเสนอจึงต่ำลงเรื่อยๆ แปรผกผันกับค่า R ที่สูงขึ้น ซึ่งเป็นลักษณะเดียวกับที่สังเกตได้ในผลการทดลองจริง

ทีมของ Martin Nowak ได้นำเอาแนวคิดทฤษฎีเกมเชิงวิวัฒนาการมาสร้างแบบจำลองของ Traveler's Dilemma ในกรณีต่างๆ ที่มีแรงของการคัดเลือก (ผลประโยชน์ที่ได้จากการชนะฝ่ายตรงข้าม) และอัตราการกลายพันธุ์ (โอกาสที่ลูกหลานของยีน A หรือยีน B กลายไปเป็นยีนอื่น) ผันแปรหลากหลาย และสรุปออกมาได้ว่าในระบบที่มีแรงคัดเลือกรุนแรงมาก (strong selection) คนจะเลือกเสนอราคาที่เข้าใกล้ R ซึ่งเป็นค่าต่ำสุด ส่วนอัตราการกลายพันธุ์จะทำหน้าที่เป็นเหมือนกับตัวช่วยผ่อนแรงไม่ให้ยีนที่เสนอค่าใดค่าหนึ่งกลืนกินยีนอีกตัวเร็วเกินไป

ถ้ายังไม่เห็นภาพ ลองนึกดูว่า ถ้าคุณตู่คุณเต้นจริงจังกับการแข่งขันที่สนามบินมาก ใครแพ้ต้องเต้นท่าไก่ย่างกลางสนามบินและเสียพนันให้กับอีกฝ่าย 100 บาท (แรงคัดเลือกสูง) ทั้งสองคนก็ต้องเลือกเสนอราคา 2 บาท = R ไว้ก่อนเพื่อให้อุ่นใจว่าตัวเองจะไม่แพ้ แต่ถ้าสมมติว่าหนึ่งในสองคนนี้หรือทั้งสองคนเป็นคนความจำสั้น คิดอะไรแปบนึงก็ลืม คิดใหม่ก็ออกมาไม่เหมือนเดิม (อัตราการกลายพันธุ์สูง) พวกเขาก็จะเลือกค่าโน้นบ้างค่านี้บ้างตามแต่ใจ แต่พอโดนแรงคัดเลือกหนักๆ (ที่ต้องเต้นไก่ย่างกับเสียเงินเพิ่ม) ประชากรความคิดของทั้งสองคนก็จะเริ่มๆ ถูกคัดเลือกให้เลือกทางข้อเสนอที่ตัวเองมีโอกาสชนะมากขึ้น

เมื่อลองเอาแบบจำลองที่สร้างขึ้นไปเทียบกับค่าที่สังเกตได้จากการทดลองเก่าๆ ผลปรากฏว่าแบบจำลองของทีม Martin Nowak ทำได้ดีพอสมควร ให้ค่าที่ใกล้เคียงกับค่าที่สังเกตได้จริง มีคลาดเคลื่อนไปบ้าง แต่ก็เป็นความคลาดเคลื่อนเพียงเล็กน้อยเท่านั้น

Martin Nowak เห็นว่าแบบจำลองที่ทีมของเขาพัฒนาขึ้นมานี้เจ๋งกว่าแบบจำลองหรือคำตอบเดิมๆ มาก เพราะไม่ต้องอิงอยู่กับประสบการณ์ระหว่างเกมหรือความสามารถในการใช้เหตุผลของคน (ความจริงแบบจำลองของ Martin Nowak เป็น stochastic model ด้วยซ้ำ นั่นคือทางเลือก ณ เวลาหนึ่งๆ ไม่ได้ถูกกำหนดโดยเหตุการณ์ก่อนหน้า มันมีแนวโน้มที่จะเลือกเป็นได้หลายทาง) ทำให้ Traveler's Dilemma สามารถอธิบายปรากฏการณ์ทางธรรมชาติได้กว้างขึ้น

งานวิจัยของทีม Martin Nowak ตีพิมพ์ใน Journal of Theoretical Biology 303 (2012), 119–127 doi: 10.1016/j.jtbi.2012.03.014

6 Comments

witna's picture

ว่าแต่ จะไม่มีใครคิดจะตอบตามราคาที่ซื้อมาจริงๆ เลยรึ ?

mementototem's picture

นั่นดิ? แต่โจทย์เขาไม่ได้บอกว่าซื้อมาเท่าไหร่คงตอบไม่ได้อยู่ดี?

chayaninw's picture

ในฐานะแฟนของสายคลาสสิก ก็ขอมองความล้มเหลวผ่านกรอบของสายคลาสสิกเองนะครับ

ปรกติแล้ว การที่เกมจะเล่นแล้วได้ดุลยภาพของแนชเนี่ย มันจะต้องมีเงื่อนไขพื้นฐานหรือสมมติฐานพอสมควร เป็นสมมติฐานที่ ถ้าไม่ยึดตามแล้ว ผลที่ได้มันก็อาจจะออกมาไม่เป็นไปตามการวิเคราะห์ปรกติได้

ส่วนใหญ่สมมติฐานนั้นก็ทั่วๆ ไปที่คุ้นเคย ว่าแต่ละคนรู้ผลตอบแทนภายในเกมนั้นดี และแต่ละฝ่ายใช้ความคิดเป็นเหตุเป็นผลได้สมบูรณ์ และข้อหนึ่งที่ค่อนข้างซับซ้อนและยากคือ ผู้เล่นทุกคนจะต้องรู้ว่าผู้เล่นทุกคนนั้นผ่านเงื่อนไข

ข้อนี้ยากมาก และเป็นข้อที่เป็นปัญหากับ backward induction มาก ในขณะที่เกมที่มีความซับซ้อนต่ำ (เช่น Prisoner's dilemma) ต่อให้ตัดข้อนี้ออกไป ก็ยังคงมีดุลยภาพเหมือนเดิมได้

ถ้าเราลองเปรียบเทียบ traveller's dilemma กับ prisoner's dilemma ดู สองเกมนี้มีความคล้ายคลึงกันอย่างหนึ่งคือ สุดท้ายแล้ว ดุลยภาพจะเป็นจุดที่แต่ละฝ่ายได้ผลตอบแทนน้อยกว่าที่ควรจะได้หากสองฝ่ายร่วมมือกัน (ในกรณีของ prisoner's ก็คือ เลือกไม่สารภาพทั้งคู่ ก็จะดีกว่าสารภาพทั้งคู่ หรือใน traveller's ก็คือ ถ้าเลือกตอบ 100 ทั้งคู่ ก็ย่อมดีกว่าเลือกตอบ 2 ทั้งคู่)

สิ่งที่แตกต่างกันก็คือ ใน prisoner's dilemma นั้น เราสามารถหากลยุทธ์เด่น (dominant strategy) ซึ่งสำหรับผู้เล่นที่คิดเป็นเหตุเป็นผลแล้ว ก็จะรู้ว่า ไม่ว่าอีกฝ่ายจะเลือกแบบไหนก็ตาม เราก็จะเลือกสารภาพ ดังนั้น หากทั้งสองฝ่ายคิดแบบนี้ ก็จะได้ผลตามดุลยภาพของแนช โดยที่แต่ละฝ่ายไม่จำเป็นต้องมั่นใจว่าอีกฝ่ายจะตอบเหมือนกันหรือไม่

แต่ในกรณีของ traveller's dilemma และอีกหลายๆ เกม ในขั้นตอนของการ deduction นั้น เราจะเห็นได้เลยว่า เราจะต้องมั่นใจได้ว่าอีกฝ่ายหนึ่งคิดแบบเดียวกัน (คุณเต้นก็คิดทวนรอบสองได้ว่า "อ้ายเกลอตู่ก็ต้องคิดได้และเสนอ 99 แน่เลย...) ซึ่งส่วนใหญ่เวลาเป็นการทดลองจริง ข้อนี้น่าจะเป็นข้อที่มีปัญหามากที่สุด เพราะ เราไม่มั่นใจว่า คนอื่นจะคิดแบบเดียวกันหรือไม่

หากเราลองวิเคราะห์โดยตัดสมมติฐานที่ว่า ทุกคนรู้ว่าคนอื่นเป็นแบบเดียวกัน ออกไป การวิเคราะห์ของผู้เล่นก็จะเปลี่ยนไป การวิเคราะห์ขั้นแรกสุด ว่าจะต้องตอบไม่เกิน 99 (ห้ามตอบ 100) นั้นยังคงเป็นการวิเคราะห์ที่ถูกต้องอยู่ เพราะยังไง 99 ก็จะให้ผลตอบแทนที่ไม่น้อยกว่าการตอบ 100 เสมอ (เป็น weak domination ทางคณิตศาสตร์) แต่การวิเคราะห์ว่าต้องตอบไม่เกิน 98 แทนที่จะเป็น 99 นั้น ไม่ได้ dominate ทางเลือกอื่น เพราะหากว่าอีกฝ่ายโง่ตอบ 100 ขึ้นมา เราก็จะเสียประโยชน์จากการตอบ 98 แทนที่จะเป็น 99 (ได้เงิน 100 แทนที่จะเป็น 101) ดังนั้น ในสถานการณ์ที่ทดลองจริง หากผู้เล่นแต่ละคนไม่สามารถมั่นใจได้ว่า ผู้เล่นคนอื่นจะวิเคราะห์เกมนี้ในแบบเดียวกัน ก็จะเป็นการตัดสินใจที่เป็นเหตุเป็นผลได้ ที่จะตอบทางเลือกอื่นที่ไม่ใช่ 2

ดังนั้น ในกรณีนี้ การที่ผู้เล่นนั้นไม่เลือกตอบตามที่วิเคราะห์ดุลยภาพของแนช ไม่ใช่เพราะผู้เล่นนั้น irrational แต่ผู้เล่นนั้นก็ rational ตามสมมติฐานที่เหลืออยู่ (ซึ่งยังไม่พอเข้าเงื่อนไขของดุลยภาพของแนช)

(ถ้าสนใจ เกม Guess 2/3 of the average ก็ใช้วิธีคิดแบบเดียวกัน แล้วก็ล้มเหลวในการทดลองเหมือนๆ กัน)

narok119's picture

ผมว่าคำอธิบายนี้ดีกว่าของข่าวนี้ซะอีกนะ

terminus's picture

ลึกซึ้ง สมกับการคาดหวังของผมเลยครับ

งั้นผมขอต่ออีกหน่อยในมุมมองของสาย Evolutionary นะครับ (ผมก็ไม่รู้เหมือนกันว่าเค้านับเรียกกันเป็นสาย)

พอนักชีววิทยาไปขโมย --เอ่อ ผมหมายถึง-- ยืมเอาแนวคิดของทฤษฎีเกมมาใช้อธิบายวิวัฒนาการ มันก็ต้องเปลี่ยนบางอย่างสักหน่อย เพราะคงไม่สามารถ assume ว่าตัวผู้เล่นในเกมมี rationality ด้วยตัวเองเหมือนอย่างสายคลาสสิก นักทฤษฎีชีววิทยาจึงตั้งสมมติฐานว่ากลยุทธ์ที่เราสังเกตเห็นได้จากผลการทดลองไม่ได้เป็นเพราะว่าผู้เล่นใช้กระบวนการคิดแบบเป็นเหตุเป็นผล แต่มันเป็นกลยุทธ์ที่ just work พอที่จะให้ยีน (หรือ replication element อะไรก็ได้) ที่ encode กลยุทธ์นั้นถูก fixed ในประชากร ผลลัพธ์ของเกมที่ผ่านการกรอง natural selection มาเป็นเวลานาน imprint ทำให้ผู้เล่นมีสัญชาตญาณที่จะตัดสินใจเลือกกลยุทธ์นั้นๆ ภายใต้สถานการณ์ของเกมนั้นๆ แต่กลยุทธ์ที่อยู่ในดุลยภาพก็ไม่รับประกันว่าสิ่งมีชีวิตสปีชีส์นั้นๆ จะไม่สูญพันธุ์ หรือ เป็นสิ่งที่ดีต่อสปีชีส์นั้นๆ

กรณีเปเปอร์นี้ก็เช่นเดียวกันครับ ถ้าผมเข้าใจไม่ผิด มันก็ imply ได้ว่า authors เค้าไม่สนเลยว่าผู้เล่นจะมี rational หรือไม่ เค้ามองว่าผู้เล่นเลือกกลยุทธ์นั้นๆ โดยสัญชาตญาณที่หล่อหลอมผ่านวิวัฒนาการมาแล้ว มันติดตัวผู้เล่นมาเลยไม่ว่าจะเป็นโดย natural selection หรือ cultural selection ถ้าผู้เล่นที่เป็นมนุษย์อ้างว่าใช้ rationality ประกอบการตัดสินใจอันนั้น มันก็ยังเป็นผลจากวิวัฒนาการของมนุษย์เองที่คลุมอยู่เหนือ cognitive intelligence ของมนุษย์อีกที ประมาณว่าเลือกโดย gut feeling กันเลยทีเดียว

เช่น ตัวอย่างนกวางไข่ คู่แม่นกในรังมีสิทธิ์เลือกที่จะวางไข่เมื่อไรก็ได้โดยแบ่งพื้นที่ในรังระหว่างกัน แต่พื้นที่ในรังมีจำกัด หากแม่นกตัวแรกวางไข่ก่อนภายในวันแรกๆ ของฤดูวางไข่ (เทียบได้กับการเคลมเอาเงินค่าเสียหายสูง) แม่นกอีกตัวก็จะแอบเตะไข่ของแม่นกตัวแรกทิ้ง และวางไข่ของตัวเองเข้าไปแทนที่ ดังนันแม่นกทั้งคู่ต่างก็ต้องจ้องรอให้อีกตัววางไข่ก่อน กรณีนี้ดุลยภาพของแนช (อันนี้ผมก็เพิ่งรู้ว่าเค้าแปลว่า "ดุลยภาพ") ก็คือรอแม่งไปเรื่อยๆ จนกระทั่งหมดฤดูวางไข่ ซึ่งไม่มีทางเป็นไปได้ กลยุทธ์แบบนี้พานกสูญพันธุ์หมดแน่ๆ สิ่งที่สังเกตได้ในธรรมชาติก็คือแม่นก "ร่วมมือกัน" วางไข่ในวันแรกๆ ซึ่งแม้จะมีโอกาสโดนอีกตัวเตะไข่ทิ้ง fitness (จำนวนไข่ที่วางได้) ก็ยังสูงกว่าการรอไปจนสุดฤดูวางไข่ทั้งคู่

เอาเข้าจริง ตอนที่เค้าเอาไปเทียบกับผลการทดลองที่สังเกตได้ (ในการทดลองกับคน) ผมก็รู้สึกว่าเค้าแอบ "โกง" เล็กๆ นะ เพราะเขาปรับค่าพารามิเตอร์ของแรงคัดเลือกและการกลายพันธุ์เอาเอง (arbitrarily) เพื่อให้ผลจากแบบจำลองมันใกล้เคียงกับผลที่สังเกตได้ และ authors ก็ยอมรับกลายๆ ด้วยว่ามันยังไม่สมบูรณ์ แต่เค้าก็คิดว่าแนวคิด evolutionary game theory น่าจะช่วยเติมเต็มสิ่งที่ classical game theory ยังขาดไปได้

chayaninw's picture

เพิ่งเห็นว่าคุณ terminus เข้ามาเสริมต่อด้วย

คำว่า "สาย" นี่ จริงๆ ก็อาจจะไม่น่าใช้เท่าไหร่ แต่ผมติดใช้คำนี้ (เวลาเรียกแนวคิดปรัชญาแบบต่างๆ ก็ชอบเรียกสายนู้นสายนี้ ไม่รู้คนอื่นเขาใช้กันหรือเปล่า)

ส่วนเรื่องชีววิทยานี่ ผมชอบเห็นงานสาขาประยุกต์แบบนี้นะ (อย่างสาขา neuroeconomics นี่ก็ชอบ) แต่โดยส่วนตัวแล้ว ไม่ค่อยประสีประสาด้านชีววิทยาเท่าไหร่ (เรียนชีววิทยาม.ปลายยังไม่ใคร่จะรอดเลย) และพอเป็นแนวนี้ มันจะจับมาชนกันตรงๆ กับวิธีคิดแบบดั้งเดิมของคณิตศาสตร์ก็คงไม่ได้ เพราะมันคือการไปจับสิ่งที่อยู่เหนือ assumption ทางคณิตศาสตร์ ถ้าทฤษฎีนี้ถูก สิ่งที่เกิดขึ้นก็คือ assumption มันก็พังไป คล้ายๆ กับพวกการทดลองแนว behavioural ที่พยายามจะบอกว่าคนไม่ใช่ homo economicus (ที่ตลกอย่างหนึ่งคือ ปรกติแนวคิดค้านว่า คนไม่ใช่ homo economicus มักจะพยายามบอกว่า คนเราก็มีด้านที่อยากให้คนอื่นได้ดี แต่เคยมีการทดลองนึง ที่พยายาม prove ว่า คนเราไม่ rational เพราะมีด้านที่อยากเห็นคนอื่นล่มจมทั้งที่ตัวเองไม่ได้อะไร)