Δευτέρα, 21 Σεπτεμβρίου 2009

H στρατηγική και οι επιλογές, «ισορροπία Nash»


Στην κλασική θεωρία παιγνίων έχουμε ένα σύνολο παικτών, ένα σύνολο στρατηγικών, που υπαγορεύει τη δράση την οποία πρέπει να ακολουθήσει κάθε παίκτης και μια «συνάρτηση ανταπόδοσης» για κάθε επιλογή στρατηγικής. H ανταπόδοση παριστάνεται με μια αριθμητική τιμή. 

Σκοπός ενός παίκτη είναι βέβαια να βελτιστοποιήσει την ανταπόδοση γι' αυτόν. Επειδή όμως και οποιοσδήποτε άλλος προσπαθεί να πετύχει τον ίδιο στόχο, το ερώτημα είναι πώς θα πρέπει να ενεργήσει κάθε παίκτης. 

Ένα μέγεθος που θα προσδιόριζε τον σκοπό ενός παίκτη είναι η λεγόμενη «ισορροπία Nash», μια έννοια που οφείλεται στον νομπελίστα μαθηματικό και οικονομολόγο John Nash, η τυραννισμένη ζωή του οποίου αποτέλεσε το θέμα της γνωστής ταινίας «Ένας υπέροχος άνθρωπος»

 Ο John Nash έδειξε ότι σε κάθε στατικό παιχνίδι με ένα πεπερασμένο σύνολο στρατηγικών υπάρχει τουλάχιστον μία κατάσταση ισορροπίας, που αντιστοιχεί σε επιλογές στρατηγικής οι οποίες παρέχουν τη βέλτιστη ανταπόδοση και για τους δύο παίκτες: κανένας παίκτης δεν μπορεί να πετύχει κάτι καλύτερο αλλάζοντας τη στρατηγική του, τη στιγμή που η στρατηγική του άλλου παραμένει αμετάβλητη. 

H εργασία του Nash δεν δείχνει ωστόσο το πώς μπορεί κανείς να υπολογίσει μια τέτοια ισορροπία ούτε πόσες από αυτές υπάρχουν. Στην πραγματικότητα, ακόμη και απλά παιχνίδια έχουν μια πλειάδα ισορροπιών Nash και δεν υπάρχει τρόπος να ξεχωρίσει κανείς κάποια ιδιαίτερη.

Μάλιστα, εκτός από το γεγονός ότι, αν και οι δύο παίκτες αποφασίσουν να μεγιστοποιήσουν την ανταπόδοσή τους, υπάρχει περίπτωση να καταλήξουν στο χειρότερο δυνατό αποτέλεσμα και για τους δύο, το πρόσθετο πρόβλημα είναι πως, ακόμη και αν διαλέξουν μια στρατηγική που αντιστοιχεί σε μια ισορροπία Nash, το αποτέλεσμα μπορεί να είναι να απεμπολήσουν μια ευνοϊκότερη ανταπόδοση.


Αυτό φαίνεται στο φημισμένο «δίλημμα του κρατούμενου»

Ας υποθέσουμε ότι δύο άνθρωποι έχουν συλληφθεί ως ύποπτοι για κάποια παράβαση που έκαναν από κοινού. Οι δύο ύποπτοι κρατούνται σε διαφορετικά δωμάτια για ανάκριση, χωρίς να είναι σε θέση να επικοινωνούν μεταξύ τους.
  •  Αν ο ένας εξ αυτών ομολογήσει, ενώ ο άλλος κρατήσει το στόμα του κλειστό, τότε αυτός που ομολόγησε θα αφεθεί ελεύθερος, ενώ ο άλλος που κράτησε το στόμα του κλειστό θα καταδικαστεί σε φυλάκιση τριών χρόνων.
  • Αν και οι δύο ομολογήσουν (προδίδοντας έτσι ο ένας τον άλλον), τότε θα καταδικαστούν σε φυλάκιση δύο χρόνων ο καθένας.
  • Αν, τέλος, και οι δύο κρατήσουν το στόμα τους κλειστό (ουσιαστικά συνεργαζόμενοι), τότε θα καταδικαστούν σε φυλάκιση ενός χρόνου ο καθένας.

H ισορροπία Nash υπάρχει όταν και οι δύο ύποπτοι ομολογούν, αν και η περίπτωση που συνεργάζονται κρατώντας το στόμα τους κλειστό έχει καλύτερη ανταπόδοση για τον καθέναν τους.

1 σχόλιο:

  1. To δίλημμα του κρατούμενου, όσο απλό φαίνεται στην ερμηνεία του, τόσο δύσκολο είναι όταν το βιώνεις, καθόσον αφορά καθαρά σε οικοδόμηση εμπιστοσύνης και συνεργατικού πνέυματος και κατά συνέπεια συμπεριφοράς μεταξύ των ανθρώπων. Αν το αναγάγουμε στον κοινωνικό ή οικονομικό ή πολιτικό τομέα βλέπουμε άλλα πράγματα. Ήτοι να πληρώσω εγω τους φόρους μου ΑΛΛΑ ο άλλος θα τους πλρώσει; Τα παραδείγματα είναι άπειρα.

    Σε όλους μας περνά η σκέψη "τί συμφέρει εμένα; ή ποιό θα είναι το μέγιστο ατομικό όφελος;

    Δεν καταλαβαίνουμε όμως ότι, η κατάκτηση της μέγιστης ατομικής ωφέλειας παράγει τελικά δεινά στο σύνολο!

    Μην ξεχάμε όμως ότι η ισσοροπία στο παράδειγμα επιτυγχάνεται όταν και οι δύο ομολογούν!! (φυσικό αφού δεν εμπιστεύονται ο ενας τον άλλον, που ξέρεις ότι αν ομολογήσεις εσύ τι έκανε ο άλλος;)

    ΑπάντησηΔιαγραφή