An Entity of Type: building, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

The prisoner's dilemma is a standard example of a game analyzed in game theory that shows why two completely rational individuals might not cooperate, even if it appears that it is in their best interests to do so. It was originally framed by Merrill Flood and Melvin Dresher while working at RAND in 1950. Albert W. Tucker formalized the game with prison sentence rewards and named it "prisoner's dilemma", presenting it as follows:

Property Value
dbo:abstract
  • معضلة السجينَين هي النواة الأساسية لمشكلة التعاون ضمن نظرية الألعاب. تتضمن اللعبة متهمين، لا يملك المحقق أدلةً كافية على أي منهما لإثبات الجرم. الخيارات المتاحة أمام كل متهم أثناء التحقيق هي: إما أن يشهد على المتهم الآخر أمام القاضي، أو أن يلتزم الصمت. في حال آثر المتهمان الصمت، لا تستطيع المحكمة إثبات التهمة على أي منهما، ويحكم على كل منهما بالسجن ستة أشهر فقط. أما لو شهد أحد المتهمين على صاحبه، يخرج الشاهد دون حكم ويحكم على الآخر بالسجن عشر سنوات. إذا اختار كلا المتهمين أن يشهد على الآخر، يحكم على الاثنين بخمس سنوات من السجن. كلا المتهمين لا يعلم بقرار الآخر أثناء التحقيق معه. (ar)
  • Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat ("s vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat).Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů. Dominantní strategií (tzv. strictly dominating – „přísně dominující“) je zde nespolupráce, tj. bez ohledu na to, jakou strategii si vybere spoluhráč, vykazuje nespolupráce pro hráče vždy lepší výsledek než spolupráce. Racionální hráč se rozhodne pro „zradu“. Takže pro hru je jediná možná rovnováha, a to když oba hráči nespolupracují. Tato rovnováha však překvapivě nemusí vést k Paretovsky optimálnímu řešení. To znamená, že pokud by oba hráči zůstali loajální, v konečném součtu by oba dva získali více, než když nespolupracují. Jiná situace nastane, pokud jde o tzv. iterované (opakované) vězňovo dilema, hra se hraje opakovaně. Hráč tu má možnost „potrestat“ druhého za předchozí nekooperativní hru. Zde se racionální strategií může stát spolupráce. Čím více se počet opakování blíží k nekonečnu, tím více Nashova rovnováha směřuje k Paretovu optimu. (cs)
  • Το δίλημμα του φυλακισμένου γνωστό παράδειγμα της θεωρίας των παιγνίων. Μπορεί να χρησιμοποιηθεί ως πρότυπο σε πολλές καταστάσεις του πραγματικού κόσμου που αφορούν συμπεριφορές συνεργασίας. Μπορεί να εφαρμοστεί σε καταστάσεις που δεν ταιριάζουν απόλυτα τα κριτήρια των κλασικών ή επαναληπτικών παιχνιδιών. Για παράδειγμα σε αυτά που θα μπορούσαν και οι δύο οντότητες να κερδίσουν σημαντικά οφέλη από τη συνεργασία ή να υποστούν την αποτυχία αν το πράξουν, αλλά θεωρούν αδύνατο ή δαπανηρό να συντονίσουν τις δραστηριότητες τους για την επίτευξη της συνεργασίας. Το «δίλημμα του φυλακισμένου» εξετάζει τις στρατηγικές επιλογές λογικά σκεπτόμενων παικτών που εμπλέκονται σε ανταγωνιστικές καταστάσεις. Δύο άτομα συλλαμβάνονται από την αστυνομία σαν ύποπτοι διάπραξης κάποιων εγκλημάτων. Η αστυνομία δεν έχει όλα τα απαιτούμενα στοιχεία για να τους κατηγορήσει, οπότε τους βάζει σε χωριστά δωμάτια, εμποδίζοντάς τους να έχουν οποιαδήποτε επικοινωνία. Ο εισαγγελέας επισκέπτεται και τους δύο, τον καθένα χωριστά, και κάνει στον καθένα την εξής πρόταση: * Αν καταθέσει εναντίον του άλλου (και ο άλλος δεν μιλήσει) τότε η συνεργασία αμοίβεται με άμεση απελευθέρωση, ενώ ο «άλλος» θα τιμωρηθεί με 12 χρόνια. * Αν δε μιλήσει ούτε αυτός ούτε ο άλλος θα τιμωρηθούν και οι δύο με 1 χρόνο φυλακή για ήσσονος σημασίας αδικήματα για τα οποία η αστυνομία έχει αποδείξεις. * Αν καρφώσουν και οι δύο ο ένας τον άλλον τότε θα τιμωρηθούν με 4 χρόνια ο καθένας. Ποια είναι η αναμενόμενη ορθολογικά «βέλτιστη» στάση του καθενός απ’ τους κρατούμενους; ρωτάει η θεωρία παιγνίων. Θυμίζουμε ότι «ορθολογισμός» για τους ειδικούς αυτού του μοντέλου είναι να κοιτάει ο καθένας το συμφέρον του, δηλαδή είτε το μέγιστο όφελος είτε την μικρότερη ζημιά του, λαμβάνοντας υπόψη του ότι και ο άλλος (ο «αντίπαλος»…) θα κάνει το ίδιο. Πρόκειται για υπόθεση της ανάλυσης που αποδίδεται με τον όρο "κοινή γνώση" (της ορθολογικότητας). Σύμφωνα λοιπόν με την θεωρία, ο κάθε κρατούμενους, ας πούμε ο Α και ο Β, έχει τις πιο κάτω επιλογές: Με δεδομένο ότι οι κανόνες είναι κοινοί και για τους δύο θεωρούμε ότι και οι δύο κάνουν τις ίδιες λογικές σκέψεις. Σκέψη του Α: "Εάν ο Β με καταδώσει τότε τι πρέπει να κάνω; Στην περίπτωση που δεν τον καταδώσω τότε εμπίπτω στον 1ο κανόνα από αυτούς που μας έθεσαν, όντας ο ένοχος και θα φυλακιστώ για 12 χρόνια, ενώ αν τον καταδώσω εμπίπτουμε και οι δύο στον 3ο κανόνα και θα φυλακιστώ για 4. Με συμφέρει λοιπόν να τον καταδώσω." ... " Εάν ο Β δεν με καταδώσει τότε τι πρέπει να κάνω;Στην περίπτωση που τον καταδώσω τότε εμπίπτω στον 1ο κανόνα και θα απελευθερωθώ όντας ο αθώος που συνεργάστηκε, ενώ αν δεν τον καταδώσω εμπίπτουμε και οι δύο στον δεύτερο κανόνα και θα φυλακιστούμε και οι δυο 1 χρόνο. Πάλι με συμφέρει να τον καταδώσω." Με αυτές τι λογικές σκέψεις του ο Α ως που ενδιαφέρεται πάντα για το μεγαλύτερο για αυτόν όφελος (σε αντίθεση με τον που κίνητρο του αποτελεί το κοινό όφελος με το περιβάλλον του), αποφασίζει να καταδώσει τον Β διότι τον συμφέρει και στις δύο περιπτώσεις. Ωστόσο και για τον Β ισχύουν οι ίδιοι κανόνες με συνέπεια να καταδώσει και αυτός τον Α. Προβλέπουμε λοιπόν ότι από αυτή τη διαδικασία και οι δύο ορθολογικοί άνθρωποι που θέλουν το άμεσο ατομικό τους συμφέρον θα τιμωρηθούν με 4 χρόνια. Αν συνυπολόγιζαν και το όφελος του συγκατηγορούμενού τους ως δικό τους όφελος τότε θα έβγαζαν το συμπέρασμα ότι το μεγαλύτερο όφελος πρέπει να λογίζεται ώς συνολικό και είναι τα 2 χρόνια φυλάκισης (1 ο καθένας), σε σχέση με τα 12 χρόνια (12 ο ένας και 0 ο άλλος) αλλά και τα 8 χρόνια (από 4 ο καθένας). Με αυτό στο μυαλό, εάν και οι δύο ήταν homo reciprocans, τότε η στρατηγική συνεργασίας τους θα ήταν να μην καταδώσει ο ένας τον άλλο και να λάβουν ποινή απο 1 χρόνο ο καθένας. Μέρος της ευθύνης της αστοχίας ορισμένων βραβευμένων κατα τ' άλλα οικονομικών θεωριών, οφείλεται στο οτι ο άνθρωπος προσεγγίζεται ως έλλογο ον (rational individual, ως homo economicus) και οι θεωρίες αυτές μόνο σε αυτή τη βάση αναπτύσσονται. Από την παραπάνω θεώρηση αποδεικνύεται οτι η συνεργασία με τις αμοιβαία επωφελείς στρατηγικές είναι πολλές φορές πιο δόκιμη από την επιδίωξη για άμεσο ατομικό όφελος (1 χρόνος ποινή αντί 4 χρόνια). Πρέπει να πούμε ότι σε αυτό το παράδειγμα, όπως και σε κάθε κατάσταση (παίγνιο) της θεωρίας παιγνίων (Game Theory), υποθέτουμε ότι οι εμπλεκόμενοι (οι παίκτες) είναι απόλυτα λογικοί και έχουν ως αποκλειστικό γνώμονα τη μεγιστοποίηση του κέρδους ή την ελαχιστοποίηση του κόστους (όπως σε αυτή την περίπτωση). Θα περίμενε ίσως κάποιος ότι δύο λογικοί άνθρωποι θα επέλεγαν το βέλτιστο δυνατό αποτέλεσμα που θα συνέφερε και τους δύο περισσότερο από αυτό που τελικά κατάφεραν, δηλαδή, να κρατήσουν και οι δύο τη σιωπή τους και να πάνε στη φυλακή με μια ποινή μόνο ενός έτους. Πώς κατέληξαν λοιπόν εδώ τα πράγματα; Η απάντηση βρίσκεται στην εμπιστοσύνη που δείχνει ο ένας στην απόφαση του άλλου. Με άλλα λόγια, με δεδομένη κάθε επιλογή του αντίπαλου παίκτη, το αποτέλεσμα του ανταγωνισμού επικρατεί έναντι του αποτελέσματος της συνεργασίας. Το παραπάνω παράδειγμα καταδεικνύει ότι το «κοινό συμφέρον» δεν είναι πάντα η επιλογή απόλυτα λογικά σκεπτόμενων ατόμων και πολλές φορές απόλυτα λογικά επιλογές μπορούν να οδηγήσουν σε ζημία για όλους τους εμπλεκόμενους. Η κατάσταση αλλάζει αν το παιχνίδι επαναλαμβάνεται, οπότε κάθε παίκτης έχει τη δυνατότητα να «τιμωρήσει» μέσω της επιλογής του τον άλλο παίκτη για την προηγούμενη παρασπονδία του. Σε αυτή την περίπτωση, όταν οι επαναλήψεις του παιγνίου τείνουν στο άπειρο, η επιλογή της συνεργασίας (να κρατήσουν και οι δύο τη σιωπή τους) τείνει στο να επικρατήσει. Αν όμως οι δύο ύποπτοι, μπορούσαν να επικοινωνήσουν, θα έβλεπαν ότι η καλύτερη λύση είναι η μη ομολογία. Αλλά όπως αναφέρθηκε και πιο πάνω δεν αποκλείεται η πιθανότητα της προδοσίας. Όμως αν οι δύο ύποπτοι έχουν ξαναέρθει αντιμέτωποι με το συγκεκριμένο πρόβλημα , έχουν συνεννοηθεί και δεν υπάρχει περίπτωση προδοσίας, τότε δε θα μιλήσουν. Αυτή η ισορροπία λέγεται “υπό-παιγνιακή τέλεια ισορροπία Νας”. Η βέλτιστη στρατηγική για κάποιον παίχτη είναι να κρατήσει το στόμα του κλειστό στον πρώτο γύρο και στην συνέχεια να επαναλαμβάνει αυτό που έκανε ο άλλος παίχτης στον προηγούμενο γύρο. Η στρατηγική αυτή επικράτησε ώς καλύτερη, σε διαγωνισμό επινοήθηκε απο τον Ανατόλ Ράποπορτ, αποκαλείται "μία σου, μία μου" (TIT FOR TAT) και αποδεικνύεται με γενετικούς αλγόριθμους. Μεταφέροντας το παράδειγμα στην καθημερινή ζωή μπορούμε να βγάλουμε πολύ χρήσιμα συμπεράσματα για πράγματα που φαίνονται λογικό να γίνουν αλλά τελικά επιλέγεται κάτι διαφορετικό που οδηγεί σε χειρότερα αποτελέσματα. (el)
  • Das Gefangenendilemma ist ein mathematisches Spiel aus der Spieltheorie. Es modelliert die Situation zweier Gefangener, die beschuldigt werden, gemeinsam ein Verbrechen begangen zu haben. Die beiden Gefangenen werden einzeln vernommen und können nicht miteinander kommunizieren. Leugnen beide das Verbrechen, erhalten beide eine niedrige Strafe, da ihnen nur eine weniger streng bestrafte Tat nachgewiesen werden kann. Gestehen beide, erhalten beide dafür eine hohe Strafe, wegen ihres Geständnisses aber nicht die Höchststrafe. Gesteht jedoch nur einer der beiden Gefangenen, geht dieser als Kronzeuge straffrei aus, während der andere als überführter, aber nicht geständiger Täter die Höchststrafe bekommt. Das Dilemma besteht nun darin, dass sich jeder Gefangene entscheiden muss, entweder zu leugnen (also zu versuchen, mit dem anderen Gefangenen zu kooperieren) oder zu gestehen (also den anderen zu verraten), ohne die Entscheidung des anderen Gefangenen zu kennen. Das letztlich verhängte Strafmaß richtet sich allerdings danach, wie die beiden Gefangenen zusammengenommen ausgesagt haben und hängt damit nicht nur von der eigenen Entscheidung, sondern auch von der Entscheidung des anderen Gefangenen ab. Beim Gefangenendilemma handelt es sich um ein symmetrisches Spiel mit vollständiger Information, das sich entsprechend in Normalform darstellen lässt. Die dominante Strategie beider Gefangenen ist, zu gestehen. Diese Kombination stellt auch das einzige Nash-Gleichgewicht dar. Hingegen würde eine Kooperation der Gefangenen für beide zu einer niedrigeren Strafe und damit auch zu einer niedrigeren Gesamtstrafe führen. Das Gefangenendilemma taucht bei einer Vielzahl soziologischer und ökonomischer Fragestellungen auf. In den Wirtschaftswissenschaften wird das Gefangenendilemma als Teil der Spieltheorie auch den entscheidungsorientierten Organisationstheorien zugeordnet. Es ist nicht zu verwechseln mit dem Gefangenenparadoxon über bedingte Wahrscheinlichkeiten und dem Problem der 100 Gefangenen der Kombinatorik. (de)
  • La Prizonula Dilemo estas speco de matematika ludo originale farita por kaj en 1950. Pli malfrue, Albert W. Tucker formaligis ĝin kun la temo de la kondamno je tempo de prizono kaj donis al la ĝenerala problemo tiun ĉi specifan nomon. Du ludantoj elektas sekrete, ĉu silenti ĉu perfidi la alian ludanton. Se unu ludanto elektas "silenti" kaj aliaj elektas "perfidi", la perfidanto gajnas maksimume kaj la silenta prizonulo malgajnegas. Tamen, se la du prizonuloj ambaŭ elektas "silenti", la du prizonuloj ankaŭ gajnas. (eo)
  • Presoaren dilema Joko-teoriaren oinarrizko problema bat da. Dilema honek agerian uzten du bi pertsonek elkarlan egiteari uko egin ahal diotela, elkarlanean aritzeari uzteak haien interesen kontrakoa izan arren. Presoaren dilema, eta garatu zuten 1950ean, RAND enpresan lanean ari ziren bitartean. Joko estandarren teoriaren analisi teknikek, Nash orekak adibidez, jokalari bakoitza beste jokalaria traizionatzera eraman dezakete, elkarlan eginda emaitza hobeak lortuko balituzkete ere. (eu)
  • El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas. Fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban en RAND en 1950. Albert W. Tucker formalizó el juego con la frase sobre las recompensas penitenciarias y le dio el nombre del "dilema del prisionero" (Poundstone, 1995). Es un ejemplo de problema de suma no nula. Las técnicas de análisis de la teoría de juegos estándar, por ejemplo determinar el equilibrio de Nash, pueden llevar a cada jugador a escoger traicionar al otro, pero ambos jugadores obtendrían un resultado mejor si colaborasen. En el dilema del prisionero iterado, la cooperación puede obtenerse como un resultado de equilibrio. Aquí se juega repetidamente, por lo que, cuando se repite el juego, se ofrece a cada jugador la oportunidad de castigar al otro jugador por la no cooperación en juegos anteriores. Así, el incentivo para defraudar puede ser superado por la amenaza del castigo, lo que conduce a un resultado cooperativo. (es)
  • The prisoner's dilemma is a standard example of a game analyzed in game theory that shows why two completely rational individuals might not cooperate, even if it appears that it is in their best interests to do so. It was originally framed by Merrill Flood and Melvin Dresher while working at RAND in 1950. Albert W. Tucker formalized the game with prison sentence rewards and named it "prisoner's dilemma", presenting it as follows: Two members of a criminal organization are arrested and imprisoned. Each prisoner is in solitary confinement with no means of communicating with the other. The prosecutors lack sufficient evidence to convict the pair on the principal charge, but they have enough to convict both on a lesser charge. Simultaneously, the prosecutors offer each prisoner a bargain. Each prisoner is given the opportunity either to betray the other by testifying that the other committed the crime, or to cooperate with the other by remaining silent. The possible outcomes are: * If A and B each betray the other, each of them serves two years in prison * If A betrays B but B remains silent, A will be set free and B will serve three years in prison * If A remains silent but B betrays A, A will serve three years in prison and B will be set free * If A and B both remain silent, both of them will serve only one year in prison (on the lesser charge). It is implied that the prisoners will have no opportunity to reward or punish their partner other than the prison sentences they get and that their decision by itself will not affect their reputation in the future. As betraying a partner offers a greater reward than cooperating with them, all purely rational self-interested prisoners will betray the other, meaning the only possible outcome for two purely rational prisoners is for them to betray each other, even though mutual cooperation would yield greater reward. In this case, "to betray" is the dominant strategy for both players, meaning it is the player's best response in all circumstances, and it is aligned with the Sure-thing Principle. The prisoner's dilemma also illustrates that the decisions made under collective rationality may not necessarily be the same as that made under individual rationality, and this conflict can also be witnessed in a situation called "Tragedy of the Commons". This case indicates the fact that public goods are always prone to over-use. In reality, such systemic bias towards cooperative behavior happens despite what is predicted by simple models of "rational" self-interested action. This bias towards cooperation has been known since the test was first conducted at RAND; the secretaries involved trusted each other and worked together for the best common outcome. The prisoner's dilemma became the focus of extensive experimental research. These experimental research usually take one of these three forms: single play, iterated play and iterated play against a programmed player, each with different purposes. And as a summary of these experiments, their results justify the Categorical Imperative raised by Kant, which states that a rational agent is expected to "act in the way you wish others to act." This theory is vital for a situation when there are different players each acting for their best interest, and has to take others' acts into consideration to form his own choice. It underlines the interconnectedness of players in such a game, and thus stressing the fact that a strategy has to consider others' reactions to be successful, including their responsiveness, their tendency to imitate, etc. An extended "iterated" version of the game also exists. In this version, the classic game is played repeatedly between the same prisoners, who continuously have the opportunity to penalize the other for previous decisions. If the number of times the game will be played is known to the players, then (by backward induction) two classically rational players will betray each other repeatedly, for the same reasons as the single-shot variant. In an infinite or unknown length game there is no fixed optimum strategy, and prisoner's dilemma tournaments have been held to compete and test algorithms for such cases. The iterated version of prisoner's dilemma is of particular interest for researchers. Due to its iterative nature, previous researchers observed that the frequency for players to cooperate could change, based on the outcomes of each iteration. Specifically, players may be less willing to cooperate if his counterpart did not cooperate for many times, which renders disappointment. Conversely, as time goes by, cooperation could increase mainly attributable to the fact that a "tacit agreement" between players has been set up. Another interesting aspect concerning the iterated version of experiment, however, is that, this tacit agreement between players has always been established successfully even though the number of iterations is made public to both sides. The prisoner's dilemma game can be used as a model for many involving cooperative behavior. In casual usage, the label "prisoner's dilemma" may be applied to situations not strictly matching the formal criteria of the classic or iterative games: for instance, those in which two entities could gain important benefits from cooperating or suffer from the failure to do so, but find it difficult or expensive—not necessarily impossible—to coordinate their activities. (en)
  • Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l'absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l'un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer. Le dilemme du prisonnier est souvent évoqué dans des domaines comme l'économie, la biologie, la politique internationale, les politiques commerciales (avantage et risques d'une guerre des prix), la psychologie, le traitement médiatique de la rumeur, et même l'émergence de règles morales dans des communautés. Il a donné naissance à des jeux d'économie expérimentale testant la rationalité économique des joueurs et leur capacité à identifier l'équilibre de Nash d'un jeu. (fr)
  • 囚人のジレンマ(しゅうじんのジレンマ、英: prisoners' dilemma)とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである。各個人が合理的に選択した結果(ナッシュ均衡)が社会全体にとって望ましい結果(パレート最適)にならないので、社会的ジレンマとも呼ばれる。 1950年に数学者のアルバート・タッカーが考案した。ランド研究所のとの行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている。 囚人のジレンマではゲームを無期限に繰り返すことで協力の可能性が生まれる()。囚人のジレンマは、自己の利益を追求する個人の間でいかに協力が可能となるかという社会科学の基本問題であり、経済学、政治学、社会学、社会心理学、倫理学、哲学などの幅広い分野で研究されているほか、自然科学である生物学においても、生物の協力行動を説明するモデルとして活発に研究されている。 (ja)
  • Het prisoner's dilemma (in het Nederlands wel gevangenendilemma) is een gedachte-experiment uit de speltheorie dat laat zien waarom volledig rationele individuen die niet met elkaar kunnen communiceren misschien niet samenwerken, ook al lijkt het in hun belang te zijn om dat wel te doen. (nl)
  • O dilema do prisioneiro faz referência a um problema da teoria dos jogos, sendo um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em muitos outros, supõe-se que cada jogador, de forma independente, quer aumentar ao máximo a sua própria vantagem sem lhe importunar o resultado do outro jogador. As técnicas de análise da teoria de jogos padrão, como por exemplo determinar o equilíbrio de Nash, podem levar a que cada jogador escolha trair o outro, embora ambos os jogadores obtenham um resultado mais favorável se colaborarem. Infelizmente para os prisioneiros, cada jogador é incentivado individualmente a defraudar o próximo, mesmo após a promessa recíproca de colaboração. Este é o ponto-chave do dilema, ou seja, deverá ou não deverá o prisioneiro egoísta colaborar com o próximo sem o trair, para que a vantagem do grupo, equitativamente distribuída, possa ser maximizada? No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui joga-se repetidamente, e quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar o outro jogador pela não cooperação em jogos anteriores. Assim, num processo iterativo, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, ou seja, mais cooperativo. (pt)
  • Dylemat więźnia – problem w teorii gier. Jest oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać, zdradzając przeciwnika, ale obaj stracą, jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę. W odróżnieniu jednak od dylematu kurczaków w tej grze istnieje większe pole do współpracy, które może zaistnieć w strategiach wielokrotnego dylematu więźnia. Dylemat więźnia został wymyślony przez dwóch pracowników RAND Corporation: Melvina Dreshera i Merrill Flood w 1950 roku. sformalizował jego zasady i jako pierwszy użył nazwy dylemat więźnia (Poundstone, 1992). W klasycznej formie jest przedstawiany następująco: Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się, czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić? Jeśli założymy, że każdy z więźniów woli krótszy wyrok niż dłuższy i że żadnemu nie zależy na niskim wyroku drugiego, możemy opisać ten dylemat w terminach teorii gier. Więźniowie grają wtedy w grę, w której dopuszczalne strategie to: współpracuj (milcz) i zdradzaj (zeznawaj). Celem każdego gracza jest maksymalizacja swoich zysków, czyli uzyskanie jak najkrótszego wyroku. W tej grze zdradzaj jest strategią ściśle dominującą: niezależnie od tego, co robi przeciwnik, zawsze bardziej opłaca się zdradzać niż współpracować. Jeśli współwięzień milczy, zdradzanie skróci wyrok z sześciu miesięcy do zera. Jeśli współwięzień zeznaje, zdradzanie skróci wyrok z dziesięciu lat do pięciu. Każdy gracz racjonalny będzie zatem zdradzał i jedyną równowagą Nasha jest sytuacja, gdy obaj gracze zdradzają. W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali. Iterowany dylemat więźnia (patrz niżej) polega na rozgrywaniu tej samej gry wielokrotnie. Wtedy każdy gracz ma możliwość ukarania drugiego gracza za zdradzanie w poprzedniej rundzie. W tej sytuacji, jeśli straty wynikające z ukarania będą większe niż zyski ze zdradzania, współpraca obu graczy może utworzyć stan równowagi. Taka gra może mieć też wiele innych stanów równowagi. (pl)
  • Диле́мма заключённого (англ. Prisoner's dilemma, реже употребляется название «дилемма банди́та») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована и в 1950 году. Название дилемме дал математик Альберт Такер. В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, каким бы ни было поведение другого игрока, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство. Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма. В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму). (ru)
  • Fångarnas dilemma är inom spelteori ett känt exempel på ett spel för två personer, där det tillhör kategorin icke-nollsummespel. Den matematiska versionen av spelet skapades ursprungligen av Merrill Flood och Melvin Dresher när de arbetade vid den amerikanska tankesmedjan RAND Corporation på 1950-talet. Det var dock matematikern Albert W. Tucker som gav spelet dess namn och som hittade på exemplet med fångarna när han ville formulera en mer populär och lättförståelig version av Floods och Dreshers resultat. (sv)
  • 囚徒困境(英語:Prisoner's Dilemma)是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。 單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。 囚徒困境的主旨為,囚徒們彼此合作,堅不吐實,可為全體帶來最佳利益(縮短刑期),但在無法溝通的情況下,因為出賣同伙可為自己帶來利益(無罪開釋),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量,所以這是一個參考性的學術問題。 (zh)
  • У теорії ігор дилема в'язня (ДВ) — гра з , в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших. У дилемі в'язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду. Поводячись окремо раціонально, разом учасники приходять до нераціонального рішення: якщо обидва зрадять, вони одержать в сумі менший виграш, ніж якби співпрацювали (єдина рівновага в цій грі не веде до Парето-оптимального рішення). У цьому і полягає дилема. У дилемі в'язня, що повторюється, гра відбувається періодично, і кожен гравець може «покарати» іншого за неспівпрацю раніше. У такій грі співпраця може стати рівновагою, а стимул зрадити може переважуватися загрозою покарання (із зростанням числа ітерацій рівновага Неша прагне до Парето-оптимуму). (uk)
dbo:thumbnail
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 43717 (xsd:integer)
dbo:wikiPageLength
  • 77806 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1068852971 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dct:isPartOf
dct:subject
gold:hypernym
rdf:type
rdfs:comment
  • معضلة السجينَين هي النواة الأساسية لمشكلة التعاون ضمن نظرية الألعاب. تتضمن اللعبة متهمين، لا يملك المحقق أدلةً كافية على أي منهما لإثبات الجرم. الخيارات المتاحة أمام كل متهم أثناء التحقيق هي: إما أن يشهد على المتهم الآخر أمام القاضي، أو أن يلتزم الصمت. في حال آثر المتهمان الصمت، لا تستطيع المحكمة إثبات التهمة على أي منهما، ويحكم على كل منهما بالسجن ستة أشهر فقط. أما لو شهد أحد المتهمين على صاحبه، يخرج الشاهد دون حكم ويحكم على الآخر بالسجن عشر سنوات. إذا اختار كلا المتهمين أن يشهد على الآخر، يحكم على الاثنين بخمس سنوات من السجن. كلا المتهمين لا يعلم بقرار الآخر أثناء التحقيق معه. (ar)
  • La Prizonula Dilemo estas speco de matematika ludo originale farita por kaj en 1950. Pli malfrue, Albert W. Tucker formaligis ĝin kun la temo de la kondamno je tempo de prizono kaj donis al la ĝenerala problemo tiun ĉi specifan nomon. Du ludantoj elektas sekrete, ĉu silenti ĉu perfidi la alian ludanton. Se unu ludanto elektas "silenti" kaj aliaj elektas "perfidi", la perfidanto gajnas maksimume kaj la silenta prizonulo malgajnegas. Tamen, se la du prizonuloj ambaŭ elektas "silenti", la du prizonuloj ankaŭ gajnas. (eo)
  • Presoaren dilema Joko-teoriaren oinarrizko problema bat da. Dilema honek agerian uzten du bi pertsonek elkarlan egiteari uko egin ahal diotela, elkarlanean aritzeari uzteak haien interesen kontrakoa izan arren. Presoaren dilema, eta garatu zuten 1950ean, RAND enpresan lanean ari ziren bitartean. Joko estandarren teoriaren analisi teknikek, Nash orekak adibidez, jokalari bakoitza beste jokalaria traizionatzera eraman dezakete, elkarlan eginda emaitza hobeak lortuko balituzkete ere. (eu)
  • 囚人のジレンマ(しゅうじんのジレンマ、英: prisoners' dilemma)とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである。各個人が合理的に選択した結果(ナッシュ均衡)が社会全体にとって望ましい結果(パレート最適)にならないので、社会的ジレンマとも呼ばれる。 1950年に数学者のアルバート・タッカーが考案した。ランド研究所のとの行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている。 囚人のジレンマではゲームを無期限に繰り返すことで協力の可能性が生まれる()。囚人のジレンマは、自己の利益を追求する個人の間でいかに協力が可能となるかという社会科学の基本問題であり、経済学、政治学、社会学、社会心理学、倫理学、哲学などの幅広い分野で研究されているほか、自然科学である生物学においても、生物の協力行動を説明するモデルとして活発に研究されている。 (ja)
  • Het prisoner's dilemma (in het Nederlands wel gevangenendilemma) is een gedachte-experiment uit de speltheorie dat laat zien waarom volledig rationele individuen die niet met elkaar kunnen communiceren misschien niet samenwerken, ook al lijkt het in hun belang te zijn om dat wel te doen. (nl)
  • Fångarnas dilemma är inom spelteori ett känt exempel på ett spel för två personer, där det tillhör kategorin icke-nollsummespel. Den matematiska versionen av spelet skapades ursprungligen av Merrill Flood och Melvin Dresher när de arbetade vid den amerikanska tankesmedjan RAND Corporation på 1950-talet. Det var dock matematikern Albert W. Tucker som gav spelet dess namn och som hittade på exemplet med fångarna när han ville formulera en mer populär och lättförståelig version av Floods och Dreshers resultat. (sv)
  • 囚徒困境(英語:Prisoner's Dilemma)是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇。或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。 單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。 囚徒困境的主旨為,囚徒們彼此合作,堅不吐實,可為全體帶來最佳利益(縮短刑期),但在無法溝通的情況下,因為出賣同伙可為自己帶來利益(無罪開釋),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量,所以這是一個參考性的學術問題。 (zh)
  • Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat ("s vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat).Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů. (cs)
  • Das Gefangenendilemma ist ein mathematisches Spiel aus der Spieltheorie. Es modelliert die Situation zweier Gefangener, die beschuldigt werden, gemeinsam ein Verbrechen begangen zu haben. Die beiden Gefangenen werden einzeln vernommen und können nicht miteinander kommunizieren. Leugnen beide das Verbrechen, erhalten beide eine niedrige Strafe, da ihnen nur eine weniger streng bestrafte Tat nachgewiesen werden kann. Gestehen beide, erhalten beide dafür eine hohe Strafe, wegen ihres Geständnisses aber nicht die Höchststrafe. Gesteht jedoch nur einer der beiden Gefangenen, geht dieser als Kronzeuge straffrei aus, während der andere als überführter, aber nicht geständiger Täter die Höchststrafe bekommt. (de)
  • Το δίλημμα του φυλακισμένου γνωστό παράδειγμα της θεωρίας των παιγνίων. Μπορεί να χρησιμοποιηθεί ως πρότυπο σε πολλές καταστάσεις του πραγματικού κόσμου που αφορούν συμπεριφορές συνεργασίας. Μπορεί να εφαρμοστεί σε καταστάσεις που δεν ταιριάζουν απόλυτα τα κριτήρια των κλασικών ή επαναληπτικών παιχνιδιών. Για παράδειγμα σε αυτά που θα μπορούσαν και οι δύο οντότητες να κερδίσουν σημαντικά οφέλη από τη συνεργασία ή να υποστούν την αποτυχία αν το πράξουν, αλλά θεωρούν αδύνατο ή δαπανηρό να συντονίσουν τις δραστηριότητες τους για την επίτευξη της συνεργασίας. Σκέψη του Α: ... (el)
  • El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas. Fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban en RAND en 1950. Albert W. Tucker formalizó el juego con la frase sobre las recompensas penitenciarias y le dio el nombre del "dilema del prisionero" (Poundstone, 1995). (es)
  • Le dilemme du prisonnier, énoncé en 1950 par Albert W. Tucker à Princeton, caractérise en théorie des jeux une situation où deux joueurs auraient intérêt à coopérer, mais où, en l'absence de communication entre les deux joueurs, chacun choisira de trahir l'autre si le jeu n'est joué qu'une fois. La raison est que si l'un coopère et que l'autre trahit, le coopérateur est fortement pénalisé. Pourtant, si les deux joueurs trahissent, le résultat leur est moins favorable que si les deux avaient choisi de coopérer. (fr)
  • The prisoner's dilemma is a standard example of a game analyzed in game theory that shows why two completely rational individuals might not cooperate, even if it appears that it is in their best interests to do so. It was originally framed by Merrill Flood and Melvin Dresher while working at RAND in 1950. Albert W. Tucker formalized the game with prison sentence rewards and named it "prisoner's dilemma", presenting it as follows: (en)
  • Dylemat więźnia – problem w teorii gier. Jest oparty na dwuosobowej grze o niezerowej sumie, w której każdy z graczy może zyskać, zdradzając przeciwnika, ale obaj stracą, jeśli obaj będą zdradzać. Dylemat ten jest więc niekooperacyjną (o częściowym konflikcie) grą o sumie niezerowej, ponieważ strategia konfliktu przeważa nad strategią pokojową: najwięcej można zyskać zdradzając, a najwięcej stracić idąc na współpracę. W odróżnieniu jednak od dylematu kurczaków w tej grze istnieje większe pole do współpracy, które może zaistnieć w strategiach wielokrotnego dylematu więźnia. (pl)
  • O dilema do prisioneiro faz referência a um problema da teoria dos jogos, sendo um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em muitos outros, supõe-se que cada jogador, de forma independente, quer aumentar ao máximo a sua própria vantagem sem lhe importunar o resultado do outro jogador. (pt)
  • Диле́мма заключённого (англ. Prisoner's dilemma, реже употребляется название «дилемма банди́та») — фундаментальная проблема в теории игр, согласно которой рациональные игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована и в 1950 году. Название дилемме дал математик Альберт Такер. (ru)
  • У теорії ігор дилема в'язня (ДВ) — гра з , в якій гравці прагнуть одержати вигоду, співпрацюючи один з одним або зраджуючи. Як у всій теорії ігор, передбачається, що гравець («в'язень») максимізує свій власний виграш, не піклуючись про вигоду інших. У дилемі в'язня зрада строго домінує над співпрацею, тому єдина можлива рівновага — зрада обох учасників. Простіше кажучи, не важливо, що зробить інший гравець, кожен виграє більше, якщо зрадить. Оскільки в будь-якій ситуації зрадити вигідніше, ніж співпрацювати, всі раціональні гравці виберуть зраду. (uk)
rdfs:label
  • معضلة السجينين (ar)
  • Dilema del presoner (ca)
  • Vězňovo dilema (cs)
  • Δίλημμα του φυλακισμένου (el)
  • Gefangenendilemma (de)
  • Prizonula Dilemo (eo)
  • Dilema del prisionero (es)
  • Presoaren dilema (eu)
  • Dilemme du prisonnier (fr)
  • Prisoner's dilemma (en)
  • Dilema tahanan (in)
  • Dilemma del prigioniero (it)
  • 囚人のジレンマ (ja)
  • 죄수의 딜레마 (ko)
  • Prisoner's dilemma (nl)
  • Dylemat więźnia (pl)
  • Dilema do prisioneiro (pt)
  • Дилемма заключённого (ru)
  • Fångarnas dilemma (sv)
  • 囚徒困境 (zh)
  • Дилема в'язня (uk)
owl:differentFrom
owl:sameAs
skos:closeMatch
prov:wasDerivedFrom
foaf:depiction
foaf:isPrimaryTopicOf
is dbo:knownFor of
is dbo:wikiPageDisambiguates of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:knownFor of
is rdfs:seeAlso of
is owl:differentFrom of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License