Дилемма узника

Взаимодействие между индивидуумами или группами - будь то волшебники, народы или компании - может быть отражено в простой игре под названием "дилемма узника". Идея игры заключается в имитации конфликтов, существующих в реальной жизни, между эгоистичными интересами игроков, исповедующих философию типа "победитель получает все", типичную для Слизерина, и необходимостью сотрудничества и достижения компромисса для удовлетворения этих потребностей.

Эту игру легко рассмотреть на реальном примере. Представим, что двое учеников Хогвартса попались с украденной волшебной палочкой. Поскольку палочка еще и испачкана кровью единорога, Дамблдор подозревает обоих в совершении другого, более тяжкого преступления, насчет которого у него нет никаких доказательств. Имеющихся фактов достаточно, чтобы наказать обоих за кражу волшебной палочки и снять по 50 очков с каждого факультета, но Дамблдор настаивает на расследовании факта наличия крови, так как за убийство единорога факультет виновного оштрафуют сразу на 800 очков.

Дамблдор помещает учеников в отдельные комнаты и не позволяет им общаться друг с другом. Каждому из них он предлагает следующее: если один доносит на другого и раскрывает более серьезное преступление, его факультет не теряет очки за кражу волшебной палочки, а другой факультет теряет 1000 очков. Если сознаются оба, каждый факультет теряет по 800 очков. Если оба промолчат, то каждый факультет теряет по 50 очков за кражу. Разумеется, каждый из учеников понимает, что Дамблдор поставил их в равные условия. Как им лучше всего поступить?

Представьте, что в результате хитроумного заговора в этой игре участвует Гарри Поттер и один из его врагов - ужасный приятель Малфоя - Винсент Крэбб. С его точки зрения, Гарри может сделать следующее: сотрудничать (не признаваться) или донести (признаться и обвинить другого). Крэбб может рассуждать так: если Гарри промолчит и если я промолчу, каждый факультет потеряет по 50 очков, но если я донесу, Слизерин не потеряет ничего, а Гриффиндор потеряет 1000 очков. Значит, я должен донести. Но что, если Гарри тоже донесет? Тогда, если Крэбб промолчит, Слизерин потеряет 1000 очков, но если он донесет, то каждый потеряет по 800 очков, значит, он должен донести. Поэтому "рациональным" выбором Крэбба будет донос. Поскольку Гарри находится в тех же условиях, он должен поступить так же. Оба придут к логическому заключению, что каждый должен донести на другого, и в итоге они потеряют по 800 очков и будут строго наказаны, хотя если бы они пошли на сотрудничество и промолчали, то потеряли бы лишь по 50 очков.

Дилемма узника занимает математиков, социологов и биологов, поскольку она проливает свет на более широкую проблему: как амбиции одного индивидуума ведут к коллективным страданиям. В нашем примере на конечный результат влияет множество факторов: если оба ученика учатся на одном факультете, они будут больше доверять друг другу; если они больше никогда не встретятся, то у них нет причин для сотрудничества, и т. д. Но в реальной жизни более вероятно, что сторонам еще предстоит встретиться в будущем. Тогда возможна разработка различных стратегий в этой повторяющейся дилемме узника.

Весьма влиятельной фигурой в этой области является Роберт Аксельрод из Мичиганского университета, который в 1980 году провел мировой чемпионат компьютерных программ для поиска наилучшего решения дилеммы узника. Победило решение "зуб за зуб". Как ясно из названия, в первом раунде предполагается вести сотрудничество, а во всех последующих раундах - копировать действия оппонента. Хотя это "неплохая" стратегия в том смысле, что она призывает к сотрудничеству, в целом она не очень умна. Слишком сложная стратегия может показаться противнику непостижимой, и это устранит все предпосылки для сотрудничества. Успех стратегии "зуб за зуб" заключен в ее простоте, и признание ее успешности вселяет оптимизм в тех, кто считает, что человеческая природа основана на жадности и корыстных интересах - типичное поведение Малфоев.

В целом для общества эта стратегия означает, что успешный предприниматель является скорее меркантильным искателем сотрудничества, а не беспринципным игроком. Сотрудничество возникает в обществе согласно принципу "дарите, и вам воздастся". Хорошие люди, вроде учеников Гриффиндора, не должны выходить из игры последними.

Однако в реальной жизни с хорошими людьми, как правило, это и происходит. Необходимость сотрудничества возникает, когда выполняется одно из следующих условий: игроки постоянно сталкиваются друг с другом; они узнают друг друга; они помнят результаты предыдущих встреч. Но есть и другие факторы, которые следует принять во внимание, от случайного столкновения игроков до ошибки (когда попытка сотрудничества воспринимается как предательство) и возможности того, что генетические факторы, определяющие поведение, передаются из поколения в поколение. Приняв во внимание эти реалии, Роберт (ныне лорд) Мэй из Оксфорда в 1987 году указал, что выдающаяся работа Аксельрода слишком идеалистична для применения в реальном мире.

Попытки показать, как стратегия "зуб за зуб" справляется с этими сложностями, предприняли Мартин Новак из Института передовых исследований в Принстоне и Карл Зигмунд из Венского университета. Они выяснили, что при введении фактора ошибки - это вызвано общечеловеческой тенденцией совершать ошибки - "зуб за зуб" уже не может быть преобладающей стратегией, поскольку она необратима: как только игроки начнут враждовать, они уже не остановятся. Учитывая принцип неопределенности, отдельные игроки могут начать разработку новых стратегий. Определенная случайность поведения допускает "прощение" и шанс проверить поведение других игроков. Стратегия, принимающая во внимание эти возможности, где фактор случайности прерывает циклы взаимных ударов в спину, называется "благородной". Другая, более успешная стратегия, носит название "Павлов", суть ее выражается словами "то, что не сломано, нельзя починить (и если вы проигрываете, то надо менять стратегию)". Неопределенность, однако, допускает сотрудничество, и оптимистический подход Аксельрода сохраняется.

Еще одно решение дилеммы узника предложили Мартин Новак и Роберт Мэй, создав модель игры в двух измерениях и изучив ситуацию на примере шахмат. При наличии географической составляющей игроки могут существовать бок о бок не как отдельные индивидуумы, а как группы. В реальном мире это означает, что обширные популяции хозяев и паразитов, хищников и жертв могут сосуществовать общинами, несмотря на нестабильность внутренних взаимоотношений.

Это объясняет, почему стабильность сообщества Хогвартса сохраняется при условии выделения каждому факультету отдельных комнат, а не размещения всех студентов в огромном зале в случайном порядке. Согласно математической модели, когда те, кто склонен к сотрудничеству, например факультет Гриффиндор, встречают других склонных к сотрудничеству, то они стремятся к процветанию. При этом те, кто не склонен к сотрудничеству, то есть факультет Слизерин, не могут полностью добиться превосходства (хотя в любой ситуации при взаимодействии с кооператорами они преуспевают), поскольку они плохо взаимодействуют друг с другом, в то время как кооператоры благоденствуют и даже могут "изменить" своих оппонентов на пути к взаимному сотрудничеству.

Но даже эта модель слишком идеалистична. Большое число людей сотрудничает в обществах, где, в отличие от шахматной доски, они часто сталкиваются с индивидуумами, которых больше никогда не встретят. Они занимаются благотворительностью, участвуют в политических движениях и подчиняются социальным нормам. Учитывая количество единичных столкновений между людьми, почему общество не распадается на части? Результаты экспериментов говорят, что ответом на этот вопрос является наказание.

Эрнст Фер из Университета Цюриха и Саймон Гачтер из Университета Сент-Галлен в Швейцарии разработали финансовую игру, участники которой, никогда прежде не знавшие друг друга, должны решать, как распоряжаться своими личными ресурсами - вкладывать их в общий котел или наживаться на выгоде от общественного духа остальных. Эта игра является попыткой решить социальную дилемму "трагедии общедоступности" или игры в "общественные блага". В этой игре участникам предлагается внести свои деньги в общественный фонд, который затем удваивается экспериментатором и распределяется в равных долях, независимо от того, сколько денег вложили отдельные участники. Группа как единое целое получит максимальную прибыль, если ее участники сделают максимальные вклады, но первый игрок, который ничего не вложит, получит только личную выгоду. Эта игра является парадигмой многих проблем человечества, например нашей неспособности следить за окружающей средой и сохранять глобальный климат. В мире Хогвартса примером такой игры может быть общественное стремление купить гоночные метлы всем членам факультета.

В швейцарском эксперименте 240 игроков были перемешаны таким образом, чтобы никто не мог более одного раза встретиться с другим игроком и никто не мог создать репутацию подлого или благородного участника. Без применения финансовых штрафов по отношению к тем, кто не делает общественных инвестиций, а лишь наживается на благородных намерениях окружающих, сотрудничество стремительно слабело на протяжении шести раундов, когда остальные игроки наказывали "халявщиков" путем отказа в сотрудничестве. Общество распалось. "Наш эксперимент показывает, что, если группа участников может наказывать других лишь посредством отказа в сотрудничестве, сотрудничество между всеми членами группы быстро ослабевает", - говорит Фер. Если же по отношению к "халявщикам" применялось конкретное наказание, общее благо процветало, и в этом случае более 90% игроков делали денежные взносы. "Если есть возможность применять конкретное наказание к тем, кто отказывается сотрудничать, сотрудничество процветает даже при условии единичных столкновений без повторения, - говорит Фер. - Главное, чтобы наказание применялось по отношению к нарушителям и было конкретным, а не просто отказом в сотрудничестве".

Наиболее успешная стратегия получила название "альтруистическое наказание" и применяла финансовые штрафы по отношению к игрокам, определявшим наказание для других. Исследователи обнаружили, что, несмотря на издержки, игроки получали скорее психологическое, а не материальное удовлетворение от этой стратегии, поскольку они сильно страдали, когда их эксплуатировали другие игроки. Таким образом, в основе устойчивого сотрудничества лежит нечто большее, чем личные интересы. Альтруистическое наказание является одной из составляющих "клея", который не дает распасться обществу.

Смотритель Хогвартса Аргус Филч много нудил о том, чтобы ему снова разрешили подвешивать провинившихся учеников к потолку на пару дней. Он даже держал у себя арсенал цепей и кандалов на этот случай. Его требование о причинении боли не выглядит слишком альтруистичным, поскольку кажется, что ему ничего бы не стоило поступать именно так и, возможно, даже доставляло бы ему удовольствие. Однако обитатели Хогвартса, с которыми знаком Гарри, часто снимают очки с факультетов за плохое поведение их представителей, равно как и начисляют их за победы. Это приводит нас к альтруистическому наказанию, поскольку члены факультетов критикуют своих коллег, чье плохое поведение снимает с них очки, вызывая общий спад настроения. Гермиона отчитала Гарри и Рона за ночные прогулки, напомнив им, что это может лишить Гриффиндор ценных очков. Когда очередные ночные скитания обошлись факультету в 150 очков, Гарри превратился из одного из самых популярных учеников в наиболее презираемого. "Ученики наказывают друг друга, осыпая своих товарищей насмешками за нарушение групповых норм. Большинство наказаний за такие нарушения являются альтруистическими", - объясняет Фер.

Еще один пример группового альтруистического наказания - это запрет на участие в матче по квиддичу звездного игрока, поскольку он нарушил определенные командные правила. Содержание под арестом - еще один вид наказаний в Хогвартсе - также выглядит вполне альтруистическим: учитель тратит свое время на наблюдение за виновным; и когда посреди ночи Гарри помогал Хагриду искать Запретный лес, Хагрид также шел на риск. "Зачастую начальники не любят наказывать. Наказание других часто не является удобным или подходящим. Наши эмоции помогают нам превзойти эту инертность в наказании других, и это уже считается альтруистическим наказанием, - говорит Фер. - Так что даже наказание, исходящее от начальства - хотя формально у них есть на это полное право (как у полицейских, учителей или руководителей компаний), - может считаться альтруистическим". Дж. К. Роулинг непреднамеренно показала, что утопическое общество, в котором все стремятся сотрудничать без угроз и наказаний, является неосуществимой мечтой.

Роджер Хайфилд

Проза жизни • "Гарри Поттер" и наука: Настоящее волшебство