Когда биологи задались этим вопросом, ученые других специальностей уже подыскивали ответ. В 1940-е гг. математик Джон фон Нейман, отец компьютерных технологий, разработал теорию игр – науку о принятии стратегических решений. Если сформулировать ее задачу немного иначе, то она будет звучать так: «Когда лучше прийти на выручку, а когда следует отойти в сторонку?» В те времена эта тема очень интересовала экономистов, дипломатов и военных. И было совсем нелишним открыть диалог между биологами и специалистами по теории игр. Начало было положено в 1980-е гг. предложением т. н. дилеммы заключенного (см. главу 3). Пришло время как следует в ней разобраться.
Два члена банды, А и Б, арестованы. У прокурора нет улик, чтобы обвинить их в серьезном преступлении, но он может доказать их мелкие провинности и посадить в тюрьму на год. А и Б не имеют возможности договориться. Прокурор предлагает каждому сделку: дай показания против подельника, и твой срок уменьшат. Существует четыре возможных исхода:
а) и А, и Б отказываются доносить друг на друга, тогда оба получают по году тюрьмы;
б) и А, и Б доносят друг на друга, и оба получают по два года тюрьмы;
в) А доносит на Б, тот молчит; А отпускают, а Б получает три года;
г) Б доносит на А, А держится; Б отпускают, а А получает три года.
Таким образом, дилемма заключенного предполагает выбор: остаться верным подельнику (кооперация) или донести на него (предательство). Ход мыслей может быть следующим: «Лучше кооперироваться. Это ведь мой товарищ, он меня не предаст, и мы получим по году. А если он меня все же заложит? Он уйдет, а я буду три года сидеть. Лучше уж я его предам. А если мы оба друг друга заложим? Тогда и ему, и мне по два года… Плохо… Или, может, заложить его, на случай, если он решит молчать…» И так мысль идет по кругу[879].
Если вы разыгрываете дилемму заключенного один раз, то здесь есть определенное рациональное решение. Если вы заключенный А – предатель, то ваше наказание в среднем будет год (ноль лет, если Б вас не выдаст, и два года в противном случае). Если же вы решите кооперироваться с Б, то в среднем получите два года (год, если Б тоже промолчит, и три, если выдаст вас). Значит, нужно его заложить. Так что если играется только один раунд, то оптимальным решением будет предательство. Не слишком обнадеживает с точки зрения мирового устройства.
Теперь предположим, будто бы мы играем два раунда. Если известно, что второй раунд – последний, то оптимальной стратегией для него будет предательство, как мы это разобрали для игры в один раунд. Тогда и в первом раунде нет смысла поступать иначе и тоже нужно предавать.
А что в случае с игрой в три раунда? Если третий раунд последний – нужно предавать, а значит, и во втором тоже, и в первом: правило так же действует по цепочке, как и в двухраундовой игре.
И так далее: в последнем раунде всегда выгоднее предать. Да и в предпоследнем, и в предпредпоследнем и т. д. Другими словами, если два игрока играют заданное конечное число раундов, то лучше всего (оптимальнее) будет отказаться от кооперации.
А если число раундов заранее не известно? Тогда все становится интереснее. Именно в этой точке сошлись интересы биологов и исследователей теории игр, чему поспособствовал политолог из Мичиганского университета Роберт Аксельрод. Он объяснил коллегам, как срабатывает дилемма заключенного, и спросил, что случится, если заранее не известно, сколько будет раундов. Ему было предложено немыслимое количество возможных стратегий, причем некоторые оказались зубодробительно сложными. Аксельрод написал компьютерные программы для различных стратегий и заставил компьютер имитировать, как эти стратегии «играют» парные турниры. Какая победила, какая оказалась самой выгодной?
Оптимальная стратегия была найдена математиком Анатолем Рапопортом из Торонтского университета. Это оказалась самая простая стратегия из всех, похожая на классические героические сюжеты: сначала нужно кооперироваться, а в следующий раз делать то, что сделал соперник в предыдущем раунде. Око за око, зуб за зуб. Если подробнее, то все происходит следующим образом.
В первом раунде вы выбираете кооперацию (К). И если второй игрок раз за разом тоже выбирает кооперацию (К), то вы будете кооперироваться долго и счастливо и умрете в один день.
Пример 1
Вы: КККККККККК…
Он: КККККККККК…
Теперь предположим, что другой игрок сначала кооперируется, а потом, соблазненный бесами, в 10-м раунде предает (П) вас. Вы кооперируетесь, значит, в 10-м раунде понесете потери.
Пример 2
Вы: КККККККККК.
Он: КККККККККП.
Тогда вы отвечаете ему той же монетой, наказывая в следующем раунде.
Пример 3
Вы: ККККККККККП.
Он: КККККККККП?
Если он после этого вернется к тактике кооперации, то и вы поступите так же и мир восстановится.
Пример 4
Вы: ККККККККККПККК…
Он: КККККККККПКККК…
Но если он и не подумает продолжать сотрудничество, то и вы сделаете то же самое.
Пример 5
Вы: ККККККККККППППП…
Он: КККККККККПППППП…
Но вот вам попался прожженный предатель. Тогда ситуация будет выглядеть так:
Пример 6
Вы: КПППППППП…
Он: ППППППППП…
Такова стратегия «око за око». Заметим, что в ней невозможно выиграть. В лучшем случае вы заканчиваете ничьей: это произойдет, если ваш противник тоже играет «око за око» или выбирает стратегию всегда кооперироваться. Когда же он играет как-то по-другому, то вы чуточку проигрываете. Однако если вы сами выберете любую другую стратегию, то можете проиграть несравнимо больше. И когда в конце все суммируется, то «око за око» побеждает. С этой стратегией проигрывается почти каждая битва, но выигрывается война. Или, скорее, мир. Иными словами, «око за око» оставляет позади все остальные стратегии.
Вот четыре условия для реализации стратегии «око за око»: а) должна быть предрасположенность к кооперации (т. е. кооперация будет начальной точкой действий); б) игроку нельзя быть наивным, ему следует наказывать предателей; в) игрок не должен быть злопамятным, он прощает предателя, если тот раскаялся; г) эта стратегия очень простая и понятная.
Аксельрод опубликовал миллиард статей по исследованию стратегии «око за око» в дилемме заключенного и других похожих играх (о них ниже). А затем случилось неожиданное – Аксельрод и Гамильтон познакомились. Биологи, изучающие эволюцию поведения, давно хотели приобщиться к цифрам, как, скажем, в исследованиях эволюции почек у пустынных крыс. А тут прямо у них под носом ничего не подозревавшие социологи, оказывается, именно этим и занимались. На основе дилеммы заключенного выстраивалась эволюционная стратегия кооперации и конкуренции. Аксельрод и Гамильтон так и написали в своей статье 1981 г. (она теперь настолько знаменита, что «Аксельрод и Гамильтон» стало расхожим выражением: «Как твоя лекция?» – «Ужасно, ничего не успел, даже до Аксельрода и Гамильтона не добрался»)[880].
И когда эволюционисты объединились с политологами, они в игровой сценарий добавили кое-какие правила реального мира. Благодаря одному из них был выявлен изъян стратегии «око за око».
Давайте вообразим, что произошел сбой в передаче сигнала: информация дошла в искаженном виде, или кто-то забыл что-то передать, или в системе случилась накладка. Как в реальном мире.
Вот на пятом раунде происходит этот сбой, а игроки следуют стратегии «око за око». Их действия:
Пример 7
Вы: ККККК.
Он: ККККК.
Из-за ошибки до вас доходит другая информация:
Пример 8
Вы: ККККК.
Он: ККККП.
Вы думаете: «Вот чертов жулик!» И предаете его на следующем ходу.
Пример 9
Вы: КККККП.
Он: ККККПК.
А для него, не подозревающего об ошибке, ситуация выглядит следующим образом:
Пример 10
Вы: КККККП.
Он: КККККК.
Теперь он, ясное дело, думает: «Вот чертов жулик!» – и в следующем раунде предает вас, когда вы, решив, что он раскаялся, кооперируетесь. «Ого! Ему мало? Так получай еще!» – горячитесь вы и опять предаете его. «Ого! Ему мало? Так получай еще!» – решает он в свою очередь:
Пример 11
Вы: КККККПКПКПКПК…
Он: ККККПКПКПКПКП…
И это значит, что если допустить возможность ошибки, то пара игроков, реализующих «око за око», окажется навсегда запертой в петле предательств[881].
Когда открылось это уязвимое место, эволюционисты – Мартин Новак из Гарвардского университета, Карл Зигмунд из Венского и Роберт Бойд из Калифорнийского университета в Лос-Анджелесе – предложили два возможных решения[882]. Первое из них, «око за два ока», допускает ответное предательство, только если оппонент подложил вам свинью два раза подряд. При использовании второго, получившего название «Великодушная око за око», прощается треть всех предательств. В обоих случаях удается выйти из замкнутой петли сценария с информационным сбоем, но при этом тебя используют больше положенного[883].
Как решить эту проблему? Да просто менять частоту прощений в зависимости от вероятности сбоев в системе. («Простите, я опять опоздал: поезд задержался» звучит более правдоподобно и простительно, чем «Простите, я опять опоздал: опять прямо на дорогу упал метеорит».)
Другой путь решения проблемы уязвимости к сигнальным сбоям в «око за око» – использование подвижной стратегии. В условиях бесконечного разнообразия стратегических возможностей многие начинают со стратегии «око за око», ходом событий вынужденные предавать. И когда ситуация приближается к вымиранию, переходят на «Великодушную око за око», которая при наличии информационных ошибок переигрывает обычный сценарий. Как осуществить переход от карательной «око за око» к режиму прощения? Установить доверие.
В живых системах предусматриваются и другие пути решения. Специалист по информационным технологиям из Мичиганского университета Джон Холланд ввел «генетические алгоритмы» – стратегии, которые со временем мутируют.
Еще учитывается фактор «стоимости» каждой из стратегий, которая приближает модели к реалиям мира: например, в «око за око» есть цена отслеживания и наказания мошенников, это стоимость систем наблюдения, зарплаты полиции, содержания тюрем. Ведь в мире, где нет ошибок в передаче информации, нет нужды в ином поведении, кроме как «око за око», а «око за око» может быть с легкостью заменена на более дешевую стратегию «всегда сотрудничай».
Получается, что если в системе происходят информационные сбои, то становятся важными стоимость возможных стратегий и вероятность перемен (мутаций). В этом случае запускается следующий цикл: из возможных стратегий, включая и эксплуататорские, и эгоистические, в конечном итоге остается «око за око», затем она замещается «Великодушной око за око», а та, в свою очередь, режимом «всегда сотрудничай». И все это работает до тех пор, пока не появятся мутации, формирующие эгоистические стратегии; они распространяются со скоростью лесного пожара, потому что ох как удобно быть волком среди овец, всегда готовых к сотрудничеству…[884][885] Все сильнее и сильнее модели приближались к реальным ситуациям. И вскоре смоделированные компьютерные стратегии начали «спариваться» друг с другом, что, вероятно, было самым волнующим для участвующих в этом всём математиков.
Эволюционисты, безусловно, с удовольствием создавали совместно с теоретиками-экономистами, политологами и военными стратегами постоянно усложняющиеся модели. Но главный вопрос заключался в том, насколько эти модели приложимы к поведению животных.
Один из роскошных примеров стратегии «око за око» в царстве животных подает рыбка черный гипоплектрус, особи которой образуют постоянные пары[886]. Ничего удивительного в этом нет. Гипоплектрусы могут менять свой пол (такое часто встречается у рыб). Как и всегда, размножение для самки энергетически более затратно, чем для самца. Поэтому рыбки в паре по очереди становятся самкой. Скажем, есть рыбки А и Б, они исполняют свое танго со сменой пола, и до сего дня рыбка А была самкой, но теперь хочет снять с себя тяжелые женские обязанности. При этом рыбка Б хитрит, оставаясь самцом и заставляя А тянуть и дальше эту лямку. Но А все же переключается, превращаясь в самца, и ждет, пока Б не осознает свою общественную обязанность и не станет самкой.
Широко известны примеры реализации стратегии «око за око» у колюшек[887]. Вот колюшка плавает в аквариуме, как вдруг за его стеклянной перегородкой появляется нечто ужасное – большущая рыба цихлида. Колюшка мечется из стороны в сторону, пытается понять ситуацию. Теперь поместим в колюшкину часть аквариума зеркало, поставив его перпендикулярно перегородке, т. е. теперь рядом с первой колюшкой появилась вторая . Кошмарная цихлида по-прежнему тут! Но зато откуда-то приплывшая вторая колюшка тоже внимательно обследует цихлиду – вместе с нашей первой героиней. И она наверняка думает: «Я не знаю, кто эта девчонка, но кажется, мы отличная команда».
Теперь убедите колюшку, что ее партнерша жульничает. Для этого нужно повернуть зеркало на 30° к перегородке, и тогда все будет отражаться в другую сторону. Рыбка делает рывок вперед, отражение тоже двигается, но назад. Вот негодяйка ! Она, кажется, хочет убраться подальше от опасности (для рыб отодвинуться на половину длины тела уже снижает вероятность стать жертвой). И когда колюшка понимает, что напарница предала ее, она тоже перестает изучать обстановку и приближаться к хищнику.
Усложненные варианты «око за око» практикуют животные, которые выполняют множество социальных ролей[888]. Вот львам проигрывают из кустов магнитофонную запись мощного рыка самца-чужака (или это не динамик стоит в кустах, а рычащий манекен льва в натуральную величину). Львы осторожно продвигаются туда, чтобы разведать, а это опасное предприятие. Всегда кто-то из них робко держится позади. Казалось бы, столь терпимое отношение к этим трусоватым товарищам нарушает принципы реципрокности, но потом выяснилось, что трусишки первенствуют в других львиных делах, например охоте. То же самое происходит и у дамарских пескороев, и у их родственников голых землекопов. По своей социальной организации эти животные напоминают общественных насекомых, у которых размножается лишь королева, а остальные являются бездетными рабочими[889]. Было замечено, что некоторые рабочие никогда не работают, будучи при этом заметно упитаннее остальных. Оказалось, что на них возложены две специальные задачи – во время дождливого сезона они должны заново прорывать затопленные и обрушенные туннели, а когда того требуют обстоятельства, они с риском для себя закладывают туннели для новой колонии.
Я не убежден, что реципрокная стратегия «око за око» четко показана у других видов. Но марсианским, к примеру, зоологам было бы непросто доказать ее использование и у людей: они, скорее всего, заметили бы только, как один человек выполняет всю работу, а другой ничего не делает и лишь время от времени дает первому несколько разноцветных бумажек. Главное, что у животных существует система взаимности, весьма чувствительная к мошенничеству.
Дата: 2019-07-24, просмотров: 246.