Человек доказал свое превосходство над компьютером в безлимитном покере

Двухнедельный турнир по покеру между лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. О научно значимых результатах турнира сообщается в пресс-релизе университета.

Соревнование проходило в питтсбургском казино Rivers. Люди и компьютер соревновались ежедневно с 11 утра до 10 вечера. Всего прошло около 80 тысяч раздач. Три игрока закончили турнир с выигрышем 529, 213 и 70 тысяч долларов, а один — с проигрышем 80 тысяч.

Однако при всей величине выигрыша превосходство людей на самом деле оказалось весьма шатким: 732 тысячи долларов при общем объеме ставок в 170 миллионов. Таким образом, истинным итогом оказалась статистическая ничья (сумма выигрыша не дотянула до статистически значимой).

«Наша цель — это не победить человека. Мы стремимся создать искусственный интеллект, который поможет людям принимать решения в ситуациях с множеством неизвестных фактов — в лечении болезней, в деловых переговорах, при покупке машины», — отметил главный разработчик Claudico Туомас Сандхольм (Tuomas Sandholm).

Стратегия системы опирается на ее собственные алгоритмы, а не на ходы и тактику известных игр с участием человека. Claudico уже сыграл сам с собой несколько триллионов партий. Запускаются эти алгоритмы на суперкомпьютере Blacklight, причем единственной информацией на вводе являются правила игры в покер. К концу игры файлы со стратегией Claudico заняли около двух терабайт — гораздо больше, чем способны изучить исследователи.

Сильной стороной системы оказалась способность быстро и случайным образом переключаться между различными стратегиями, слабой — медленная настройка на манеру игры индивидуального противника.

«Это хороший, но не выдающийся игрок. Некоторые его ставки ставили меня в тупик. Вряд ли какой человек поставит 19 тысяч, чтобы сорвать банк 700 долларов. Зато Claudico никогда не теряет хладнокровия — даже огромный проигрыш не влияет на его дальнейшую игру», — поделился своими впечатлениями один из участников турнира Дуг Полк (Doug Polk).

Покер является важнейшим испытанием для искусственного интеллекта, так как это игра с неполной информацией, где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать эту информацию в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добивается паритета с ним, то над покером программисты безуспешно бьются с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров).

В январе 2015 года канадским ученым удалось написать компьютерную программу, способную на слабое решение техасского холдема с лимитированными ставками. Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь.

lenta.ru

Оставаться в курсе всех наших новостей?

<div style="border:1px; width:450px; border-color:#701c1f; background-color:#F5F5F5; font-family:Verdana, Arial, Helvetica, sans-serif"><div style="float:right; text-align:right"><a href="http://polit.pro"><img src="http://polit.pro/logo.png" height="15"/></a><br /><a href="<?if()?><?else?>/_nw/264/69720393.jpg<?endif?>" class="class1"><img src="/_nw/264/69720393.jpg" width="105" border="2"></a></div><b style="font-size:13px"><span style="color:#701c1f;">12 Мая 2015</span> - Человек доказал свое превосходство над компьютером в безлимитном покере</b><br /><span style="font-size:11px"><a href="/news/1-0-8" title="Ещё материалы >>>" style="text-decoration:none; color:#000000"><div id="nativeroll_video_cont" style="display:none;"></div>Двухнедельный турнир по покеру между лучшей компьютерной программой и четырьмя профессионалами (из первой десятки рейтинга лучших игроков мира) закончился победой человека. Разработанная в Университете Карнеги-Меллон программа Claudico проиграла в безлимитный техасский холдем около 732 тысяч долларов. О научно значимых результатах турнира сообщается в пресс-релизе университета. <br /><br /> Соревнование проходило в питтсбургском казино Rivers. Люди и компьютер соревновались ежедневно с 11 утра до 10 вечера. Всего прошло около 80 тысяч раздач. Три игрока закончили турнир с выигрышем 529, 213 и 70 тысяч долларов, а один — с проигрышем 80 тысяч. <br /><br /> Однако при всей величине выигрыша превосходство людей на самом деле оказалось весьма шатким: 732 тысячи долларов при общем объеме ставок в 170 миллионов. Таким образом, истинным итогом оказалась статистическая ничья (сумма выигрыша не дотянула до статистически значимой). <br /><br /> «Наша цель — это не победить человека. Мы стремимся создать искусственный интеллект, который поможет людям принимать решения в ситуациях с множеством неизвестных фактов — в лечении болезней, в деловых переговорах, при покупке машины», — отметил главный разработчик Claudico Туомас Сандхольм (Tuomas Sandholm). <br /><br /> Стратегия системы опирается на ее собственные алгоритмы, а не на ходы и тактику известных игр с участием человека. Claudico уже сыграл сам с собой несколько триллионов партий. Запускаются эти алгоритмы на суперкомпьютере Blacklight, причем единственной информацией на вводе являются правила игры в покер. К концу игры файлы со стратегией Claudico заняли около двух терабайт — гораздо больше, чем способны изучить исследователи. <br /><br /> Сильной стороной системы оказалась способность быстро и случайным образом переключаться между различными стратегиями, слабой — медленная настройка на манеру игры индивидуального противника. <br /><br /> «Это хороший, но не выдающийся игрок. Некоторые его ставки ставили меня в тупик. Вряд ли какой человек поставит 19 тысяч, чтобы сорвать банк 700 долларов. Зато Claudico никогда не теряет хладнокровия — даже огромный проигрыш не влияет на его дальнейшую игру», — поделился своими впечатлениями один из участников турнира Дуг Полк (Doug Polk). <br /><br /> Покер является важнейшим испытанием для искусственного интеллекта, так как это игра с неполной информацией, где участники обладают скрытым от остальных знанием о своих картах, а также могут использовать эту информацию в свою пользу (например, блефовать). Если в играх с полной информацией (например, шахматах, где оба игрока видят положение всех фигур на доске) искусственный интеллект или обыгрывает человека, или как минимум добивается паритета с ним, то над покером программисты безуспешно бьются с 2006 года (когда прошел первый ежегодный чемпионат по этой игре среди компьютеров). <br /><br /> В январе 2015 года канадским ученым удалось написать компьютерную программу, способную на слабое решение техасского холдема с лимитированными ставками. Иными словами, компьютер смог создать стратегию игры, настолько близкую к оптимальной, что никакой человек не способен обыграть его (со статистическим уровнем значимости) за всю свою жизнь. <br /><br /> lenta.ru <br /><br /> <iframe src="//www.facebook.com/plugins/follow?href=https%3A%2F%2Fwww.facebook.com%2Falexis.lushnikov&layout=standard&show_faces=true&colorscheme=light&width=450&height=80" scrolling="no" frameborder="0" style="border:none; overflow:hidden; width:450px; height:80px;" allowTransparency="true"></iframe>
		<script>
			var container = document.getElementById('nativeroll_video_cont');

if (container) {
				var parent = container.parentElement;

if (parent) {
					const wrapper = document.createElement('div');
					wrapper.classList.add('js-teasers-wrapper');

parent.insertBefore(wrapper, container.nextSibling);
				}
			}
		</script>
	</a></span></div>