用 Python 跟自己下棋

简介: 再厉害的程序员,也是从“hello world”程序开始写起。再“聪明”的机器,也是从零样本开始“训练”出来的。


今天,李世乭终于在与 AlphaGo 的人机大战中扳回一局。但计算机 AI 可以在围棋上战胜人类顶尖棋手的时代已经到来。可以预见,人工智能和机器人将会在更多领域做到比人力更高效、准确、安全。所以未来,掌握编程技能显得更加重要。与其现在感叹所谓的“机器威胁论”,还不如现在动起手来,磨练自己的技能。


再厉害的程序员,也是从“hello world”程序开始写起。再“聪明”的机器,也是从零样本开始“训练”出来的。所以今天就来写一个最简单棋类游戏:


Tic Tac Toe,又叫井字棋。


本篇将实现游戏框架,让你可以和电脑对战,但提升电脑的“智能”会在下一篇中细说。另外,文末会介绍一个 Github 上的 Python 版 AlphaGo 项目。


大致说下井字棋的规则:

  • 棋盘为 3*3 共 9 格,类似汉字“井”;
  • 一方为 o,一方为 x,轮流落子;
  • 任一方先有连成一条线的 3 个棋子(横、竖、斜皆可)则为胜利;
  • 棋盘摆满仍没有一方胜利,则为平局。


我打算在控制台下实现这个游戏,所以我需要用一个格式把棋盘的状态输出出来,设想是这样(发到手机上可能有点走形):


    a   b   c
   |---|---|---|
1 |    | o |    |
   |---|---|---|
2 |    | o | x |
   |---|---|---|
3 | x | o |    |
   |---|---|---|


abc 和 123 是为了更方便地标记棋盘上的位置。每走一步,就再次输出新的状态。


而棋盘本身的数据,我用一个 2 维数组来存储:


board = [
  [0, 0, 0],
  [0, 0, 0],
  [0, 0, 0],
]


0 表示没有子,落子之后,o 为 1,x 为 2。


现在,我需要一个函数,按照设想的格式,把棋盘数据输出到屏幕上。以下是我的实现:


CHESS = [' ', 'o', 'x']
def showBoard():
  print '    a   b   c  '
  for i in range(3):
    print '  |---|---|---|'
    print i+1, '|',
    for j in range(3):
      print '%s |' % CHESS[board[i][j]],
    print
  print '  |---|---|---|'



为了对应 0、1、2 和空格、o、x 的关系,我用了一个 CHESS 数组。中间的 print 较多,有些乱,但仔细对照前面的设计图看一下应不难理解。


之后考虑游戏的主体玩法部分。大体的思路是:人走一步、显示棋盘、判断是否结束、AI 走一步、显示棋盘、判断是否结束,如此循环。所以大的框架是:


yourturn = True
showBoard()
while not isFinished():
  if yourturn:
    moveMan()
  else:
    moveAI()
  showBoard()
  yourturn = not yourturn;


这里,我用一个变量 yourturn 来记录该哪一方落子,每次走完一步就交换。


isFinished 是一个判断游戏是否结束的函数,如果结束了,就返回 True,游戏主循环退出。最终结果的输出,我也打算放在这个函数里。


moveMan 和 moveAI 分别是人和 AI 落子,一个是等待控制台的输入,一个是计算出位置。


接下来要做的,就是完成这 3 个函数。


先来看 moveMan:


ROW = {'1': 0, '2': 1, '3': 2}
COL = {'a': 0, 'b': 1, 'c': 2}
def moveMan():
  print 'Your turn...'
  while True:
    try:
      move = raw_input('choose a position (e.g. a1/c2/b3...):\n')
      pos_row = ROW[move[1]]
      pos_col = COL[move[0]]
      if board[pos_row][pos_col] == 0:
        board[pos_row][pos_col] = 1
        return
    except:
      pass



用 raw_input 等待用户输入。这里约定了表示位置的输入格式。ROW 和 COL 两个 dict 是用来将用户输入对应到具体的棋盘坐标上。当判断 board 数组里,用户输入的位置没有棋子时,则指定为 1,并结束函数。while 循环和 try-except 块是为了保证用户的输入是有效的,否则就会重复提示用户输入。


再来看 moveAI:


def moveAI():
  print 'AI\'s turn...'
  while True:
    r = random.randint(0, 2)
    c = random.randint(0, 2)
    if board[r][c] == 0:
      board[r][c] = 2
      return


这个函数的目的是为了将 board 一个位置设置为 2。选取这个位置的过程,则是此游戏 AI 的算法的核心部分。今天先偷个懒,随机生成一个位置,如果为空,就作为落子的位置,并结束函数。下一篇,我们再来完善这个核心。


最后,就是判断胜负的 isFinished:


def isFinished():
  # check row
  if [1, 1, 1] in board:
    print 'You win!'
    return True
  if [2, 2, 2] in board:
    print 'AI wins!'
    return True
  # check col
  for i in range(3):
    if board[0][i] == board[1][i] == board[2][i] == 1:
      print 'You win!'
      return True
    if board[0][i] == board[1][i] == board[2][i] == 2:
      print 'AI wins!'
      return True
  # check diagonal
  if (board[0][0] == board[1][1] == board[2][2] == 1) or (
    board[2][0] == board[1][1] == board[0][2] == 1):
    print 'You win!'
    return True
  if (board[0][0] == board[1][1] == board[2][2] == 2) or (
    board[2][0] == board[1][1] == board[0][2] == 2):
    print 'AI wins!'
    return True
  # check draw game
  draw = True
  for i in range(3):
    if 0 in board[i]:
      draw = False
  if draw:
    print 'Draw game.'
    return True
  return False


稍有点长,主要分为 4 部分:分别是判断横、竖、斜、平局。


横竖斜的胜利部分,就是遍历棋盘去寻找是否有符合条件的情况,有则输出游戏结果,并返回 True。如果都没有,就去判断是否是平局。


判断平局的逻辑是这样:先设定 draw 为 True,如果遇到棋盘上有 0 的位置,则设为 False。否则遍历结束,draw 仍然为 True,就说明已没有空位,游戏以平局结束。


一个井字棋游戏已完成,截取一小段输出结果:


Your turn...
choose a position (e.g. a1/c2/b3...):
b2
     a   b   c
   |---|---|---|
1 | o |    |    |
   |---|---|---|
2 | o | o |    |
   |---|---|---|
3 | x |    | x |
   |---|---|---|
AI's turn...
     a   b   c
   |---|---|---|
1 | o |    |    |
   |---|---|---|
2 | o | o |    |
   |---|---|---|
3 | x | x | x |
   |---|---|---|
AI wins!



当然,现在的这个根本还算不上 AI。下一次,我们会让它更“机智”一点。


如果手机上看代码不方便,可移步论坛,在电脑上查看,我也会将完整代码上传。(论坛上的附件需要登录才可下载)




另外,关于前面提到的开源版 AlphaGo 项目。


项目地址:

https://github.com/Rochester-NRT/AlphaGo


有人传是 AlphaGo 开源了,但这其实只是 University of Rochester 根据 AlphaGo 的论文做的实现,用了 Python。与真正使用的程序相去甚远。可以去围观,看看代码。对机器学习、神经网络有兴趣的可以深入研究一下,甚至参与项目开发。不过如果你只是想在自己的机器上运行项目,那我要提醒你几点:


首先,项目里面用到了 SciPy,而 SciPy 的安装是需要根据不同操作系统编译的,这里面坑不少,至少我是在两个系统上折腾了几小时才安装成功。

另外,项目目前只完成了一个基本框架,和算法中一小部分,完成度很低。虽然也可以训练 AI 走棋,但效果肯定远不如 AlphaGo。

项目里虽然附带了一个 HTML5 的网页围棋接口,但应该还没有对接,所以想跟电脑对战的要失望了。

相关文章
|
人工智能 算法 Python
用 Python 跟自己下棋(续)
棋类游戏最基本的 AI 方法就是给棋盘上每个位置的优劣程度打分,然后选择的最高分的位置来走。打分算法的好坏,就决定了这个 AI 的“智能”程度。
|
19天前
|
测试技术 开发者 Python
Python 编程中的装饰器深入解析
【8月更文挑战第1天】本文将通过实例和代码演示,深入探讨 Python 中装饰器的概念、用法和高级应用。我们将从基础开始,逐步过渡到如何自定义装饰器,并展示其在日志记录、性能测试等场景下的实际用途。文章最后还将讨论装饰器的常见误区和最佳实践。
|
7天前
|
算法 程序员 开发工具
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
在学习Python的旅程中你是否正在“绝望的沙漠”里徘徊? 学完基础教程的你,是否还在为选择什么学习资料犹豫不决,不知从何入手,提高自己?
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
|
5天前
|
算法 程序员 开发工具
百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
在学习Python的旅程中你是否正在“绝望的沙漠”里徘徊? 学完基础教程的你,是否还在为选择什么学习资料犹豫不决,不知从何入手,提高自己?
|
3天前
|
数据采集 存储 人工智能
掌握Python编程:从基础到进阶的实用指南
【8月更文挑战第17天】 本文旨在通过浅显易懂的语言和实际案例,为初学者和有一定基础的开发者提供一条清晰的Python学习路径。我们将从Python的基本语法入手,逐步深入到面向对象编程、数据科学应用及网络爬虫开发等高级主题。每个部分都配备了代码示例和实操建议,确保读者能够将理论知识转化为实际能力。无论你是编程新手,还是希望提升Python技能的开发者,这篇文章都将为你打开一扇通往高效编程世界的大门。
7 2
|
8天前
|
Python
python Process 多进程编程
python Process 多进程编程
18 1
|
12天前
|
存储 数据挖掘 程序员
揭秘Python:掌握这些基本语法和数据类型,你将拥有编程世界的钥匙!
【8月更文挑战第8天】Python是一种高级、解释型语言,以简洁的语法和强大的功能广受好评。本文从基本语法入手,强调Python独特的缩进规则,展示清晰的代码结构。接着介绍了Python的主要数据类型,包括数值、字符串、列表、元组、集合和字典,并提供了示例代码。通过这些基础知识的学习,你将为深入探索Python及其在文本处理、数据分析等领域的应用打下坚实的基础。
26 3
|
14天前
|
Python
揭秘!Python系统编程里那些让代码自由穿梭的神奇代码行
【8月更文挑战第6天】在Python编程中,一些简洁有力的代码构造让程序更加灵动高效。列表推导式能一行生成列表,如`squares = [x**2 for x in range(10)]`。`with`语句确保资源自动释放,例`with open('example.txt', 'r') as file:`。`lambda`函数便于快速定义小函数,`map(lambda x: x + 1, numbers)`即可完成列表映射。
28 4
|
14天前
|
API C语言 开发者
Python如何成为跨平台编程的超级巨星:系统调用深度探索
【8月更文挑战第6天】Python凭借简洁的语法和强大的库支持,在编程领域中脱颖而出。其跨平台特性是基于CPython等解释器的设计理念,使得Python程序能在不同操作系统上运行而无需修改代码。Python标准库提供的抽象层隐藏了系统间的差异,加之ctypes等扩展机制,使开发者能高效地编写兼容性强且性能优异的应用。例如,在Windows上利用ctypes调用GetSystemTime系统API获取当前时间,展现了Python深入系统底层的强大能力和灵活性。随着技术演进,Python将继续巩固其作为首选编程语言的地位。
19 3
|
16天前
|
安全 开发者 Python
跨越编程孤岛,构建互联大陆:深入探索Python进程间通信的奥秘,解锁高效协作新纪元!
【8月更文挑战第3天】在编程领域,Python 因其简洁强大而广受欢迎。但随着项目规模扩大,单进程难以应对复杂需求,此时多进程间的协同就显得尤为重要。各进程像孤岛般独立运行,虽提升了稳定性和并发能力,但也带来了沟通障碍。为解决这一问题,Python 提供了多种进程间通信(IPC)方式,如管道、队列和套接字等,它们能有效促进数据交换和任务协作,使各进程像大陆般紧密相连。通过这些机制,我们能轻松搭建起高效的多进程应用系统,实现更加复杂的业务逻辑。
18 2