Python 之 subprocess 模块的基本使用及原理(55)

Python 之 subprocess 模块的基本使用及原理

一、引言

在 Python 编程中，有时候我们需要调用外部的程序或命令来完成一些特定的任务，比如执行系统命令、调用其他脚本等。Python 的 subprocess 模块提供了强大的功能，让我们能够方便地创建新的进程，连接到它们的输入/输出/错误管道，并获取它们的返回码。这个模块是 Python 标准库的一部分，从 Python 2.4 版本开始引入，并且在后续版本中不断改进和完善。本文将详细介绍 subprocess 模块的基本使用方法以及其背后的工作原理。

二、subprocess 模块概述

2.1 模块作用

subprocess 模块允许 Python 程序创建新的进程，执行外部命令，并且与这些进程进行交互。它提供了多种方式来调用外部命令，并且可以控制命令的输入、输出和错误信息。通过 subprocess 模块，我们可以在 Python 脚本中集成系统命令和其他程序，实现更复杂的功能。

2.2 导入模块

在使用 subprocess 模块之前，需要先将其导入到 Python 脚本中。可以使用以下代码完成导入：

import subprocess  # 导入 subprocess 模块，用于后续的进程创建和外部命令调用

三、基本的命令调用

3.1 使用 `subprocess.run()` 方法

subprocess.run() 是 Python 3.5 及以上版本中推荐使用的执行外部命令的方法。它会等待命令执行完成，并返回一个 CompletedProcess 对象，该对象包含了命令的返回码、标准输出和标准错误等信息。

3.1.1 简单命令调用

import subprocess# 调用系统的 ls 命令（在 Linux 或 macOS 系统中），列出当前目录下的文件和文件夹# 在 Windows 系统中可以使用 'dir' 命令result = subprocess.run(['ls', '-l'], capture_output=True, text=True)# 检查命令是否成功执行，返回码为 0 表示成功if result.returncode == 0:    # 打印命令的标准输出    print("命令执行成功，标准输出如下：")    print(result.stdout)else:    # 打印命令的标准错误    print("命令执行失败，标准错误如下：")    print(result.stderr)

在上述代码中，subprocess.run() 方法接受一个列表作为参数，列表中的第一个元素是要执行的命令，后续元素是命令的参数。capture_output=True 表示捕获命令的标准输出和标准错误，text=True 表示以文本模式处理输出。

3.1.2 传递参数

import subprocess# 调用 echo 命令，输出指定的文本text_to_print = "Hello, subprocess!"result = subprocess.run(['echo', text_to_print], capture_output=True, text=True)# 打印命令的标准输出print(result.stdout.strip())

在这个例子中，我们将一个变量 text_to_print 作为参数传递给 echo 命令，然后打印出命令的标准输出。

3.2 使用 `subprocess.Popen()` 类

subprocess.Popen() 是一个更底层的方法，它允许我们在命令执行过程中与子进程进行交互，而不是等待命令执行完成。这在需要实时处理命令输出或与子进程进行通信的场景中非常有用。

3.2.1 基本使用

import subprocess# 创建一个 Popen 对象，执行 ping 命令（在 Linux 或 macOS 系统中）# 在 Windows 系统中可以使用 'ping -n 4 www.google.com'process = subprocess.Popen(['ping', '-c', '4', 'www.google.com'], stdout=subprocess.PIPE, text=True)# 读取命令的标准输出while True:    line = process.stdout.readline()    if not line:        break    print(line.strip())# 等待命令执行完成，并获取返回码returncode = process.wait()print(f"命令执行完成，返回码为: {returncode}")

在上述代码中，subprocess.Popen() 方法接受一个列表作为参数，指定要执行的命令和参数。stdout=subprocess.PIPE 表示将命令的标准输出重定向到一个管道，以便我们可以读取。通过循环读取管道中的数据，我们可以实时获取命令的输出。最后，使用 process.wait() 方法等待命令执行完成，并获取返回码。

3.2.2 与子进程进行交互

import subprocess# 创建一个 Popen 对象，执行 cat 命令，等待用户输入process = subprocess.Popen(['cat'], stdin=subprocess.PIPE, stdout=subprocess.PIPE, text=True)# 向子进程的标准输入发送数据input_text = "This is some input text."process.stdin.write(input_text + '\n')process.stdin.flush()# 读取子进程的标准输出output = process.stdout.read()print(f"子进程的输出: {output.strip()}")# 等待子进程执行完成，并获取返回码returncode = process.wait()print(f"命令执行完成，返回码为: {returncode}")

在这个例子中，我们使用 cat 命令作为示例，它会等待用户输入并将输入原样输出。通过 stdin=subprocess.PIPE 将子进程的标准输入重定向到一个管道，我们可以向子进程发送数据。然后，通过 stdout=subprocess.PIPE 读取子进程的输出。

四、错误处理和异常捕获

4.1 捕获 `CalledProcessError` 异常

当使用 subprocess.run() 方法执行命令时，如果命令执行失败（返回码不为 0），会抛出 subprocess.CalledProcessError 异常。我们可以捕获这个异常并进行相应的处理。

import subprocesstry:    # 尝试执行一个不存在的命令    result = subprocess.run(['nonexistent_command'], check=True, capture_output=True, text=True)except subprocess.CalledProcessError as e:    # 打印异常信息和标准错误    print(f"命令执行失败，错误信息: {e}")    print(f"标准错误输出: {e.stderr}")

在上述代码中，check=True 表示如果命令执行失败（返回码不为 0），会抛出 CalledProcessError 异常。我们使用 try-except 块捕获这个异常，并打印出异常信息和标准错误。

4.2 处理超时异常

有时候，我们希望在命令执行时间过长时能够及时终止命令。可以使用 timeout 参数来设置命令的最大执行时间，如果超过这个时间命令还未执行完成，会抛出 subprocess.TimeoutExpired 异常。

import subprocesstry:    # 执行 sleep 命令，设置超时时间为 2 秒    result = subprocess.run(['sleep', '5'], timeout=2, capture_output=True, text=True)except subprocess.TimeoutExpired as e:    # 打印超时异常信息    print(f"命令执行超时，错误信息: {e}")    # 可以选择终止子进程    e.process.kill()    # 等待子进程结束    e.process.wait()

在这个例子中，sleep 5 命令会暂停 5 秒，但我们设置了超时时间为 2 秒。当超过 2 秒命令还未执行完成时，会抛出 TimeoutExpired 异常。我们可以捕获这个异常，并使用 e.process.kill() 方法终止子进程。

五、subprocess 模块的原理

5.1 进程创建

subprocess 模块的核心功能是创建新的进程来执行外部命令。在底层，它使用操作系统提供的进程创建机制。在 Unix 系统中，主要使用 fork() 和 exec() 系统调用。fork() 用于创建一个新的进程，该进程是调用进程的副本，称为子进程。子进程和父进程会执行相同的代码，但有不同的进程 ID。然后，子进程使用 exec() 系统调用来替换自己的程序映像，执行指定的外部命令。在 Windows 系统中，使用 CreateProcess() 函数来创建新的进程。

5.2 管道和重定向

subprocess 模块支持将子进程的标准输入、标准输出和标准错误进行重定向。这是通过操作系统的管道机制实现的。管道是一种在进程之间传递数据的机制，它允许一个进程的输出作为另一个进程的输入。当我们设置 stdout=subprocess.PIPE 或 stdin=subprocess.PIPE 时，subprocess 模块会创建相应的管道，并将子进程的标准输入或输出连接到这些管道上。这样，我们就可以在 Python 程序中读取子进程的输出或向子进程发送输入。

5.3 进程通信

在使用 subprocess.Popen() 类时，我们可以与子进程进行实时通信。这是通过管道和文件描述符实现的。子进程的标准输入、标准输出和标准错误分别对应着不同的文件描述符，我们可以通过 Python 的文件对象来操作这些文件描述符。例如，使用 process.stdin.write() 方法向子进程的标准输入写入数据，使用 process.stdout.read() 方法从子进程的标准输出读取数据。

5.4 返回码处理

当子进程执行完成后，会返回一个返回码。返回码为 0 表示命令执行成功，非零值表示命令执行失败。subprocess 模块会捕获子进程的返回码，并在 CompletedProcess 对象或 Popen 对象中提供相应的属性来获取返回码。我们可以根据返回码来判断命令是否执行成功，并进行相应的处理。

六、总结与展望

6.1 总结

Python 的 subprocess 模块为我们提供了强大而灵活的功能，让我们能够在 Python 脚本中方便地调用外部命令和创建新的进程。通过 subprocess.run() 方法，我们可以简单地执行命令并获取结果；通过 subprocess.Popen() 类，我们可以与子进程进行实时交互。同时，模块还提供了错误处理和超时控制等功能，提高了程序的健壮性。subprocess 模块的底层原理基于操作系统的进程创建、管道和重定向机制，使得它能够在不同的操作系统上稳定运行。

6.2 展望

随着 Python 生态系统的不断发展和应用场景的不断拓展，subprocess 模块可能会有以下几个方面的发展：

性能优化

更多的跨平台支持

subprocess

与其他模块的集成

asyncio

简化 API

subprocess

总之，subprocess 模块在 Python 编程中扮演着重要的角色，未来将不断发展和完善，为开发者提供更强大、更便捷的进程管理和外部命令调用功能。