Python subprocess模块总结

操作前说明 #

运行示例代码前，建议先确认 Python 版本。旧文章中可能包含 Python 2 写法，如果当前环境是 Python 3，需要注意 print、字符串编码、包安装方式和模块路径差异。

原始操作记录 #

subprocess最简单的用法就是调用shell命令了,另外也可以调用程序,并且可以通过stdout,stdin和stderr进行交互

subprocess的主类

subprocess.Popen(
      args,
      bufsize=0,
      executable=None,
      stdin=None,
      stdout=None,
      stderr=None,
      preexec_fn=None,
      close_fds=False,
      shell=False,
      cwd=None,
      env=None,
      universal_newlines=False,
      startupinfo=None,
      creationflags=0)

args可以是字符串或者序列类型（如：list，元组），用于指定进程的可执行文件及其参数。如果是序列类型，第一个元素通常是可执行文件的路径。我们也可以显式的使用executeable参数来指定可执行文件的路径。

bufsize：指定缓冲。0 无缓冲,1 行缓冲,其他缓冲区大小,负值系统缓冲(全缓冲)

stdin, stdout, stderr分别表示程序的标准输入、输出、错误句柄。他们可以是PIPE，文件描述符或文件对象，也可以设置为None，表示从父进程继承。

preexec_fn只在Unix平台下有效，用于指定一个可执行对象（callable object），它将在子进程运行之前被调用。

Close_sfs：在windows平台下，如果close_fds被设置为True，则新创建的子进程将不会继承父进程的输入、输出、错误管道。我们不能将close_fds设置为True同时重定向子进程的标准输入、输出与错误(stdin, stdout, stderr)。

shell设为true，程序将通过shell来执行。

cwd用于设置子进程的当前目录

env是字典类型，用于指定子进程的环境变量。如果env = None，子进程的环境变量将从父进程中继承。

Universal_newlines:不同操作系统下，文本的换行符是不一样的。如：windows下用'/r/n'表示换，而Linux下用'/n'。如果将此参数设置为True，Python统一把这些换行符当作'/n'来处理。startupinfo与createionflags只在windows下用效，它们将被传递给底层的CreateProcess()函数，用于设置子进程的一些属性，如：主窗口的外观，进程的优先级等等。

startupinfo与createionflags只在windows下有效，它们将被传递给底层的CreateProcess()函数，用于设置子进程的一些属性，如：主窗口的外观，进程的优先级等等。

Popen方法

Popen.poll()：用于检查子进程是否已经结束。设置并返回returncode属性。
Popen.wait()：等待子进程结束。设置并返回returncode属性。
Popen.communicate(input=None)：与子进程进行交互。向stdin发送数据，或从stdout和stderr中读取数据。可选参数input指定发送到子进程的参数。Communicate()返回一个元组：(stdoutdata, stderrdata)。注意：如果希望通过进程的stdin向其发送数据，在创建Popen对象的时候，参数stdin必须被设置为PIPE。同样，如果希望从stdout和stderr获取数据，必须将stdout和stderr设置为PIPE。
Popen.send_signal(signal)：向子进程发送信号。
Popen.terminate()：停止(stop)子进程。在windows平台下，该方法将调用Windows API TerminateProcess（）来结束子进程。
Popen.kill()：杀死子进程。
Popen.stdin：如果在创建Popen对象是，参数stdin被设置为PIPE，Popen.stdin将返回一个文件对象用于策子进程发送指令。否则返回None。
Popen.stdout：如果在创建Popen对象是，参数stdout被设置为PIPE，Popen.stdout将返回一个文件对象用于策子进程发送指令。否则返回None。
Popen.stderr：如果在创建Popen对象是，参数stdout被设置为PIPE，Popen.stdout将返回一个文件对象用于策子进程发送指令。否则返回None。
Popen.pid：获取子进程的进程ID。
Popen.returncode：获取进程的返回值。如果进程还没有结束，返回None。
subprocess.call(*popenargs, **kwargs)：运行命令。该函数将一直等待到子进程运行结束，并返回进程的returncode。文章一开始的例子就演示了call函数。如果子进程不需要进行交互,就可以使用该函数来创建。
subprocess.check_call(*popenargs, **kwargs)：与subprocess.call(*popenargs, **kwargs)功能一样，只是如果子进程返回的returncode不为0的话，将触发CalledProcessError异常。在异常对象中，包括进程的returncode信息。

关键理解 #

这类笔记最重要的不是把命令背下来，而是弄清楚它解决的是什么问题、依赖什么环境、执行后会改变什么。以后再次遇到类似情况时，可以先根据标题判断问题方向，再对照原始命令确认是否适合当前系统版本。

如果命令中包含具体路径、网卡名、磁盘名、进程名、IP 地址、端口号、用户名称或软件版本，实际执行时都要替换成自己环境中的真实值。不要直接照抄示例里的占位内容。

验证方法 #

验证时可以先准备一个最小示例，把输入、输出和异常情况都跑一遍。对于脚本类工具，建议先在临时目录或测试文件上执行，确认结果正确后再处理真实数据。

如果验证结果和预期不一致，建议先不要继续叠加更多修改，而是回到第一步检查环境差异。很多问题并不是命令本身错误，而是当前系统版本、软件版本、路径名称或权限条件与原记录不一致。

注意事项 #

涉及文件批量处理、系统命令调用、进程池线程池或第三方包时，要特别注意异常处理和边界条件，避免脚本中途失败后留下半成品数据。

对于旧文章中的命令，还要考虑软件版本变化。浏览器 flags、Linux 发行版默认配置、Python 包版本、Windows 系统设置都会随着时间调整。再次使用时，最好把这篇记录当成排查思路，而不是绝对固定的唯一答案。

小结 #

这篇记录可以作为一个快速索引：先看标题确认问题类型，再看原始命令找到核心操作，最后结合验证方法确认是否真正生效。这样既保留了早期备忘的简洁性，也能减少以后重复排查的时间。