操作前说明 #

运行示例代码前,建议先确认 Python 版本。旧文章中可能包含 Python 2 写法,如果当前环境是 Python 3,需要注意 print、字符串编码、包安装方式和模块路径差异。

原始操作记录 #

1、先看下python 集合 类型的不重复性,这方面做一些去重处理非常的好,比如我们要处理一些数据,想把重复的数据给

去掉,然后在操作的话,可以把它转换成集合类型,然后在由集合类型转换成其他的类型。

a = [2,3,4,2,1]

我们最终要实现的效果是:a = [1,2,3,4]

那我们要怎么实现呢。

观察下这个列表,我们发现列表里有重复的元素存在,所以我们第一想到的就是去掉列表里的重复元素。

a = set(a)

print a

集合a的结果是:set([1, 2, 3, 4])

下一步要实现排序,我们又想到了一个比较简单的方法,因为集合没有排序方法,而列表有排序的方法,所以我们们把它转换成python 列表 的类型,调用列表的排序方法。

a = list(a)

a.sort()

print a

列表a的结果是:[1,2,3,4]

2、union(联合), intersection(交), difference(差)

a = set('abcde')

b = set('bdcf')

求集合的交集:

a & b

结果是:set(['c', 'b', 'd'])

求差集:

a - b

结果是:set(['a', 'e'])

求联合:

a|b

结果是:set(['a', 'c', 'b', 'e', 'd', 'f'])

关键理解 #

这类笔记最重要的不是把命令背下来,而是弄清楚它解决的是什么问题、依赖什么环境、执行后会改变什么。以后再次遇到类似情况时,可以先根据标题判断问题方向,再对照原始命令确认是否适合当前系统版本。

如果命令中包含具体路径、网卡名、磁盘名、进程名、IP 地址、端口号、用户名称或软件版本,实际执行时都要替换成自己环境中的真实值。不要直接照抄示例里的占位内容。

验证方法 #

验证时可以先准备一个最小示例,把输入、输出和异常情况都跑一遍。对于脚本类工具,建议先在临时目录或测试文件上执行,确认结果正确后再处理真实数据。

如果验证结果和预期不一致,建议先不要继续叠加更多修改,而是回到第一步检查环境差异。很多问题并不是命令本身错误,而是当前系统版本、软件版本、路径名称或权限条件与原记录不一致。

注意事项 #

涉及文件批量处理、系统命令调用、进程池线程池或第三方包时,要特别注意异常处理和边界条件,避免脚本中途失败后留下半成品数据。

对于旧文章中的命令,还要考虑软件版本变化。浏览器 flags、Linux 发行版默认配置、Python 包版本、Windows 系统设置都会随着时间调整。再次使用时,最好把这篇记录当成排查思路,而不是绝对固定的唯一答案。

小结 #

这篇记录可以作为一个快速索引:先看标题确认问题类型,再看原始命令找到核心操作,最后结合验证方法确认是否真正生效。这样既保留了早期备忘的简洁性,也能减少以后重复排查的时间。