Python常用模块介绍
python除了关键字(keywords)和内置的类型和函数(builtins),更多的功能是通过libraries(即modules)来提供的。
常用的libraries(modules)如下:
1)python运行时服务
* copy: copy模块提供了对复合(compound)对象(list,tuple,dict,custom class)进行浅拷贝和深拷贝的功能。
* pickle: pickle模块被用来序列化python的对象到bytes流,从而适合存储到文件,网络传输,或数据库存储。(pickle的过程也被称serializing,marshalling或者flattening,pickle同时可以用来将bytes流反序列化为python的对象)。
* sys:sys模块包含了跟python解析器和环境相关的变量和函数。
* 其他: atexit,gc,inspect,marshal,traceback,types,warnings,weakref。
2)数学
* decimal:python中的float使用双精度的二进制浮点编码来表示的,这种编码导致了小数不能被精确的表示,例如0.1实际上内存中为0.100000000000000001,还有3*0.1 == 0.3 为False. decimal就是为了解决类似的问题的,拥有更高的精确度,能表示更大范围的数字,更精确地四舍五入。
* math:math模块定义了标准的数学方法,例如cos(x),sin(x)等。
* random:random模块提供了各种方法用来产生随机数。
* 其他:fractions,numbers。
3)数据结构,算法和代码简化
* array: array代表数组,类似与list,与list不同的是只能存储相同类型的对象。
* bisect: bisect是一个有序的list,其中内部使用二分法(bitsection)来实现大部分操作。
* collections:collections模块包含了一些有用的容器的高性能实现,各种容器的抽象基类,和创建name-tuple对象的函数。例如包含了容器deque,defaultdict,namedtuple等。
* heapq:heapq是一个使用heap实现的带有优先级的queue。
* itertools:itertools包含了函数用来创建有效的iterators。所有的函数都返回iterators或者函数包含iterators(例如generators 和generators expression)。
* operator: operator提供了访问python内置的操作和解析器提供的特殊方法,例如 x+y 为 add(x,y),x+=y为iadd(x,y),a % b 为mod(a,b)等等。
* 其他:abc,contextlib,functools。
4) string 和 text 处理
*codecs:codecs模块被用来处理不同的字符编码与unicode text io的转化。
* re:re模块用来对字符串进行正则表达式的匹配和替换。
* string:string模块包含大量有用的常量和函数用来处理字符串。也包含了新字符串格式的类。
* struct:struct模块被用来在python和二进制结构间实现转化。
* unicodedata:unicodedata模块提供访问unicode字符数据库
5) python数据库访问
* 关系型数据库拥有共同的规范Python Database API Specification V2.0,MySQL,Oracle等都实现了此规范,然后增加自己的扩展。
* sqlite3: sqlite3 模块提供了SQLite数据库访问的接口。SQLite数据库是以一个文件或内存的形式存在的自包含的关系型数据库。
* DBM-style 数据库模块:python提供了打了的modules来支持UNIX DBM-style数据库文件。dbm模块用来读取标准的UNIX-dbm数据库文件,gdbm用来读取GNU dbm数据库文件,dbhash用来读取Berkeley DB数据库文件。所有的这些模块提供了一个对象实现了基于字符串的持久化的字典,他与字典dict非常相似,但是他的keys和values都必须是字符串。
* shelve:shelve模块使用特殊的“shelf”对象来支持持久化对象。这个对象的行为与dict相似,但是所有的他存储的对象都使用基于hashtable的数据库(dbhash,dbm,gdbm)存储在硬盘。与dbm模块的区别是所存储的对象不仅是字符串,而且可以是任意的与pickle兼容的对象。
6)文件和目录处理
* bz2:bz2模块用来处理以bzip2压缩算法压缩的文件。
* filecmp:filecmp模块提供了函数来比较文件和目录。
* fnmatch:fnmatch模块提供了使用UNIX shell-style的通配符来匹配文件名。这个模块只是用来匹配,使用glob可以获得匹配的文件列表。
* glob:glob模块返回了某个目录下与指定的UNIX shell通配符匹配的所有文件。
* gzip:gzip模块提供了类GzipFile,用来执行与GNUgzip程序兼容的文件的读写。
* shutil: shutil模块用来执行更高级别的文件操作,例如拷贝,删除,改名。shutil操作之针对一般的文件,不支持pipes,block devices等文件类型。
* tarfile: tarfile模块用来维护tar存档文件。tar没有压缩的功能。
* tempfile:tempfile模块用来产生临时文件和文件名。
* zipfile: zipfile模块用来处理zip格式的文件。
* zlib,zlib模块提供了对zlib库的压缩功能的访问。
7)操作系统的服务