Python写入文件(write和writelines)详解

广告位

如果以 r+、w、w+、a、a+ 模式打开文件,则都可以写入。需要指出的是,当以 r+、w、w+ 模式打开文件…

如果以 r+、w、w+、a、a+ 模式打开文件,则都可以写入。需要指出的是,当以 r+、w、w+ 模式打开文件时,文件指针位于文件开头处;当以 a、a+ 模式打开文件时,文件指针位于文件结尾处。

另外,需要说明的是,当以 w 或 w+ 模式打开文件时,程序会立即清空文件的内容。

文件指针的概念

文件指针用于标明文件读写的位置。假如把文件看成一个水流,文件中每个数据(以 b 模式打开,每个数据就是一个字节;以普通模式打开,每个数据就是一个字符)就相当于一个水滴,而文件指针就标明了文件将要读写哪个位置。

图 1 简单示意了文件指针的概念。

Python写入文件(write和writelines)详解
图 1 文件指针概念示意图

文件对象提供了以下方法来操作文件指针:

  • seek(offset[, whence]):该方法把文件指针移动到指定位置。当 whence 为 0 时(这是默认值),表明从文件开头开始计算,比如将 offset 设为 3,就是将文件指针移动到第 3 处;当 whence 为 1 时,表明从指针当前位置开始计算,比如文件指针当前在第 5 处,将 offset 设为 3,就是将文件指针移动到第 8 处;当 whence 为 2 时,表明从文件结尾开始计算,比如将 offset 设为 3,表明将文件指针移动到文件结尾倒数第 3 处。
  • tell():判断文件指针的位置。

此外,当程序使用文件对象读写数据时,文件指针会自动向后移动:读写了多少个数据,文件指针就自动向后移动多少个位置。

下面程序示范了文件指针操作:

  f = open('filept_test.py', 'rb')  # 判断文件指针的位置  print(f.tell()) # 0  # 将文件指针移动到3处  f.seek(3)  print(f.tell()) # 3  # 读取一个字节,文件指针自动后移1个数据  print(f.read(1)) # o  print(f.tell())  # 4  # 将文件指针移动到5处  f.seek(5)  print(f.tell())  # 5  # 将文件指针向后移动5个数据  f.seek(5, 1)  print(f.tell())  # 10  # 将文件指针移动到倒数第10处  f.seek(-10, 2)  print(f.tell())  print(f.read(1))  # d

上面程序示范了使用 seek() 方法来移动文件指针,包括从文件开头、指针当前位置、文件结尾处开始计算。运行上面程序,结合程序输出结果可以体会文件指针移动的效果。

当文件指针位于哪里时,程序就会读取哪个位置的数据;当程序读取多少个数据时,文件指针就会自动向后移动多少个位置。

输出内容

文件对象提供的写文件的方法主要有两个:

  1. write(str 或 bytes):输出字符串或字节串。只有以二进制模式(b 模式)打开的文件才能写入字节串。
  2. writelines(可迭代对象):输出多个字符串或多个字节串。

下面程序示范了使用 write() 和 writelines() 输出字符串:

  import os  f = open('x.txt', 'w+')  # os.linesep代表当前操作系统上的换行符  f.write('我爱Python' + os.linesep)  f.writelines(('土门壁甚坚,'+ os.linesep,      '杏园度亦难。'+ os.linesep,      '势异邺城下,'+ os.linesep,      '纵死时犹宽。'+ os.linesep))

上面程序中第 4 行代码调用 write() 方法输出单个字符串;第 5 行代码则调用 writelines() 方法输出多个字符串。

当采用上面方法输出文件时,程序会使用当前操作系统默认的字符集。如果需要使用指定的字符集来输出文件,则可以来用二进制形式(程序先将所输出的字符串转换成指定字符集对应的二进制数据(字节串),然后输出二进制数据)。

下面程序示范了使用二进制数据输出,通过这种方式来实现以 UTF-8 字符集保存文件:

  import os  f = open('y.txt', 'wb+')  # os.linesep代表当前操作系统上的换行符  f.write(('我爱Python' + os.linesep).encode('utf-8'))  f.writelines((('土门壁甚坚,'+ os.linesep).encode('utf-8'),      ('杏园度亦难。'+ os.linesep).encode('utf-8'),      ('势异邺城下,'+ os.linesep).encode('utf-8'),      ('纵死时犹宽。'+ os.linesep).encode('utf-8')))

上面程序中的代码以 wb+ 模式打开文件,这意味着程序会以二进制形式来输出文件,此时程序输出的必须是宇节串,不能是字符串。因此,程序调用 encode() 方法将字符串转换成字节串,转换时指定使用 UTF-8 字符集,这意味着程序将会以 UTF-8 字符集来保存文件。

该程序输出的文件内容与上一个程序输出的文件内容相同,只是该程序输出的文件内容是以 UTF-8 字符集保存的。

从上面的程序可以看到,当使用 w+、wb+ 模式打开文件时,会导致文件内容被清空。因此,无论程序运行多少次,其输出的文件内容都只保留最近一次的输出数据。如果程序希望在文件后面追加内容,则应该使用 a+ 或 ab+ 模式。例如如下程序:

  import os  f = open('z.txt', 'a+')  # os.linesep代表当前操作系统上的换行符  f.write('我爱Python' + os.linesep)  f.writelines(('土门壁甚坚,'+ os.linesep,      '杏园度亦难。'+ os.linesep,      '势异邺城下,'+ os.linesep,      '纵死时犹宽。'+ os.linesep))

上面程序以 a+ 模式打开指定文件,这意味着以追加模式来打开文件,因此,使用 open() 函数打开文件后,不会立即清空文件内容,并且会将文件指针移动到文件结尾处,程序会在文件结尾处追加内容。

每次运行上面程序,都会向 z.txt 文件中追加一段内容;程序运行的次数越多,z.txt 文件的内容就会越多。

关于作者: Python基础入门教程

为您推荐

广告位

发表评论