代码收藏家技术教程 2024-10-13

python中的文件操作

文章目录

1.函数

2.列表与元组

3.字典

4.文件

4.1 文件是什么

4.2 文件路径

4.3 文件操作

4.3.1 打开文件

4.3.2 关闭文件

4.3.3 写文件

4.3.4 读文件

4.4 关于中文的处理

4.5 使用上下文管理器

1.函数

函数

2.列表与元组

列表与元组

3.字典

字典

4.文件

4.1 文件是什么

变量是把数据保存到内存中，如果程序重启/断电，内存中的数据就会丢失。
要想实现数据的持久化存储，就需要把数据存储，就可以把数据存储到硬盘中，也就是在文件中存储。
一些常见的文件类型：

文本文件 txt
可执行文件 exe class 
图片文件 jpg png
视频文件 mp4 mov
office文件 ppt docx

本文主要聚焦于文本文件。

4.2 文件路径

在系统中会存在特别多的文件，为了人让这些文件更加全面的被组织，往往会使用很多的文件夹，在Linux也叫目录。
实际上一个文件往往会进行许多的目录嵌套。为了方便确定一个文件的位置，使用文件路径来描述就很方便了。
以我存储python代码的路径为例D:\code\python

D:表示盘符，不区分大小写。

每个\表示一级目录，当前的python就是放在D盘下的code目录下的。

目录之间的分隔符，可以使用\也可以使用/一般在编写代码时使用/更方便。
绝对路径于相对路径：

以盘符开头的路径，我们称为绝对路径。

相对路径需要先指定一个基准目录，然后以基准目录位参照点，间接的找到目标文件。
在描述一个文件路径时，使用绝对路径还是相对路径都是可以的。

4.3 文件操作

要使用文件，主要通过文件来保存数据，并且在后续把保存数据调出来。为了读写文件，首先当然需要打开文件，在完成操作后在关闭文件。

4.3.1 打开文件

使用内建函数open打开文件。

f = open('d:/test.txt','r')

第一个参数是一个字符串，表示要打开的路径。

第二个参数是一个字符串，表示打开方法，其中r表示按读方式打开，w表示按照写方式打开，’a‘表示追加方式打开。

如果文件打开成功，返回一个文件对象，后续的读写文件操作都是围绕这个文件对象展开的。

如果打开文件失败，如指定路径不存在，就会抛出异常。

4.3.2 关闭文件

使用close方法关闭已打开的的文件。

f.close()

使用完毕的文件一定要记得关闭。
一个程序能同时打开的文件数是有限制的

flist = []
count = 0
while True:
	f = open('d:/tmp/test.txt','r')
	flist.append(f)
	count+=1
	print(f'count = {count}')
'''
...
count = 8187
count = 8188
count = 8189
Traceback (most recent call last):
  File "d:\code\python\python_test1\test.py", line 158, in <module>
OSError: [Errno 24] Too many open files: 'd:/tmp/test.txt'
'''

从代码上来看，大概一个程序是可以打开8000个文件。如果一种循环的打开文件，而不去关闭，就会出现上述问题。当一个程序打开的文件超过上限，就会抛出异常。

上述代码中，使用一个列表来保存所有文件对象，如果不进行保存，那么python内置的垃圾回收机制就会在文件销毁的时候自动关闭文件。
但是由于垃圾回收机制不一定及时，所以我们写代码时仍然需要手动回收，避免依赖于自动回收。

4.3.3 写文件

文件打开后，就可以写文件了。

写文件，要使用学方法打开，open第二个参数为w。

使用write方法写入文件。

f = open('d:/tmp/test.txt','w')
f.write('i am yui')
f.close()

打开test.txt发现已经写入。
如果在r方式下写入的话，程序会抛出异常。

使用w打开文件成功后，原有文件中的数据会清零。
使用a实现追加写，此时原有内容不变，写入的内容会存在于之前文件内容的末尾。

f = open('d:/tmp/test.txt','w')
f.write('i am yui')
f.close()

f = open('d:/tmp/test.txt','a')
f.write(',hello')
f.close()

针对已经关闭的文件对象进行写入，程序会抛出异常。

4.3.4 读文件

读文件内容需要使用r方式打开文件。

使用read方法完成读操作，参数表示读取几个字符。

f = open('d:/tmp/test.txt','r')
result = f.read(10)
print(result)
f.close()
'''
i am yui,h
'''

如果文件是多行文本，可以使用for循环一次读取一行。
我们先构造一个多行的文本文件。

下面来打印这文件的内容。

f = open('d:/tmp/test.txt','r')
for line in f:
	print(f'line = {line}')
f.close()
'''
line = 111111

line = 222222

line = 333333

line = 444444

'''

由于文件里每行的末尾都自带一个换行符，print打印的时候又会默认加上一个换行符，因此打印结果看起来之间存在空格。
使用

print(f'line = {line}',end='')

可以取代print自带的换行符。

使用readline直接把文件整个内容读取出来，返回一个列表，每个元素即为一行。

f = open('d:/tmp/test.txt','r')
lines = f.readlines()
print(lines)
f.close()
'''
['111111\n', '222222\n', '333333\n', '444444\n']
'''

4.4 关于中文的处理

当文件内容出现中文时，读取文件内容可能会出现错误。即出现乱码。
为什么会出现这种情况呢？
计算机表示中文的时候，会采取一定的编码方式，被称为字符集

所谓的“编码方式”，本质就是使用数字表示汉字。
众所周知，计算机只能表示二进制数据，要想表示英文字母或者汉字或者其他的文字字符，就就要通过编码。
最简单的字符编码ASCII，使用一个简单的整数就可以表示英文字母和数字，但是如果要表示汉字就需要更大的码表了。
目前常用的汉字编码方式主要是：GBK和UTF-8.

为此必须保证文件本身的编码方式，和python代码中读取文件使用的编码方式相一致，才能够避免出错。

python3默认打开文件的字符集跟随系统，而Windows简体中文版的字符集采用GBK，所以如果文件本身是GBK的编码，直接就能正确处理。如果不是的就会出错。

4.5 使用上下文管理器

打开文件后，最容易忘记的就是关闭。python提供了上下文管理器，来帮助我们自动关闭文件。

使用with语句打开文件。

当with内部的代码执行完毕后，就会自动调用关闭方法。

with open('d:/tmp/test.txt','r') as f:
	lines = f.readlines()
	print(lines)
'''
['111111\n', '222222\n', '333333\n', '444444\n']
'''

作者：Yui_

物联沃分享整理
物联沃-IOTWORD物联网 » python中的文件操作

代码收藏家普通

分享到：

文章目录

1.函数

2.列表与元组

3.字典

4.文件

4.1 文件是什么

4.2 文件路径

4.3 文件操作

4.3.1 打开文件

4.3.2 关闭文件

4.3.3 写文件

4.3.4 读文件

4.4 关于中文的处理

4.5 使用上下文管理器

代码收藏家 普通

相关推荐

发表回复 取消回复

代码收藏家普通

发表回复取消回复