c语言打开文件并输出,文件的读取，c语言打开文件并输出

文件的读取，c语言打开文件并输出

在做数据分析的过程中，经常会遇到文件的读取。我想很多人都在这个环节遇到过问题，所以就把自己掌握的一些文件读取方法记录下来，以及过程中遇到的一些状况和解决方法列出来，以便交流。

open

open() 函数用于创建或打开指定文件，该函数的语法格式如下：

file = open(file_name [, mode[, buffering]])

参数说明：

file：表示要创建的文件对象。

file_name：要创建或打开文件的文件名称。

mode：可选参数，用于指定文件的打开模式。默认以只读(r)模式打开文件。

buffing：可选参数，用于指定对文件做读写操作时，是否使用缓冲区。如果 buffering 的值被设为 0，就不会有寄存。如果 buffering 的值取 1，访问文件时会寄存行。如果将 buffering 的值设为大于 1 的整数，表明了这就是的寄存区的缓冲大小。如果取负值，寄存区的缓冲大小则为系统默认。

不同模式打开文件的完全列表：

模式描述

以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。

打开一个文件用于读写。文件指针将会放在文件的开头。

rb+

以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

wb+

以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。

打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。

ab+

以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

基本用法如下：

f = open('filename', 'r')print(f.read())

f.close()#释放文件

简易写法：with语句结束会自动关闭文件

with open('filename', 'r') as f:print(f.read())

file 对象方法

file.read([size])：size 未指定则返回整个文件，如果文件大小 >2 倍内存则有问题，f.read()读到文件尾时返回""(空字串)。

file.readline()：返回一行。

file.readlines([size])：返回包含size行的列表, size 未指定则返回全部行。

for line in f: print(line)：通过迭代器访问。

f.write("hello\n")：如果要写入字符串以外的数据,先将他转换为字符串。

f.tell()：返回一个整数,表示当前文件指针的位置(就是到文件头的比特数)。

f.seek(偏移量,[起始位置])：用来移动文件指针。

偏移量: 单位为比特，可正可负

起始位置: 0 - 文件头, 默认值; 1 - 当前位置; 2 - 文件尾

f.close() 关闭文件

文件的编码问题

在读取文件的时候，容易出现编码问题，例如：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 0: invalid start byte

这是因为open()函数在读取文件时默认使用utf-8编码，当文件编码不匹配时，就会报类似上面的编码错误。这时可以通过指定编码类型来解决，例如：

with open('filename', 'r', encoding='gbk') as file:

file.read()

大文件的读取技巧

python读取文件一般情况是利用open()函数以及read()函数来完成，但这种方法适用于读取小文件，因为read()函数会将数据读入内存。当需读取文件大于内存的大小时，会造成MemoryError，也就是发生内存溢出。所以需要一定的技巧来实现大文件的读取。

解决方法：

(1)read(参数)：通过参数指定每次读取的大小长度，循环读取

with open('filename','r') as file:whileTrue:

block= file.read(1024)if notblock:break

(2)readline()：每次获取一行数据

with open('filename','r') as file:for line infile.readline():pass #对应操作

(3)对可迭代对象file进行迭代，这样会自动的使用buffered IO以及内存管理

with open('filename','r') as file:for line infile:pass #对应操作

json

当我们读取的文件是Json格式的时候，利用json包可以方便的将数据转换为python的字典格式

Json模块提供了四个功能：dumps、dump、loads、load

dumps把数据类型转换成字符串

dump把数据类型转换成字符串并存储在文件中

loads把字符串转换成数据类型

load把文件打开从字符串转换成数据类型

示例，将一个字符串转换为字典：

importjson

string= '{"name":"张三", "age":24}'dict1= json.loads(string)

http://www.dengb/Pythonjc/1370165.htmlwww.dengbtruehttp://www.dengb/Pythonjc/1370165.htmlTechArticle文件的读取，c语言打开文件并输出在做数据分析的过程中，经常会遇到文件的读取。我想很多人都在这个环节遇到过问题，所以就把自己...

更多推荐

c语言打开文件并输出,文件的读取,c语言打开文件并输出