tsv文件中的分隔符一般是‘\t’,比如下边这个文件:
该rating.tsv文件没有表头,逐行读取方法如下:
with open('rating.tsv', 'r', encoding='utf-8') as f:
for line in f:
# 读取一行后,末尾一般会有一个\n,所以用strip函数去掉
line = line.strip('\n').split('\t')
print(line[0])
print(line[1])
print(line[2])
break
输出如下:
这样读取出来的是字符串,需要计算时可以利用int()或者float()函数转为数字即可。
上边是没有表头的tsv文件,当有表头时,也很简单,以下边的文件为例:
代码如下,就多了一行:
with open('1.tsv', 'r', encoding='utf-8') as f:
next(f) # 跳过第一行即可
for line in f:
line = line.strip('\n').split('\t')
print(line[0])
print(line[1])
print(line[2])
break
输出如下:
多说点,关于去掉末尾的换行符‘\n’,有两种写法:
1、str.strip('\n')
2、str.replace('\n', '')
第一种方法,strip函数其实是去掉首尾指定的字符串序列,一般开头没有对应的字符还好,如果开头也有对应的字符的话要小心使用,因为也会把开头的字符序列去掉;
第二种方法就好理解了,用空字符串替换掉\n,一般字符串中只有末尾有\n时可以用;
上边两种方法都可以用,具体问题具体分析。
更多推荐
Python逐行读取tsv文件
发布评论