Python逐行读取tsv文件

tsv文件中的分隔符一般是‘\t’，比如下边这个文件：

该rating.tsv文件没有表头，逐行读取方法如下：

with open('rating.tsv', 'r', encoding='utf-8') as f:
    for line in f:
        # 读取一行后，末尾一般会有一个\n，所以用strip函数去掉
        line = line.strip('\n').split('\t')  
        print(line[0])
        print(line[1])
        print(line[2])
        break

输出如下：

这样读取出来的是字符串，需要计算时可以利用int()或者float()函数转为数字即可。

上边是没有表头的tsv文件，当有表头时，也很简单，以下边的文件为例：

代码如下，就多了一行：

with open('1.tsv', 'r', encoding='utf-8') as f:
    next(f)  # 跳过第一行即可
    for line in f:
        line = line.strip('\n').split('\t')
        print(line[0])
        print(line[1])
        print(line[2])
        break

输出如下：

多说点，关于去掉末尾的换行符‘\n’，有两种写法：

1、str.strip('\n')

2、str.replace('\n', '')

第一种方法，strip函数其实是去掉首尾指定的字符串序列，一般开头没有对应的字符还好，如果开头也有对应的字符的话要小心使用，因为也会把开头的字符序列去掉；

第二种方法就好理解了，用空字符串替换掉\n，一般字符串中只有末尾有\n时可以用；

上边两种方法都可以用，具体问题具体分析。

更多推荐

Python逐行读取tsv文件