import pandas as pd
table1 = './data/table1.csv'
file = pd.read_csv(filepath_or_buffer, sep="", names="", index_col="", parse_dates="")

filepath_or_buffer:

数据输入的路径:可以是文件路径、可以是URL,也可以是实现read方法的任意对象。

#for example
#读取csv文件,最常见的情形
pd.read_csv("table.csv")
#通过URL访问文件
pd.read_csv("http://168.137.2:8080/table.csv")

sep:

读取csv文件时指定的分隔符,默认为逗号。有特殊要求则需要设置分隔符,注意:"csv文件的分隔符" 和 "我们读取csv文件时指定的分隔符" 一定要一致。

比如:分隔符从逗号改成"\t"

pd.read_csv('table.csv', sep='\t')

names:

   当names没被赋值时,即选取数据文件的第一行作为列名

    当names被赋值时,为文件制定列名

注意:names与另外一个参数header同时出现时,另当别论。

#为学生表赋列值
pd.read_csv('student.csv',names=["Name","Stu_id","Sex","Age"])

index_col: 

读取文件之后,生成的 DataFrame 的索引默认是0 1 2 3...,我们当然可以 set_index,但是也可以在读取的时候就指定某个列为索引。

进行时序预测分析时,需要对数据进行可视化分析,观察不同时间的数据走向,可以使得时间为索引,然后进行画图分析。

 

更多推荐

python读文件-read_csv()-常用参数