在数据分析时,经常会针对两个变量进行相关性分析。在Python中主要用到的方法是pandas中的corr()方法。
corr():如果由数据框调用corr函数,那么将会计算每个列两两之间的相似度,返回DataFrame

# -*- coding: utf-8 -*-
# 导入包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus']=False

# 导入数据
df = pd.read_csv('./data2.txt', sep='\t')
df_coor = df.corr()
print(df_coor)

fig, ax = plt.subplots(figsize=(6, 6),facecolor='w')
# 指定颜色带的色系
sns.heatmap(df.corr(),annot=True, vmax=1, square=True, cmap="Blues", fmt='.2g')
plt.title('相关性热力图')
plt.show()

fig.savefig('./df_corr.png',bbox_inches='tight',transparent=True)



运行结果:

                      shu_liao_temperature  aqc_temperature  wind_volume
shu_liao_temperature              1.000000         0.413273     0.012092
aqc_temperature                   0.413273         1.000000    -0.316703
wind_volume                       0.012092        -0.316703     1.000000

Process finished with exit code 0

更多推荐

【python 相关性分析】Python绘制相关性热力图