您当前的位置:首页 > 文章 > Python制作热力图的详细代码

Python制作热力图的详细代码

作者:可持续编码 时间:2025-12-23 阅读数:51 人阅读分享到:

引言

想象一下,你的数据不再是冰冷的数字表格,而是一幅充满生命力的彩色画卷——每个数字都有了自己的颜色,数据的高低起伏一目了然。

热力图,正是这种让数据“看得见”的强大工具。它通过颜色的深浅变化来展示数据的分布和大小关系,能让我们直观地发现数据中的热点区域异常点潜在模式,特别适合展示相关性矩阵、地理分布或时间序列数据。

1 工具准备:为数据上色

在Python的世界里,制作热力图主要靠三个强大工具:Matplotlib、Seaborn和Pyecharts。它们各有特色,像不同画风的画家,都能帮你把数据变成美丽的图画。

安装这些工具非常简单。打开你的终端或命令行窗口,输入以下命令:

pipinstallmatplotlib seaborn pandas numpy pyecharts

这行命令会帮你安装绘图所需的全部核心库。其中,Pandas负责高效读取和处理数据,就像一位数据管家;而NumPy则擅长处理多维数组,为热力图提供“颜料”。

2 数据读取:从文件到代码

学会了调色,接下来我们要获取“颜料”——数据。通常,数据会以文件的形式存在,最常见的是CSV或Excel格式。下面是用Pandas读取它们的方法:

importpandas as pd
 
# 读取CSV文件
df_csv=pd.read_csv('your_data.csv')
 
# 读取Excel文件 
df_excel=pd.read_excel('your_data.xlsx', sheet_name='Sheet1')

如果你的数据是制表符分隔的TSV文件,还可以使用pd.read_csv('file.tsv', sep='\t')。

在实际操作中,数据往往不会“完全听话”。这时你需要先进行一些简单的预处理,比如用df.head()查看前几行数据,用df.info()了解数据的基本情况,或用df.dropna()删除包含缺失值的行。

3 三种画法:热力图的实现方法

工具箱已经准备就绪,现在来学习三种主要的绘制方法。

基础方法:使用Matplotlib绘制

Matplotlib是Python绘图的基础库,就像画画用的铅笔和直尺。它提供了绘制热力图的核心功能。

importmatplotlib.pyplot as plt
importnumpy as np
 
# 生成模拟数据
data=np.random.rand(10,10) # 创建一个10行10列的随机数组
 
# 绘制热力图
plt.figure(figsize=(8,6)) # 设置图形大小
plt.imshow(data, cmap='viridis', interpolation='nearest')
plt.colorbar() # 添加颜色条
plt.title('Matplotlib热力图示例')
plt.show()

这里的关键是imshow()函数,其中cmap参数指定了颜色映射方案。尝试把'viridis'换成'hot'、'coolwarm'或'YlGnBu',看看不同色彩带来的视觉效果。

优雅方法:使用Seaborn绘制

Seaborn基于Matplotlib,但提供了更美观、更高层次的接口,可以说是数据可视化的“美图秀秀”

importseaborn as sns
 
# 使用Seaborn生成随机数据
data=sns.randn(100,10)
 
# 绘制热力图
plt.figure(figsize=(10,8))
sns.heatmap(data, annot=True, fmt=".1f", cmap='coolwarm')
plt.title('Seaborn热力图示例')
plt.show()

Seaborn的heatmap()函数功能非常强大:annot=True会在每个格子里显示数值;fmt=".1f"控制数值格式为保留一位小数。

交互方法:使用Pyecharts绘制

如果你的热力图需要嵌入网页,或者想要添加交互功能,Pyecharts是理想的选择。

frompyechartsimportoptions as opts
frompyecharts.chartsimportHeatMap
importrandom
 
# 生成模拟数据
data=[]
foriinrange(24):
    forjinrange(7):
        data.append([j, i, random.randint(0,100)])
 
# 创建热力图
heatmap=(
    HeatMap()
    .add_xaxis(['周一','周二','周三','周四','周五','周六','周日'])
    .add_yaxis(
        "热度",
        list(range(24)),
        data,
        label_opts=opts.LabelOpts(is_show=False),
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="一周热度分布"),
        visualmap_opts=opts.VisualMapOpts(min_=0, max_=100),
    )
)
heatmap.render("heatmap_example.html") # 保存为HTML文件

这个例子创建了一个交互式的网页热力图,显示一周7天、24小时的热度分布。将鼠标悬停在格子上,可以看到具体数值。

4 美化调整:让热力图更专业

掌握了基本画法后,下面来看看如何让热力图变得更专业、更易读。

优化布局与颜色

# 专业热力图设置示例
plt.figure(figsize=(12,10))
 
# 绘制热力图,添加更多参数
sns.heatmap(data,
            annot=True,          # 显示数值
            fmt=".2f",          # 数值格式
            cmap='YlGnBu',      # 颜色方案
            linewidths=0.5,     # 单元格边线宽度
            linecolor='white',  # 边线颜色
            cbar_kws={'label':'数值大小'}) # 颜色条标签
 
# 优化标签显示
plt.xticks(rotation=45, ha='right') # x轴标签旋转45度
plt.yticks(rotation=0)
plt.title('优化后的热力图示例', fontsize=16, pad=20)
plt.xlabel('X轴标签')
plt.ylabel('Y轴标签')
plt.tight_layout() # 自动调整布局
plt.show()

调整颜色映射方案

不同的颜色映射适用于不同的数据类型:

  • 顺序型数据(如温度、密度):适合'viridis'、'plasma'、'YlOrRd'
  • 发散型数据(如相关性、偏差):适合'coolwarm'、'RdBu'、'PiYG'
  • 定性/分类数据:适合'Set1'、'tab20c'、'Pastel1'

5 实战案例:电商用户行为分析

现在,让我们通过一个完整的实战案例,将前面学到的知识融会贯通。假设我们有一份电商平台的用户点击数据,想要分析用户在不同时间对不同页面的访问热度。

第一步:数据准备与读取

importpandas as pd
 
# 读取数据(假设是CSV格式)
df=pd.read_csv('user_clicks.csv')
 
# 查看数据前几行
print(df.head())
 
# 查看数据基本信息
print(df.info())

第二步:数据处理与转换

我们需要将原始数据转换为适合绘制热力图的格式:

# 提取需要的数据列(假设数据包含time, page_url, clicks等列)
clicks_by_time_page=df.groupby(['hour','page_url'])['clicks'].sum().reset_index()
 
# 数据透视:将长格式转换为宽格式
heatmap_data=clicks_by_time_page.pivot(index='page_url', columns='hour', values='clicks')
 
# 标准化处理(可选,使颜色对比更明显)
heatmap_data_normalized=(heatmap_data-heatmap_data.min())/(heatmap_data.max()-heatmap_data.min())

第三步:绘制热力图

importseaborn as sns
importmatplotlib.pyplot as plt
 
# 设置中文字体(如果需要显示中文)
plt.rcParams['font.sans-serif']=['SimHei','Arial']
plt.rcParams['axes.unicode_minus']=False
 
# 创建热力图
plt.figure(figsize=(14,10))
sns.heatmap(heatmap_data_normalized,
            cmap='YlOrRd',
            annot=False, # 数据多时不显示具体数值
            linewidths=0.5,
            cbar_kws={'label':'标准化点击量'})
 
# 添加标题和标签
plt.title('电商平台用户点击热力图(按页面和时间)', fontsize=18, pad=20)
plt.xlabel('小时', fontsize=14)
plt.ylabel('页面URL', fontsize=14)
 
# 调整x轴刻度
hours=list(range(24))
plt.xticks(ticks=[i+0.5foriinhours], labels=hours, rotation=0)
 
plt.tight_layout()
plt.savefig('user_clicks_heatmap.png', dpi=300, bbox_inches='tight')
plt.show()

第四步:热力图解读

通过观察生成的热力图,我们可以得出一些有价值的洞察:

  • 找出访问高峰期:哪些时间段用户最活跃?
  • 发现热门页面:哪些页面吸引最多点击?
  • 识别异常模式:是否有页面在非高峰时段也有高访问量?
  • 优化内容策略:根据热度分布调整内容发布时间和位置。

如果你需要更高级的功能,如自动调整字体大小以适应数据维度,可以参考中提到的动态可视化技术。

6 高级技巧与最佳实践

掌握了基础知识后,让我们看看一些能让你的热力图更上一层楼的技巧。

三维热力图: 对于空间数据,可以创建三维热力图来展示数据在三维空间中的分布。例如,分析不同高度无人机分布,物流无人机集中在50-100米(蓝色区域),而载人飞行器分布在200-300米(红色区域)。

动态热力图: 使用Plotly或Pyecharts创建交互式热力图,允许用户缩放、悬停查看数值、筛选数据。

大数据优化: 当数据量很大时,可以采用以下优化策略:

  • 使用采样:对大数据集进行适当采样
  • 降低分辨率:减少热力图的单元格数量
  • 选择高效颜色映射:如'viridis'比'jet'更高效

多图组合: 将热力图与其他图表结合,提供更全面的视角:

  • 热力图 + 散点图:同时展示密度和个体分布
  • 热力图 + 折线图:展示趋势和密度关系
  • 热力图 + 条形图:对比不同类别的汇总数据

从这张基础的热力图中,我们可以清晰看到数据的高低分布。颜色的深浅变化直观地揭示了数据的热点区域冷点区域,这正是热力图最核心的价值所在。

色彩不只是装饰,它是数据的另一种语言。当你掌握了热力图的绘制技巧,就多了一种与数据对话的方式。

这个世界上的数据,无论是网页点击、销售额变化,还是气温分布,都等待着被赋予颜色,被真正“看见”。

来源:https://www.jb51.net/python/355428hov.htm

本站大部分文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了您的权益请来信告知我们删除。邮箱:1451803763@qq.com