摘要: matplotlib 使用总结,包含使用流程和各种图型使用场景,以及对比。
matplotlib使用总结
- 应该选择那种图形来呈现数据
- plt.plot(x,y)
- plt.bar(x,y)
- plt.hist(data,bins,normed)
- plt.pie(x,labels,autopct,colors)
- plt.scatter(x,y) # 散点图
- xticks和yticks的设置
- label和title,grid的设置
- 绘图的大小和保存图片
使用流程
- 明确问题
- 选择图形的呈现方式
- 准备数据
- 绘图和图形完善
折线图使用场景
- 呈现公司产品(不同区域)每天活跃用户数
- 呈现app每天下载数量
- 呈现产品新功能上线后,用户点击次数随时间的变化
-
呈现员工每天上下班时间
绘制了折线图(plt.plot) 设置了图片的大小(plt.figure) 实现了图片的保存(plt.savefig) 设置了xy轴上的刻度和字符串(xticks) 解决了刻度稀疏和密集的问题(xticks) 设置了标题,xy轴的lable(title,xlabel,ylabel) 设置了字体(font_manager. fontProperties,matplotlib.rc) 在一个图上绘制多个图形(plt多次plot即可) 增加子画布,分开显示图像(plt.subplots) 为不同的图形添加图例
直方图使用场景
- 用户的年龄分布状态
- 一段时间内用户点击次数的分布状态
- 用户活跃时间的分布状态
条形图使用场景
- 数量统计
- 用户数量分析
- 业务对比
散点图使用场景
- 不同条件(维度)之间的内在关联关系
- 观察数据的离散聚合程度
对比常用统计图
折线图:以折线的上升或下降来表示统计数量的增减变化的统计图
特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)
直方图:由一系列高度不等的纵向条纹或线段表示数据分布的情况。
一般用横轴表示数据范围,纵轴表示分布情况。
特点:绘制,连续性的数据展示一组或者多组数据的分布状况(统计)
条形图:排列在工作表的列或行中的数据可以绘制到条形图中。
特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计)
散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量
之间是否存在某种关联或总结坐标点的分布模式。
特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)