加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

这里有8个风行的Python可视化器材包,你喜好哪个?

发布时间:2019-04-30 06:48:26 所属栏目:建站 来源:机器之心编译
导读:用 Python 建设图形的要领有许多,可是哪种要领是最好的呢?当我们做可视化之前,要先明晰一些关于图像方针的题目:你是想起源相识数据的漫衍环境?想展示时给人们留下深刻印象?大概你想给或人展示一个内涵的形象,一此中庸的形象? 本文将先容一些常用的 Pyt
副问题[/!--empirenews.page--]

用 Python 建设图形的要领有许多,可是哪种要领是最好的呢?当我们做可视化之前,要先明晰一些关于图像方针的题目:你是想起源相识数据的漫衍环境?想展示时给人们留下深刻印象?大概你想给或人展示一个内涵的形象,一此中庸的形象?

Python可视化器材包

本文将先容一些常用的 Python 可视化包,包罗这些包的优弱点以及别聚散用于什么样的场景。这篇文章只扩展到 2D 图,为下一次讲 3D 图和贸易报表(dashboard)留了一些空间,不外这次要讲的包中,很多都可以很好地支持 3D 图和贸易报表。

Matplotlib、Seaborn 和 Pandas

把这三个包放在一路有几个缘故起因:起首 Seaborn 和 Pandas 是成立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的着实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是相似的,自界说图时用的语法也都很是相似。

当提到这些可视化器材时,我想到三个词:试探(Exploratory)、数据(Data)、说明(Analysis)。这些包都很得当第一次试探数据,但要做演示时用这些包就不足了。

Matplotlib 是较量初级的库,但它所支持的自界说水平令人难以置信(以是不要简朴地将其解除在演示所用的包之外!),但尚有其余更得当做展示的器材。

Matplotlib 还可以选择样式(style selection),它模仿了像 ggplot2 和 xkcd 等很风行的美化器材。下面是我用 Matplotlib 及相干器材所做的示例图:

在处理赏罚篮球队薪资数据时,我想找出薪资中位数最高的团队。为了展示功效,我将每个球队的人为用颜色标成条形图,来声名球员插手哪一支球队才气得到更好的报酬。

  1. import seaborn as sns 
  2. import matplotlib.pyplot as plt 
  3.  
  4. color_order = ['xkcd:cerulean', 'xkcd:ocean', 
  5.                 'xkcd:black','xkcd:royal purple', 
  6.                 'xkcd:royal purple', 'xkcd:navy blue', 
  7.                 'xkcd:powder blue', 'xkcd:light maroon',  
  8.                 'xkcd:lightish blue','xkcd:navy'] 
  9.  
  10. sns.barplot(x=top10.Team, 
  11.             y=top10.Salary, 
  12.             palette=color_order).set_title('Teams with Highest Median Salary') 
  13.  
  14. plt.ticklabel_format(style='sci', axis='y', scilimits=(0,0)) 

第二个图是回归尝试残差的 Q-Q 图。这张图的首要目标是展示怎样用只管少的线条做出一张有效的图,虽然大概它也许不那么雅观。

  1. import matplotlib.pyplot as plt 
  2. import scipy.stats as stats 
  3.  
  4. #model2 is a regression model 
  5. log_resid = model2.predict(X_test)-y_test 
  6. stats.probplot(log_resid, dist="norm", plot=plt) 
  7. plt.title("Normal Q-Q plot") 
  8. plt.show() 

最终证明,Matplotlib 及其相干器材的服从很高,但就演示而言它们并不是最好的器材。

ggplot(2)

你也许会问,「Aaron,ggplot 是 R 中最常用的可视化包,但你不是要写 Python 的包吗?」。人们已经在 Python 中实现了 ggplot2,复制了这个包从美化到语法的统统内容。

在我看过的全部原料中,它的统统都和 ggplot2 很像,但这个包的甜头是它依靠于 Pandas Python 包。不外 Pandas Python 包最近弃用了一些要领,导致 Python 版本不兼容。

假如你想在 R 顶用真正的 ggplot(除了依靠相关外,它们的外面、感受以及语法都是一样的),我在其它一篇文章中对此举办过接头。

也就是说,假如你必然要在 Python 顶用 ggplot,那你就必必要安装 0.19.2 版的 Pandas,但我提议你最好不要为了行使较初级的画图包而低落 Pandas 的版本。

ggplot2(我认为也包罗 Python 的 ggplot)举足轻重的缘故起因是它们用「图形语法」来构建图片。根基条件是你可以实例化图,然后别离添加差异的特性;也就是说,你可以别离对问题、坐标轴、数据点以及趋势线等举办美化。

下面是 ggplot 代码的简朴示例。我们先用 ggplot 实例化图,配置美化属性和数据,然后添加点、主题以及坐标轴和问题标签。

  1. #All Salaries 
  2. ggplot(data=df, aes(x=season_start, y=salary, colour=team)) + 
  3.   geom_point() + 
  4.   theme(legend.position="none") + 
  5.   labs(title = 'Salary Over Time', x='Year', y='Salary ($)') 

Bokeh

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读