加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

7件事,让你快速提高数据分析能力

发布时间:2019-11-06 19:40:46 所属栏目:移动互联 来源:读芯术
导读:想让本身的数据说明手段更上一层楼吗?本文可以辅佐你形成一个逐日加快晋升数据说明手段清单。 #1: Pandas Profiling 这一器材的利益显而易见。以下动画是行使df.profile_report()这一简朴要领的功效。请自行观当作就展示; 行使此器材只需安装和导入Pandas
副问题[/!--empirenews.page--]

想让本身的数据说明手段更上一层楼吗?本文可以辅佐你形成一个“逐日加快晋升数据说明手段清单”。

7件事,让你快速进步数据说明手段

#1: Pandas Profiling

这一器材的利益显而易见。以下动画是行使df.profile_report()这一简朴要领的功效。请自行观当作就展示;

7件事,让你快速进步数据说明手段

行使此器材只需安装和导入Pandas Profiling措施包即可。

#2: 行使Cufflinks和Plotly绘制Panda数据

大多所谓的“履历富厚的”数据科学家或数据说明师都对matplotlib和 pandas的协同很是认识。也就是说,他们可以通过行使.plot()函数快速绘制pd.DataFrame或pd.Series图像。

7件事,让你快速进步数据说明手段

有点无聊是吧?

此刻就好了。怎样做一个交互型全景式可缩放的图像呢?Cufflinks 可以做到!(由 Plotly提供)

在体系中安装Cufflinks即可! 快速安装Cufflinks ——在本身最喜好的终端举办更新即可。可以寓目以下动画:

7件事,让你快速进步数据说明手段

许多几何了!

留意,独一会改变以上功效的是对Cufflinks输入并配置cf.go_offline() 函数。别的的只是把.plot()改成.iplot()。

其他像.scatter_matrix()这样的函数会带来不错的可视化图像:

7件事,让你快速进步数据说明手段

酷毙了!

但愿从事大量数据可视化事变的伴侣都看一看有关的Cufflinks和Plotly内容,从中可以找到大量要领!

#3: IPython Magic Commands

IPython 的Magics本质上就是IPython堆叠在Python语法顶端的一系列增强成果。Magic commands有两种:其一为line magics,用%作为前缀暗示,在一行输入的代码上运行;而 cell magics用%%作为前缀暗示,在多行输入的代码上运行。以下是Magics的一些适用函数:

%lsmagic: 一应俱全。

不妨先实行一些传统却好用的要领。假如只记得一条Magic Command,预计就是它了。执行%lsmagic将会呈现全部可用的Magic Commands列表:

7件事,让你快速进步数据说明手段

%debug: 交互措施调试

这预计是Magic Command行使频次最高的了。

大多人都试过:措施员执行一个代码块,而这个代码块一向堕落。绝望中的措施员为了输出每一变量的内容,写下20 print()一类代码。然后当措施员终于修复了题目时,就不得不回过甚删除全部列出的函数。

然而此刻不消了!只需在碰着题目的时辰执行%debug,就可以执行恣意一部门代码了:

7件事,让你快速进步数据说明手段

那么,总结一下以上内容:

1. 有一个函数,它将一个列表作为输入,并平方全部偶数。

2. 运行函数,某处呈现错误。但无法找到错误。

3. 堕落时把%debug呼吁标志到函数中。

4. 让调试措施表现x以及type(x)的值。

5. 由此找到了错误:6被看成了一行字符串!

可以想象,这一呼吁对更多更伟大的函数都大有效处!

%store: 在notebooks间互传变量

这个呼吁也很棒。起首说一说因由。措施员花时刻整理了notebook中的一些数据,此刻要测试另一notebook中的一些函数,因此既必要在统一notebook中实现函数成果,又要将其放到另一notebook中。用%store只要存储变量,并在任一notebook中检索即可:

7件事,让你快速进步数据说明手段

%store [variable]存储变量。

%store -r [variable]阅读/检索已存储的变量。

%who: 摆列全部变量。

是否曾将某个值赋到一个变量上但忘了变量名称?是否不警惕删除了赋值给变量的单位格?有了%who,就可以得到全部已赋值的变量:

7件事,让你快速进步数据说明手段

%%time: 邪术按时。

有了这个呼吁,就可以得到统统所需的按时信息。只要将%%time应用到任何一段可执行的代码中,就可以得到如下输出:

7件事,让你快速进步数据说明手段

24微秒。马轻率虎吧。

%%writefile: 将单位格内容编辑到文档。

这是本文的最后一个呼吁。当已经在notebook中写了一些伟大的函数或其种别,而想要将其从notebook中疏散存到文件中去时,这个呼吁很是有效。只需为函数或其种别添加前置%%writefile,然后添加文件名储存即可:

7件事,让你快速进步数据说明手段

如图所示,可以直接将建设的函数储存到 “utils.py” 文件夹中,以恣意情势导入函数即可。在其他notebook中也是这样!(只要都在utils.py文件夹的统一个目次中)

#4: Jupyter中的烂漫名目

这个很是棒!根基上,Jupyter应承在markdown单位格中配置一些HTML / CSS名目。这是一些常用的:

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读