加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 建站 > 正文

行使Python加快数据说明的10个简朴能力

发布时间:2019-07-11 02:02:21 所属栏目:建站 来源:Python部落
导读:提醒和能力,尤其是在编程规模,也许长短常有效的。偶然,一个小能力可以节减时刻和生命。一个小的快捷方法或附加组件偶然会被证明是天赐之物,并能真正提跨越产力。因此,下面是我最喜好的一些提醒和能力,我将它们以本文的情势一路行使和编译。有些也许
副问题[/!--empirenews.page--]

行使Python加快数据说明的10个简朴能力

提醒和能力,尤其是在编程规模,也许长短常有效的。偶然,一个小能力可以节减时刻和生命。一个小的快捷方法或附加组件偶然会被证明是天赐之物,并能真正提跨越产力。因此,下面是我最喜好的一些提醒和能力,我将它们以本文的情势一路行使和编译。有些也许是我们相等认识的,有些也许是新的,但我确信它们将在你下一次处理赏罚数据说明项目时派上用场。

1.说明pandas数据帧

Profiling(说明)是一个辅佐我们领略数据的进程,而Pandas Profiling就是执行这一进程的python包。这是一种对Pandas Dataframe(数据帧)举办试探性数据说明的轻盈、快速的要领。Pandas的df.describe()和df.info()函数凡是用作EDA进程的第一步。可是,它只提供了一个很是根基的数据概览,对付大型数据集的环境并没有多大辅佐。另一方面,Pandas Profiling(说明)函数行使df.profile_report()对pandas数据帧举办了扩展,以便快速举办数据说明。它用一行代码表现了许多信息,在交互式HTML陈诉中也是云云。

对付一个给定的数据集,pandas profiling(说明)包管帐算以下统计数据:

行使Python加快数据说明的10个简朴能力

Pandas Profiling 包计较出的统计数据.

安装

行使Python加快数据说明的10个简朴能力

用法

我们来行使迂腐的titanic数据集来演示多成果python说明器的成果。

行使Python加快数据说明的10个简朴能力

编者注:本文宣布一周后,Pandas-Profiling宣布了一个重大的进级版本——2.0.0。语法产生了一些变革,究竟上,它的成果已经包括在pandas自己中了,而且陈诉也变得越发全面。下面是最新的用法语法:

Usage

要在 Jupyter notebook中表现陈诉,请运行以下代码:

行使Python加快数据说明的10个简朴能力

你只必要这一行代码就可以在一个Jupyter notebook中表现数据说明陈诉。陈诉很是具体,包罗了须要的图表。

行使Python加快数据说明的10个简朴能力

你也可以行使以下代码将这个陈诉输出到一个交互式HTML文件中。

行使Python加快数据说明的10个简朴能力
行使Python加快数据说明的10个简朴能力

查阅文档获取更多细节和例子。

2.为pandas 图表带来交互性

Pandas有一个内置的.plot()函数,它是DataFrame类的一部门。然而,行使该函数泛起的可视化结果并不具有交互性,这使得它的吸引力低落。相反,也不能解除行使pandas. datafram .plot()函数绘制图表的利便性。假如我们不必要对代码举办重大修改,就可以行使pandas绘制出像plotly那样的交互式图表,那会怎么样呢?现实上,你可以行使Cufflinks库做到这一点。

Cufflinks库团结了plotly的强盛成果和pandas的机动性,便于轻松画图。此刻我们来看看怎样安装这个库并让它在pandas中运行。

安装

行使Python加快数据说明的10个简朴能力

用法

行使Python加快数据说明的10个简朴能力

是时辰看看行使Titanic数据集睁开的神奇之处了。

行使Python加快数据说明的10个简朴能力
行使Python加快数据说明的10个简朴能力
df.iplot() 比拟 df.plot()

右边的可视化表现的是静态图表,而左边的图表是交互式的,而且越发具体,全部这些都没有对语法举办任何重大变动。

3. 一点邪术

邪术呼吁是Jupyter Notebook中的一组利便的函数,旨在办理尺度数据说明中的一些常见题目。你可以通过%lsmagic呼吁来查察全部可用的邪术呼吁。

行使Python加快数据说明的10个简朴能力
全部可用邪术函数的列表

邪术呼吁有两种范例: line magics(行邪术)和cell magics(单位邪术),前者以单个%字符作为前缀,并在一行输入长举办操纵;后者与两个%%前缀关联,并在多行输入长举办操纵。假如将邪术函数的选项配置为1时,不必要键入初始%就可挪用它。

我们来看看在常见的数据说明使命中也许有效的一些邪术函数:

% pastebin

%pastebin将代码上传到Pastebin并返回其url。Pastebin是一个在线内容托管处事,我们可以在个中存储纯文本,如源代码片断,然后可以将url与他人共享。究竟上,Github gist也相同于Pastebin,尽量它有版本节制。

我们假设有一个包括以下内容的python剧本file.py:

行使Python加快数据说明的10个简朴能力

在Jupyter Notebook中行使%pastebin天生一个pastebin的url地点.

行使Python加快数据说明的10个简朴能力

%matplotlib notebook

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读