加入收藏 | 设为首页 | 会员中心 | 我要投稿 河北网 (https://www.hebeiwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

2019 年,Python 数据科学该怎么学

发布时间:2019-03-20 23:49:42 所属栏目:移动互联 来源:Thomas Nield
导读:客岁我抉择从传统水利行业跨行到 Python 规模的时辰,满脑筋都是狐疑与担忧,踌躇放弃所学多年的专业常识值不值得,担忧万一转行失败怎么办,纠坚贞际事变比想象中的难怎么办。 没碰着指点迷津的大佬,只好网上各类搜,众说纷纭,最后在「要不要转行」这个
副问题[/!--empirenews.page--]

客岁我抉择从传统水利行业跨行到 Python 规模的时辰,满脑筋都是狐疑与担忧,踌躇放弃所学多年的专业常识值不值得,担忧万一转行失败怎么办,纠坚贞际事变比想象中的难怎么办。

没碰着指点迷津的大佬,只好网上各类搜,众说纷纭,最后在「要不要转行」这个题目上挥霍了很长时刻。在跨过这个坎之后,转头来看早年那些题目,思绪清楚许多。

着实,在开始阶段,对比详细的专业常识,更重要的是大偏向掌握。比如,你汇报我旅途上的风光有何等何等美,但我想先知道是哪条路,好判定能不能去到。

最近看到一篇叫「2019 年进修数据科学是什么感觉」的文章,深有感伤。作者是 Thomas Nield,美国西南航空公司的商务参谋,著有《Getting Started with SQL (O'Reilly) 》等书,履历富厚的 IT 大牛。

文章中他 以一问一答的情势,给那些想要踏上数据科学之路的人,提了一些中肯的提议。内里有些概念很有代价,特节选翻译成文,这里分享给你。

配景:假设你是一名「表哥」,泛泛事变首要行使 Excel,数据透视表、制图表这些。最近相识到将来许多事变岗亭会被人工智能会代替,乃至包罗你此刻的事变。你抉择开始进修数据科学、人工智能和呆板进修,Google 搜刮「怎样成为数据科学家」找到了下面这样一份进修蹊径图,然后你就开始向作者大牛求教。

Q:我是否真的必需把握这个图表中的全部内容,才气成为数据科学家?

2019 年,Python 数据科学该怎么学

成为一名数据科学家的必需手艺(制止2013年)

A:简朴说,不必要所有。这是 2013 年的蹊径图,有点过期了,内里连 TensorFlow 都没有,根基没有人再参考。完全可以划掉这个图中的一些路径,前几年「数据科学」分别地过于分手,回收其他要了解更好。

Q:听你这样说就不那么求助了,那么我应该回到学校继承深造,然后得到一个数据科学硕士学位吗? 我看很大都据科学家至少都是硕士。

A:天哪,你为什么这样做?不要被「数据科学」这些高峻上的术语给唬住了,这些术语首要是用来从头界说一些营业分类。究竟上,学校传授的对象根基都是过期的技能,不如选择 Coursera 或 Khan Academy 这些在线自学网站。

Q:那么我该怎样开始自学呢?LinkedIn上的人说应该先辈修 Linux ,Twitter 的人提议先辈修 Scala,而不是 Python 或 R

A:不要信那些人的话。

Q:好的,R怎么样?不少人喜好它。

A:R 善于数学建模,但 Python 能做的更多,好比数据处理赏罚和搭建 Web 处事,总之Python 比 R 的进修投资回报率高。

Q:R 在 Tiobe上的排名如故很高,并且拥有大量的社区和资源,学它有什么欠好?

假如你只是对数学感乐趣,行使 R 完全没题目,共同 Tidyverse 包更是为虎傅翼。但数据科学的应用范畴远超数学和统计学。以是信托我,Python 在 2019 年更值得学,学它不会让你反悔。

Q:Python 难学么?

A:Python 是一种简朴的说话,可以帮你可以自动完成很多使命,做一些很酷的工作。不外数据科学不只仅是剧本和呆板进修,乃至不必要依靠 Python 。

Q:什么意思?

A:Python 这些只是器材,行使这些器材可以从数据中获取洞察力,这个进程偶然会涉及到呆板进修,但大部门时刻没有。简朴地来说,建设图表也可以算是数据科学,以是你乃至不必进修 Python,行使 Tableau 都行,他们宣称行使他们的产物就可以「成为数据科学家」。

Q:好吧,但数据科学应该不只仅是建造出大度的可视化图表,Excel 中都可以做到,其它进修编程应该很有效,汇报我一些 Python 方面的常识吧

A:进修 Python,你必要进修一些库,好比用于操纵 DataFrame 的 Pandas 、建造图表的 Matplotlib,现实上更好的选择是 Plotly,它用了 d3.js。

Q:我能懂一些,但什么是 DataFrame?

A:它是一种有行和列的数据布局,相同 Excel 表,行使它可以实现很酷的转换、透视和聚合等成果。

Q:那 Python 与 Excel 有什么差异?

A:大不沟通,你可以在 Jupyter Notebook 中完成全部操纵,慢慢完成每个数据说明阶段并可视化,就像你正在建设一个可以与他人分享的故事。事实,雷同和讲故事是数据科学的重要构成部门。

Q:这听起来和 PowerPoint 没什么区别啊?

A:虽然有区别,Jupyter Notebook 更自动简捷,可以轻松追溯每个说明步调。有些人不太喜好它,由于代码不是很适用。假如你想做一款软件产物,更好的要领是行使其他器材模块化封装代码。

Q:那么数据科学跟软件工程也有相关么?

A:也可以这么说,但不要走偏,进修数据科学最必要的是数据。初学的最佳方法是收集爬虫,抓取一些网页,行使 Beautiful Soup 理会它天生大量非布局化文本数据下载到电脑上。

Q:我觉得进修数据科学是做表格查询而不是网页抓取的事变,以是我刚学完一本 SQL 的书,SQL 不是会见数据的典范方法吗?

A:好吧,我们可以行使非布局化文本数据做许多很酷的工作。好比对交际媒体帖子上的情感举办分类或举办天然说话处理赏罚。NoSQL 很是善于存储这种范例的数据。

Q:我传闻过 NoSQL 这个词,跟 SQL 、大数据有什么相关?

A:大数据是 2016 年的观念,已经有点过期了,此刻大大都人不再行使这个术语。NoSQL 是大数据的产品,本日成长成为了像 MongoDB 一样的平台。

Q:好的,但为什么称它为 NoSQL?

A:NoSQL 代表不只是 SQL,它支持副黄?之外的数据布局,不外 NoSQL 数据库凡是不行使 SQL,有专门的查询说话,简朴比拟一下 MongoDB 和 SQL 查询说话:

2019 年,Python 数据科学该怎么学

Q:这太可骇了,你意思是每个 NoSQL 平台都有本身的查询说话?SQL 有什么题目?

A:SQL 没有任何题目,它很有代价。不外这几年非布局化数据是高潮,用它来做说明更轻易。需夸大的是,尽量SQL 难学,但它是一种很是通用的说话。

Q:好的,我可以这样领略么: NoSQL 对数据科学家来说不像 SQL 那么重要,除非事变中必要它?

A:差不多,除非你想成为一名数据工程师。

Q:数据工程师?

(编辑:河北网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读