使用Python来学习数据科学的完整教程
我在SAS工作了5年多之后,决定走出舒适区。作为一名数据科学家,我在寻找其他好用的工具,幸运的是,没过多久,我发现了Python。
一直以来,我喜欢敲代码。事实证明,有了Python,敲代码变得更为容易。
我花了一周时间来学习Python的基础知识,从那时起,我不仅深入钻研Python,而且还帮助许多其他人学习这门语言。起初,Python是门通用语言,多年来,随着社区的大力支持,现在有了数据分析及预测建模库。
由于缺少Python数据科学资源,我决定创建本教程,旨在帮助大家快速入门。在本教程中,我们将讨论如何使用Python来进行数据分析,在实践中总结方法。
Python数据分析基础
为什么要学习使用Python来进行数据分析?
使用Python来进行数据分析的原因有很多,过去一段时间通过对比SAS和R,有以下几点理由:
- 开源免费
- 强大社区支持
- 易学
- 成为数据科学和web产品分析的通用语言
诚然,它还有很多缺点:
Python是一种解释语言而不是编译语言,因此占用更多的CPU时间。然而,由于节省了程序员时间(易学),Python仍然是一个不错的选择。
Python 2.7与3.4版本的比较
这是Python中最受争议的话题之一,作为初学者,你绕不开这个问题。其实选择哪个版本都没有对错,完全取决于你的需要和实际使用场景。我会尝试给大家一些指引,帮助大家做出明智的选择。
为什么选择Python 2.7?
社区支持,这是早期需要的,Python 2版本在2000年下半年发布,超过15年的使用了。
第三方库支持,虽然许多库提供3.X的支持,但仍然有大量库只能在2.X版本上运行。如果你打算将Python用于特定的场景,如网页开发,高度依赖外部模块,你可能选择2.7版本会更好。
3.X版本的一些功能向后兼容,可以使用2.7版本。
为什么选择Python 3.4?
简洁快速,Python开发人员已经修复了一些自身的Bug,为其发展打下更坚实的基础。最初这些可能与你不是很相关,终将是很重要的。
未来趋势,2.7版本是2.X系列的最后一个版本,最终大家都必须转到3.X版本。Python 3已经发布了5年的稳定版本,并将持续推进。
没有明确显示到底谁好,但我认为最重要的是大家应该专注于将Python当作一门语言来学习。版本之间的转换是一个时间的问题。迟点,继续关注Python 2.X与3.X比较的文章。
如何安装Python?
有两种安装Python的方法:
你可以直接在官网上下载Python,并安装所需要的组件和库。
或者,你可以下载安装预装库的软件包,我建议你下载Anaconda,另外可以是Canopy Express。
第二种方法免去安装其他库的麻烦,因此我会推荐给初学者。如果你对单个库的最新版本感兴趣,你必须等到整个软件包的更新。除非你在做前沿的统计研究,否则应该没有什么影响。
选择开发环境
一旦安装了Python,就有各种各样的开发环境,以下是常见的3种:
- Terminal / Shell
- IDLE (默认)
- iPython notebook(类似R中的markdown)
正确的开发环境取决于你的需要,我个人更喜欢iPython Notebook。它有很多好的功能,编写代码时提供了文档记录功能,可以选择运行代码块(而不是逐行执行)。
我们将使用iPython开发环境完成本教程。
预热:运行你的第一个Python程序
你可以使用Python作为简单的计算器开始
提醒几点
你可以在terminal / cmd上输入“ipython notebook”来启动iPython Notebook,这取决于你正在使用的操作系统。
可以通过点击“UntitledO”来重命名。
界面显示In [*]表示输入,Out[*]表示输出。
执行当前代码块按快捷键“Shift + Enter”,运行当前块并插入额外的块按快捷键“ALT + Enter”。
在深入解决问题之前,让我们回顾一下,了解Python的基础知识。 我们知道数据结构、迭代和条件结构构成任何语言的关键。 在Python中,这些包括列表,字符串,元组,字典,for循环,while循环,if-else等。我们来看看其中的一些。
时间:2018-10-09 22:49 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
- [数据挖掘]底层I/O性能大PK:Python/Java被碾压,Rust有望取代
- [数据挖掘]RedMonk语言排行:Python力压Java,Ruby持续下滑
- [数据挖掘]不得了!Python 又爆出重大 Bug~
- [数据挖掘]TIOBE 1 月榜单:Python年度语言四连冠,C 语言再次
- [数据挖掘]TIOBE12月榜单:Java重回第二,Python有望四连冠年度
- [数据挖掘]这个可能打败Python的编程语言,正在征服科学界
- [数据挖掘]2021年编程语言趋势预测:Python和JavaScript仍火热,
- [数据挖掘]Spark 3.0重磅发布!开发近两年,流、Python、SQL重
- [数据挖掘]Python 为什么推荐蛇形命名法?
- [数据挖掘]Python才是世界上最好的语言
相关推荐:
网友评论: