行业报告 AI展会 数据标注 标注供求
数据标注数据集
主页 > 数据挖掘 正文

使用Python来学习数据科学的完整教程

大数据

我在SAS工作了5年多之后,决定走出舒适区。作为一名数据科学家,我在寻找其他好用的工具,幸运的是,没过多久,我发现了Python。

一直以来,我喜欢敲代码。事实证明,有了Python,敲代码变得更为容易。

我花了一周时间来学习Python的基础知识,从那时起,我不仅深入钻研Python,而且还帮助许多其他人学习这门语言。起初,Python是门通用语言,多年来,随着社区的大力支持,现在有了数据分析及预测建模库。

由于缺少Python数据科学资源,我决定创建本教程,旨在帮助大家快速入门。在本教程中,我们将讨论如何使用Python来进行数据分析,在实践中总结方法。

Python数据分析基础

为什么要学习使用Python来进行数据分析?

使用Python来进行数据分析的原因有很多,过去一段时间通过对比SAS和R,有以下几点理由:

  • 开源免费
  • 强大社区支持
  • 易学
  • 成为数据科学和web产品分析的通用语言

诚然,它还有很多缺点:

Python是一种解释语言而不是编译语言,因此占用更多的CPU时间。然而,由于节省了程序员时间(易学),Python仍然是一个不错的选择。

Python 2.7与3.4版本的比较

这是Python中最受争议的话题之一,作为初学者,你绕不开这个问题。其实选择哪个版本都没有对错,完全取决于你的需要和实际使用场景。我会尝试给大家一些指引,帮助大家做出明智的选择。

为什么选择Python 2.7?

社区支持,这是早期需要的,Python 2版本在2000年下半年发布,超过15年的使用了。

第三方库支持,虽然许多库提供3.X的支持,但仍然有大量库只能在2.X版本上运行。如果你打算将Python用于特定的场景,如网页开发,高度依赖外部模块,你可能选择2.7版本会更好。

3.X版本的一些功能向后兼容,可以使用2.7版本。

为什么选择Python 3.4?

简洁快速,Python开发人员已经修复了一些自身的Bug,为其发展打下更坚实的基础。最初这些可能与你不是很相关,终将是很重要的。

未来趋势,2.7版本是2.X系列的最后一个版本,最终大家都必须转到3.X版本。Python 3已经发布了5年的稳定版本,并将持续推进。

没有明确显示到底谁好,但我认为最重要的是大家应该专注于将Python当作一门语言来学习。版本之间的转换是一个时间的问题。迟点,继续关注Python 2.X与3.X比较的文章。

如何安装Python?

有两种安装Python的方法:

你可以直接在官网上下载Python,并安装所需要的组件和库。

或者,你可以下载安装预装库的软件包,我建议你下载Anaconda,另外可以是Canopy Express。

第二种方法免去安装其他库的麻烦,因此我会推荐给初学者。如果你对单个库的最新版本感兴趣,你必须等到整个软件包的更新。除非你在做前沿的统计研究,否则应该没有什么影响。

选择开发环境

一旦安装了Python,就有各种各样的开发环境,以下是常见的3种:

  • Terminal / Shell
  • IDLE (默认)
  • iPython notebook(类似R中的markdown)

大数据

正确的开发环境取决于你的需要,我个人更喜欢iPython Notebook。它有很多好的功能,编写代码时提供了文档记录功能,可以选择运行代码块(而不是逐行执行)。

我们将使用iPython开发环境完成本教程。

预热:运行你的第一个Python程序

你可以使用Python作为简单的计算器开始

大数据

提醒几点

你可以在terminal / cmd上输入“ipython notebook”来启动iPython Notebook,这取决于你正在使用的操作系统。

可以通过点击“UntitledO”来重命名。

界面显示In [*]表示输入,Out[*]表示输出。

执行当前代码块按快捷键“Shift + Enter”,运行当前块并插入额外的块按快捷键“ALT + Enter”。

在深入解决问题之前,让我们回顾一下,了解Python的基础知识。 我们知道数据结构、迭代和条件结构构成任何语言的关键。 在Python中,这些包括列表,字符串,元组,字典,for循环,while循环,if-else等。我们来看看其中的一些。

微信公众号

声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。

网友评论:

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
最新文章
SEM推广服务
热门文章
热点图文

Copyright©2005-2028 Sykv.com 可思数据 版权所有    京ICP备14056871号

关于我们   免责声明   广告合作   版权声明   联系我们   原创投稿   网站地图  

可思数据 数据标注

扫码入群
扫码关注

微信公众号

返回顶部