数据挖掘
-
我们需要给AI减轻负担,关于Python五大AI库推荐
以下这五大Python库可帮助加快数据管道,例如,使用AWS Lambda可对计算量较大的作业进行碎片处理,使用TensorFlow模型可减轻TensorFlow的负载。...
2018-10-09 22:54:25 -
基于Hadoop的数据仓库Hive 基础知识
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–...
2018-10-09 22:54:25 -
美观又实用,10款强大的开源Javascript图表库
随着发展,现代 Web 设计在改善体验和功能的同时,对于美观的追求也越来越高,可视化、交互式、动态等元素和效果似乎已成为标配。...
2018-10-09 22:54:25 -
6 个值得好好学习的 JavaScript 框架
常言道,条条大路通罗马,可是那一条适合我呢? 由于用于构建前端页面等现代技术的出现,JavaScript 在 Web 开发社区早已是如雷贯耳。通过...
2018-10-09 22:54:25 -
【技术】大数据、机器学习和深度学习类命令行
在 OSX 和 LInux 上无需使用鼠标或 GUI ,也可以完成大量的操作。极具人气的面向各类 N X系统的命令行工具目前已经扩展至Python、Go、NodeJS 乃...
2018-10-09 22:54:25 -
Python中防止sql注入的具体方法以及详细解答
大家应该都知道现在web漏洞之首莫过于sql了,不管使用哪种语言进行web后端开发,只要使用了关系型数据库,可能都会遇到sql注入攻击问题...
2018-10-09 22:54:25 -
从PyTorch到Mxnet ,对比7大Python深度学习框架
选择什么深度学习框架一直是开发者非常关心的一个话题,而且深度学习框架之间的「战争」也越来越激烈。过去一段时间,机器之心发过...
2018-10-09 22:54:25 -
Apache HBase 入门
Quickstart 将使您运行一个单节点,独立的 HBase 实例。...
2018-10-09 22:54:25 -
Python中Requests库的高级用法
前面讲了Python的urllib库的使用和方法,Python网络数据采集Urllib库的基本使用 ,Python的urllib高级用法 。...
2018-10-09 22:54:25 -
JavaScript 与 Java、PHP 的比较
网站开发的实践从设计方面开始,包括客户端编程语言。大体上说,在网页设计中使用了三种语言:HTML,CSS和JavaScript。自从网站发明以来,...
2018-10-09 22:54:25 -
Google的软件工程经验总结
Google 使用分布式编译系统,叫做 Blaze。Blaze 提供了标准的命令,用于编译和测试库中的所有代码。Blaze 这种统一的编译工具,让 Google 公司...
2018-10-09 22:54:25 -
淘宝大牛教你零基础写PHP扩展 无需天天写表单
如果你已经熟悉了数据集和服务器端的优化,不妨试试通过PHP扩展向系统层进军。当原有的PHP代码实现出现性能瓶颈,可以考虑通过PHP扩展...
2018-10-09 22:54:25 -
技术解析| Hive源码编译及阅读修改调试
Hive起完全分布式的MR任务也可追踪,但是需要修改节点机上的MR启动时Java参数,而且Hive起一个MR任务时,只有当MR启动后才能知道哪个节点机...
2018-10-09 22:52:56 -
Python vs R : 在机器学习和数据分析领域中的对比
为了鼓励新工具的出现,机器学习和数据分析领域似乎已经成了“开源”的天下。Python 和 R 语言都具有健全的生态系统,其中包括了很多开...
2018-10-09 22:52:56 -
BigDL:运行于Spark集群上的分布式深度学习库
Intel开源了基于Apache Spark的分布式深度学习框架BigDL。BigDL借助现有的Spark集群来运行深度学习计算,并简化存储在Hadoop中的大数据集的数据加...
2018-10-09 22:52:56 -
有没有将深度学习融入机器人领域的新尝试?
现在深度学习这么火,大家都会想着看看能不能用到自己的研究领域里。所以,将深度学习融入到机器人领域的尝试也是有的。我就自己了...
2018-10-09 22:52:56 -
Hadoop环境中管理大数据存储八大技巧
随着IT互联网信息技术的飞速发展和进步。目前大数据行业也越来越火爆,从而导致国内大数据人才也极度缺乏,下面介绍一下关于Hadoop环境...
2018-10-09 22:52:56 -
谁说人工智能必须要大数据?斯坦福大学开发出的
深度学习算法的能力是惊人的,从识别猫和狗,到识别医学图像中的结节,算法的表现已经超越了人类,但是这些算法模型需要大量的数据...
2018-10-09 22:52:56 -
未来三年,人工智能将成为银行与客户交流的主
近期,埃森哲咨询公司调查四分之三的银行家,并撰写了一份报告,报告显示,在未来三年内,人工智能(AI)将成为银行与客户交流的主要方...
2018-10-09 22:52:56 -
python爬虫入门的基本知识
我们浏览网页的浏览器和手机应用客户端与服务器通信几乎都是基于HTTP协议,而爬虫可以看作是一个另类的客户端,它把自己伪装成浏览器...
2018-10-09 22:52:56 -
全栈必备 面向数据的架构
数据是系统的核心,在面向服务的架构之外,可以考虑面向数据的架构方式。面向数据的服务架构需要支持多数据源异构,支持动态数据和...
2018-10-09 22:52:56 -
Spark:超越Hadoop MapReduce
大数据对一些数据科学团队来说是 主要的挑战,因为在要求的可扩展性方面单机没有能力和容量来运行大规模数据处 理。此外,即使专为大...
2018-10-09 22:52:56 -
主流开源SQL引擎总结,不断改进的Hive始终遥遥领
本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calcite、Kylin、Phoenix、Tajo 和Trafodion。以及2个商业化选择Oracle...
2018-10-09 22:52:56 -
Spark名词解释及关系
随着对spark的业务更深入,对spark的了解也越多,然而目前还处于知道的越多,不知道的更多阶段,当然这也是成长最快的阶段。这篇文章用...
2018-10-09 22:52:56 -
进行数据挖掘的 8 个最佳开源工具
数据挖掘,又称为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,是一个挖掘和分析...
2018-10-09 22:52:56 -
Spark:超越Hadoop MapReduce
和 Hadoop 一样,Spark 提供了一个 Map Reduce API(分布式计算)和分布式存储。二者主要的不同点是,Spark 在集群的内存中保存数据,而 Hadoop 在集...
2018-10-09 22:52:56 -
Python vs R : 在机器学习和数据分析领域中的对比
为了鼓励新工具的出现,机器学习和数据分析领域似乎已经成了 “开源” 的天下。Python 和 R 语言都具有健全的生态系统,其中包括了很多...
2018-10-09 22:52:56 -
三张图读懂机器学习:基本概念、五大流派与九
机器学习正在进步,我们似乎正在不断接近我们心中的人工智能目标。语音识别、图像检测、机器翻译、风格迁移等技术已经在我们的实际...
2018-10-09 22:52:56 -
BAT正大举向海外扩张,英国媒体是咋看的?
4月24日消息 据《经济学人》报道,曾经,由于惯于关门复制西方产品,中国的大互联网公司被硅谷投资者视为边缘企业。曾几何时,形势发...
2018-10-09 22:52:56 -
如何用PyTorch实现递归神经网络?
PyTorch 是 Facebook AI Research 和其它几个实验室的开发人员的成果,该框架结合了 Torch7 高效灵活的 GPU 加速后端库与直观的 Python 前端,它的特...
2018-10-09 22:52:56 -
盘点| 12大领域的133家人工智能企业
本文提供了 133 家人工智能企业,其中既有科技巨头又有新兴初创公司。本文希望能按类别给读者提供一个全面的视角来了解人工智能企业。...
2018-10-09 22:52:56 -
大规模爬虫流程总结
爬虫是一个比较容易上手的技术,也许花5分钟看一篇文档就能爬取单个网页上的数据。但对于大规模爬虫,完全就是另一回事,并不是1*n这...
2018-10-09 22:52:56 -
使用Scrapy框架时 普通反爬虫机制的应对策略
简单低级的爬虫速度快,伪装度低,如果没有反爬机制,它们可以很快的抓取大量数据,甚至因为请求过多,造成服务器不能正常工作。而...
2018-10-09 22:52:56 -
干货|Kafka在大数据环境中的应用
我们生活在一个数据爆炸的时代,数据的巨量增长给我们的业务处理带来了压力,同时巨量的数据也给我们带来了十分可观的财富。...
2018-10-09 22:52:56 -
大数据技术| Python程序中不同的重启机制
接下来我们看看Gunicorn的重启机制:信号实质上挂在在Arbiter上,Arbiter相当于master,守护和管理worker的,管理各种信号,事实上它init的时候就...
2018-10-09 22:52:56