数据挖掘
-
15000个Python开源项目中精选Top30!
本文基于项目质量、用户参与度以及其他因素为你列出Python开源项目Top 30。...
2019-02-20 18:33:39 -
对恒星进行数据挖掘:改变天文学的虚拟化望远
斯隆数字巡天计划生成的超过15TB的可查询数据使天文学家能够在研究项目上少花数年的时间。...
2019-02-17 13:19:00 -
太厉害了:居然有人将各大编程语言绘成了一部
代码是一门语言,这门语言搭建了人与计算机沟通的桥梁。通过编写代码,人类可以“命令”计算机开发网页、开发软件、搭建游戏... ......
2019-02-17 13:16:01 -
大数据生态之zookeeper(原理)
根据启动的顺序和id进行选主(过半机制:集群中超过半数的集群可使用时,才开始选主)...
2019-02-16 23:13:19 -
TensorFlow object_detect 修改配置文件进行数据增强处
数据增强处理可以用于图像数据集不够充分的情况下对各个类别图像进行数据扩充,以此弥补因图像数据量不足以及图像单一所造成训练后...
2019-02-16 23:13:07 -
苏宁大数据离线任务开发调度平台实践:任务调
作为国内最大的电商平台之一,苏宁每天要处理数量巨大的数据。为了更快速高效地处理这些数据,苏宁调度平台采取了哪些措施呢?...
2019-02-15 23:19:13 -
美图大数据平台架构实践
如今大数据在各行业的应用越来越广泛:运营基于数据关注运营效果,产品基于数据分析关注转化率情况,开发基于数据衡量系统优化效果...
2019-02-15 23:15:23 -
原生分布式数据库与中间件的区别
本文将从数据可靠性、副本同步和服务可用性等几个方面进行分析,对比两种方案的区别。...
2019-02-15 23:15:05 -
杰出数据科学家的关键技能是什么?
尝试创建基于事务的机器学习模型是行不通的,除非你希望对某一项事务进行预测。数据科学家工作时通常需要基于数据分析。那么,究竟...
2019-02-15 23:14:15 -
四说大数据时代“神话”:从大数据到深数据
实际上,与数据的规模相比,数据的质量、价值和多样性更值得关注,即数据的“深度”重于“广度”。本文从四个角度思考了大数据时代...
2019-02-15 23:13:24 -
中了数据可视化的毒:BBC如何使用R语言绘制数据
生动的图表能极大地帮助呈现更有信息量的新闻。BBC(英国广播公司)近日分享了他们的视觉与数据新闻团队使用 R 语言绘制新闻图表的经验。...
2019-02-15 23:13:05 -
2018年最具影响力的20篇数据科学研究论文,盘它
在这篇文章中,Daniel Gutierrez列出了2018年最具影响力的20篇数据科学研究论文清单,所有数据科学家都应该认真回顾。...
2019-01-31 23:52:51 -
解析:跻身数据科学领域的五条职业规划道路
最近有许多人联系我(大部分都是通过领英)寻求着手数据科学和/或大数据的建议。这些人普遍对切入这个“领域”感兴趣,并且需要些关于...
2019-01-30 18:00:13 -
四种大数据分析方法与大家分享
本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析、诊断型分析、预测型分析和指令型分析。当刚涉足数据挖掘...
2019-01-30 17:59:36 -
如何选择异地数据备份的方法
弄清楚如何将数据移动到备份设施,以何种形式以及决定该设施应该位于何处往往意味着需要在成本,风险等级,恢复丢失数据的速度以及...
2019-01-30 17:58:11 -
Splunk公司:为亚太地区企业挖掘数据价值
Splunk公司也许是唯一一家和谷歌一样,名称可用作动词且可用于定义对用户价值的技术公司。Splunk公司的名称是关于探索数据价值(splunki...
2019-01-30 17:53:11 -
Kaggle调查:2018年数据科学家最常用(和最推荐)的编程语言
数据科学的实践需要使用分析工具,技术和编程语言来帮助数据专业人员从数据中提取见解和价值。...
2019-01-30 17:52:41 -
11万份测试告诉你,今年该学什么编程技能才能找
Devskiller 近期发布了一份关于全球技术招聘和技能的年度分析报告,总结了 2018 年技术人员招聘的相关信息,尤其是开发者就业数据。...
2019-01-30 00:11:14 -
pandas指南:做更高效的数据科学家
Python是开源的,所以有很多开源固有的问题。如果你是Python新手,很难知道针对特定任务的包哪个是最好的。你需要有经验的人来告诉你。...
2019-01-26 11:46:12 -
谷歌首席决策科学家:30篇文章通关数据科学与人
谷歌首席决策科学家(Chief Decision Scientis)凯西柯兹科夫(Cassie Kozyrkov)在2018年非常高产,为大家写了非常多关于人工智能、大数据的文章。...
2019-01-26 11:41:52 -
开源 Pravega 架构解析:如何通过分层解决流存储
当前的大数据处理系统无论是何种架构都面临一个共同的问题,即:“计算是原生的流计算,而存储却不是原生的流存储” 。...
2019-01-26 11:37:57 -
四年 C++ 老炮,转攻 Python 实践分享
C++ 已经学不动了,现在换 Python 还来得及吗?一位四年工作经验的 C++ 程序员亲述转型历程,这不仅仅是语言上的转变,而是代码思维甚至工...
2019-01-24 21:03:04 -
如果你想学数据科学,这 7 类资源千万不能错过
有时你只需要知道如何开始即可,以下是那些适用于我的经验。...
2019-01-24 21:01:13 -
入门必看 | 大佬们推荐的Python书单汇总
此文主要针对想入门 Python 但不知道看什么书好和有选择纠结症的童鞋,大佬们可绕道。...
2019-01-24 21:00:49 -
如何使用 Druid 和 Kafka 构造 Kappa 架构完成流量分
何互联网主干的核心活动之一都是流量分析,它支持对许多技术方面 (容量规划、流量工程等)、经济方面 (资源优化、收入泄漏检测等) 和安...
2019-01-24 20:59:26 -
Spark SQL | Spark,从入门到精通
Spark SQL 在 Hive 兼容层面仅依赖 HQL parser、Hive Metastore 和 Hive SerDe。也就是说,从 HQL 被解析成抽象语法树(AST)起,就全部由 Spark SQL 接管了。...
2019-01-24 20:58:43 -
推荐:2019年十佳DevOps工具
DevOps落地重要的一方面是选好工具集,本文介绍了最流行的DevOps工具。...
2019-01-22 23:54:43 -
短视频时代,LinkedIn 如何利用数据提高视频性能
在 LinkedIn,我们使用数据来改善会员在使用我们网站时的体验。在视频团队中,我们看重的指标是我们的视频需要多长时间加载、为什么某...
2019-01-22 23:43:37 -
用可视化解构BERT,我们从上亿参数中提取出了
本文作者Jesse Vig通过可视化工具对此进行了非常有意义的探究。文章分两部分,第一部分介绍bert中的6种模式,第二部分介绍其底层细节。...
2019-01-22 23:42:07 -
针对WebView测试的五种Python框架
本文将和您讨论针对混合应用(如WebView)测试的五种Python框架,及其各自的特点。...
2019-01-22 23:19:28 -
为了使用好 Apache Flink,Yelp 实现了一个连接算法
摘要在 Yelp,我们生成了大量高吞吐量的数据流,包括日志、业务数据和应用程序数据。我们需要对这些数据流进行连接、过滤、聚合,有时...
2019-01-20 01:33:40 -
如何从C++转Python:改变你的思维方式
有人说用 Python 编程很简单,6 岁小孩都能学会。计算机视觉专家和编程语言爱好者 asya f 刚开始上手 Python 时也这么想。但门槛低就仅意味着...
2019-01-19 00:16:15 -
数据分析惯用的5种思维方法
在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式,可以用...
2019-01-17 22:38:15 -
数据结构与算法必备书单,我们都帮你整理好了
“算法,先于计算机存在于世,比编程语言本身更为重要。语言只是工具,算法才是灵魂。”这是云风在《游戏之旅:我的编程感悟》这本...
2019-01-17 22:37:26 -
数据科学中最好用的Python IDE是什么?
KDnuggets最近的一个博客发起了一项投票:数据科学中最好用的Python IDE是什么?该投票发布后收到了很多意见和评论。...
2019-01-16 22:56:23