数据挖掘
-
关于数据湖架构、战略和分析的8大错误认知
本文的目的是构建数据湖,并提供适应企业数据策略的背景信息。 咨询公司和提供商提出的意见相互矛盾,因此,这些信息历来一直不透明...
2019-08-07 16:09:55 -
Hadoop时代正式终结? HPE 宣布收购 MapR!
美国当地时间2019年8月5日,惠普企业(Hewlett Packard Enterprises,纽约证券交易所股票代码:HPE)宣布收购 MapR Technologies Inc 的业务资产!...
2019-08-07 16:09:38 -
比Spark快100倍的GPU加速SQL引擎:BlazingSQL开源了
BlazingSQL 是基于英伟达 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎,可以为各种 ETL 大数据集提供 SQL 接口,并且完全运行在 GPU 之上。近日,其研...
2019-08-07 16:08:46 -
京东城市6篇论文被KDD2019收录,展示AI和大数据在
本文将分享这6篇关于物流人力资源调度、城市细粒度人流量推测、城市交通预测、轨迹数据版权保护、城市的地块表征学习、天气预报精准...
2019-08-07 16:04:26 -
书单推荐:六本好书带你入门数据科学
与一些数据科学家可能希望相信的相反,我们永远不可能将世界简化为数字和算法。归根结底,决策是由人类做出的,想要成为一名专业的...
2019-08-06 23:00:49 -
最终,MapR难以为继,将资产出售给惠普企业
MapR 正在向惠普企业出售其资产,这标志着筹集了 2 8 亿美元的这家大数据公司最终仍然难以走下去。...
2019-08-06 23:00:36 -
百度内部学习PPT:数据分析的道与术!
这是一份来自百度内部的数据分析学习PPT,非常经典的入门教材。...
2019-08-06 23:00:17 -
简述Hadoop之后大数据的未来在谁的身上
在实时数据世界里,为什么我们还这么执着于Hadoop? 根据451 Research调查数据显示,围绕批处理架构的Hadoop仍然是大数据的代表技术,尽管其声...
2019-08-06 22:57:00 -
Hadoop YARN:调度性能优化实践
背景YARN 作为 Hadoop 的资源管理系统,负责 Hadoop 集群上计算资源的管理和作业调度。美团的 YARN 以社区 2 7 1 版本为基础构建...
2019-08-06 22:49:51 -
数据分析有哪些好书值得推荐?
假期除了吃喝玩乐,还可以利用碎片化时间看看书,让自己的人生更美好。在知识的海洋里,一次小小的偶遇,可能就是你苦候良久的邂逅...
2019-08-06 22:49:33 -
数据分析有哪些好书值得推荐?
1、统计学书单 如果你打开招聘的职位要求,都会要求具有统计学的知识,这是因为统计学是数据分析、机器学习的基础知识,是必须要学习...
2019-08-05 23:20:28 -
Tensorflow 2.0 到底好在哪里?
TensorFlow 现在已经不仅是一个单纯的工具包了,而是发展成为了一个平台,在易用性、分布式训练和部署等方面都取得了长足的进步。...
2019-08-05 18:49:54 -
对比了Python、Go和Rust之后,他得出了这个结论
本文主要是从 Python 开发者的角度基于开发工效学对这三种语言进行的一个比较,你可以跳过讨论部分,直接查看代码示例、性能比较、主要...
2019-08-05 18:49:14 -
数据湖:下一代企业数据仓库
这种趋势是从 10 年前“Applicance Form Factor”成为数据仓库主流开始。几年前,随着市场转向新一代的云数据仓库,这种势头进一步获得了新的...
2019-08-05 18:48:34 -
成为卓越数据科学家必备的 13 项技能
一周前,我在 LinkedIn 上问了一个问题:优秀的数据科学家与卓越的数据科学家之间的区别是什么? 令人惊讶的是,我得到了来自各行各业的...
2019-08-05 18:48:18 -
Gartner:未来 3-5 年,数据分析领域不可错过的技
Gartner 发布的这十大趋势是最近 3-5 年企业可以应用的技术,而非十年以外的技术趋势。...
2019-08-05 18:47:30 -
从道德层面看基于云的数据科学
在拥抱大数据,机器学习,预测分析和无限数据访问的同时,我们如何避免其中潜在的伤害?...
2019-08-05 18:25:40 -
超越云计算:对数据库管理系统未来的思考
Gartner 最近发表的一篇博文,引起了我们 Altinity 的注意。标题是《数据库管理系统的未来就是云计算!》( The Future of Database Management Systems i...
2019-08-03 17:31:26 -
Python小技巧:3个处理文件路径的简单方法
几乎所有计算机在文件夹名称间使用的都是正斜杠,但微软Windows使用的是却反斜杠, 这不免造成了编程的一个小烦恼。...
2019-08-03 17:30:43 -
这些年,我们一起追过的缓存数据库
在互联网高速发展、快速演化的时代,想必在你的系统架构设计中,缓存服务是不是已经成为必不可少的一层,丰富的数据结构、高性能的...
2019-08-03 17:29:21 -
六种常用的微服务架构设计模式
简单地说,API主导的连接方法可以被看作是API设计的一种分层方法(至少在本文中是这样)。...
2019-08-03 17:08:55 -
前端必看的数据可视化入门指南
这是一篇给大家提供数据可视化开发的入门指南,介绍了可视化要解决的问题和可以直接使用的工具,我将从下面几个方面给大家介绍,同...
2019-08-02 09:39:44 -
深入浅出百亿请求高可用Redis(codis)分布式集群揭秘
一、背景 随着直播元年开启,越来越多的直播产品如春笋般出现,在拉动营收的过程中,产品竭尽全力思考着各种活动来刺激用户的消费欲...
2019-08-02 00:54:06 -
SaaS、PaaS与IaaS的市场趋势
人们可以比较三种服务云计算服务,软件即服务(SaaS),平台即服务(PaaS)和基础架构即服务(IaaS)的基本模式。每种型号都有自己的优势,需要...
2019-08-02 00:51:45 -
猜你不知道Spring Boot的几种部署方式
引言 本文主要讲的是spring boot的五种部署方式,里面是否有你不知道的呢,如果有欢迎评论留言哦,一起交流探讨哦!!! 可以使用各种方法将...
2019-08-02 00:45:21 -
Python对接六大主流数据库,只需三步
作为近两年来最火的编程语言的python,受到广大程序员的追捧必然是有其原因的,如果要挑出几点来讲的话,第一条那就python语法简洁,易上...
2019-08-02 00:31:48 -
Dice 称这 5 种编程语言可能衰落
根据Dice报道,并不是所有的编程语言都永远存在,因为新一代的开发人员会接受他们觉得更容易使用的其他语言和框架。为了确定哪种编程...
2019-08-02 00:30:27 -
Python爬虫很强大,在爬虫里如何自动操控浏览器呢?
概述: python通过selenium爬取数据是很多突破封锁的有效途径。但在使用selenium中会遇到很多问题,本文就通过一问一答的形式来通熟易懂的普...
2019-08-02 00:28:50 -
学机器学习要选择 Python 的13个原因
Python程序语言与机器学习实践可以称得上是珠联璧合。 1. Python是解释语言,程序写起来非常方便 写程序方便对做机器学习的人很重要。 因...
2019-08-02 00:03:45 -
数据科学家需要了解的5种采样方法
笔者按,采样问题是数据科学中的常见问题,对此,WalmartLabs 的数据科学家 Rahul Agarwal 分享了数据科学家需要了解的 5 种采样方法,雷锋网...
2019-08-02 00:01:24 -
欲做图数据领域的Oracle 费马科技有啥过人之处?
数据,无疑是企业重要的资产之一。随着大数据的到来,丰富的数据格式以及数据量几何式的增长,给企业带来了巨大压力。如何将数据有...
2019-08-01 23:47:42 -
我们是如何删除 PB 级重复数据的?
Mixpanel 通过网络从移动端、浏览器端和服务器端的客户接入了千万亿字节的事件数据。...
2019-08-01 22:34:36 -
再见 Excel!我开源了一款与Python深度集成的神器
这是一款与 Python 深度集成、基于 Web 开发、无需在各个工具之间切换、适用大部分职业工作场景的开源电子表格应用程序。对它的评价只有...
2019-08-01 22:34:01 -
31个惊艳的数据可视化作品,让你感受“数据之美
在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数...
2019-08-01 22:31:39 -
140种Python标准库、第三方库和外部工具都有了
Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方...
2019-08-01 22:30:50