数据挖掘
-
Hive和Spark究竟是凭借什么优势而大获成功?
Hive和Spark凭借其在处理大规模数据方面的优势大获成功,换句话说,它们是做大数据分析的。本文重点阐述这两种产品的发展史和各种特性...
2019-08-29 22:21:32 -
6个用于大数据分析的优秀工具
大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或E...
2019-08-27 16:01:55 -
大数据需求使用的六个Hadoop发行版
Apache Hadoop是一个出色的软件框架,允许处理大数据元素。它可以通过采用模块化系统和处理大量数据来使用商用硬件的强大功能。Hadoop可以...
2019-08-27 16:00:34 -
Hive和Spark究竟是凭借什么优势而大获成功
Hive和Spark凭借其在处理大规模数据方面的优势大获成功,换句话说,它们是做大数据分析的。本文重点阐述这两种产品的发展史和各种特性...
2019-08-27 15:59:17 -
不要做中台!不要做!不要……要
最近中台太火了。突然火的事情一定不冷静,我来灭灭火。感谢资本寒冬。没有资本的添薪加油,它还没火成当年的云计算、大数据、O2O、...
2019-08-27 13:07:00 -
通过 Lisp 语言理解编程算法:数据结构篇
在接下来的几章中,我们将描述每种编程语言提供的基本数据结构、它们的用法以及与之相关的最重要算法。我们将从数据结构和元组或结...
2019-08-27 13:06:39 -
Hadoop 迎来 3.x 时代,昔日大数据霸主如何应对云
本文将按照存储和计算两个方向,分别介绍 Hadoop 社区当前的热点话题及后续规划。本文整理自堵俊平、谭望达近日在 Apache Hadoop 技术社区中...
2019-08-27 13:06:20 -
数据科学中的强大思维
如果你参加过统计学入门课程,就会知道数据点可以用来激发灵感,也可以用来测试理论,但两者却不能兼顾,这是为什么呢?...
2019-08-27 13:05:59 -
Python 初学者常犯的5个错误,布尔型竟是整型的子
Python 是一种神奇的语言,看似简单便捷,但总会有一些意想不到的惊喜在等着我们。比如说,assert 在正式环境下根本不会运行,isinstance(...
2019-08-27 13:05:35 -
数据科学的5个陷阱与缺陷
从“数据说话”,”DT 时代”,到 “数据中台”,“数据驱动(Data Drive Data Driven)”,数据体系的不断演进正在持续的改变大家的工作与决策...
2019-08-27 12:51:47 -
使用 Visual Studio 和 python 设置自己的数据科学工作
新手在刚刚开始数据科学的学习时会遇到很多问题,而往往最简单的问题也最容易犯错。其中,管理 python 环境可能是一件让人头疼的事情。...
2019-08-27 12:49:06 -
10个小技巧加速数据分析
划重点!!!本文列举了一些使用Python和Jupyter Notebook的技巧,讨论了如何轻松分析数据以及如何进行格式化编码、输出和调试等操作。...
2019-08-27 12:47:19 -
Caffe作者贾扬清:AI,从大数据演进到高性能计算
贾扬清博士与大家分享从 Caffe 到 PyTorch 的 AI 基础架构演进以及 AI 时代软件开发的趋势和挑战。...
2019-08-27 12:44:56 -
Apache Flink 1.9 重磅发布:正式合并阿里内部版本
本文将详细介绍1 9版本所有主要的新功能、改进、重要变化、以及未来的发展计划。有关更多详细信息,请查看完整版变更日志。...
2019-08-27 12:43:15 -
数据中台之结构化大数据存储设计
『大数据』技术会逐步向轻量化和智能化方向发展,最终也会成为一个研发工程师的必备技能之一,而这个过程必须是由云计算技术来驱动...
2019-08-27 12:35:44 -
如何在企业中从0-1建立一个数据/商业分析部门
国内大型集团,非互联网。高层有想法建立一个数据部门支持企业的精细化运营,我想了解下一个数据部门如何从0-1建立呢?并且“建立成...
2019-08-27 12:35:22 -
大数据与AI主要发展趋势:基础设施、分析层面及
以下是Matt Turck(美国早期基金FirstMark合伙人)总结的2019年大数据及AI领域的主要发展趋势。他从基础设施、分析以及应用层面分别阐述了主要...
2019-08-22 23:18:18 -
美漂数据科学家年薪多少?爬了6年H1B签证数据发
Tony统计收入的方式很特别,不是用招聘数据,而是通过美国H1B(美国最主要的工作签证),作为公开的工资数据,进行了一个数据分析。他爬...
2019-08-22 23:17:57 -
Apache Beam 实战指南 | 大数据管道 (pipeline) 设计及
随着大数据 2 0 时代悄然到来,大数据从简单的批处理扩展到了实时处理、流处理、交互式查询和机器学习应用。...
2019-08-22 23:15:49 -
6个用于大数据分析的最好工具
大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或E...
2019-08-22 23:12:51 -
ETL数据处理:十个海量数据处理方法大总结
本文将简单总结下一些处理海量数据问题的常见方法。当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理...
2019-08-22 11:01:36 -
深度解析 Flink 是如何管理好内存的?
如今,许多用于分析大型数据集的开源系统都是用 Java 或者是基于 JVM 的编程语言实现的。最着名的例子是 Apache Hadoop,还有较新的框架,如...
2019-08-22 10:57:50 -
数据科学简化:统计学习的关键概念
在本文中,我将深入探讨数据科学中的统计学习概念。 首先,我将定义什么是统计学习。然后,我们将深入研究统计学习中的关键概念。...
2019-08-22 10:56:36 -
企业数据是如何“养成”的?
如今,数据仍在以爆发的态势不断增长,并且充当着企业数字化转型的核心驱动力,成为商业模式创新的重要基础。然而,据统计,目前只...
2019-08-22 10:55:25 -
昨天讲平台、今天变中台,数据中台都干了啥?
数据中台火的很让人不解,半年前还在炒概念,现在突然就看到各个企业都在宣传自家的数据中台了。...
2019-08-21 23:21:53 -
银行数字化转型的过程与挑战
对个人而言,多数时候,这些“数字化”都是一种诱发性的传播过程,一种数字产品的出现,引起一部分人的生活变化,进而扩散成大部分...
2019-08-21 23:21:32 -
绝不能错过的24个顶级Python库
本文为你介绍24种涵盖端到端数据科学生命周期的Python库。...
2019-08-21 23:21:03 -
面试系列:十个海量数据处理方法大总结
本文将简单总结下一些处理海量数据问题的常见方法。当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理...
2019-08-21 23:19:51 -
调查显示企业收集存储的数据有55%未能被使用,
谈起数据的价值,很多企业都会抢着将其描述为新的石油资源啦、最具价值的新资产之类。但有这样一个秘密,各个企业都不愿、甚至羞于...
2019-08-21 23:19:31 -
MapR被HPE收购,Hadoop的未来在哪里?
几天前,国外媒体传出消息,HPE宣布收购MapR 的资产,收购金额未对外公开。去年10月份Hadoop的另外两个代表:Cloudera和Hortonworks的合并。Ha...
2019-08-21 23:12:57 -
浪潮存储服务器NF5266M5 专为大数据应用设计
大数据已经成为各个行业的普及性技术,企业普遍面临大数据挑战,尤其是数据存储和管理的挑战。...
2019-08-21 22:58:16 -
激活数据价值 永洪科技的智胜法则
如今,大数据已经渐地淡出人们的谈资。从2015年开始,大数据已经在Gartner新兴技术成熟度曲线中消失,大数据不再是“新兴的”,而是正在...
2019-08-21 22:52:19 -
2019 年 7 种最受欢迎的编程语言
程序员想要取得伟大的成就,首先需要知道应该学习什么语言。最好的方法就是了解 2019 年 7 种最受欢迎的编程语言。...
2019-08-20 15:18:40 -
后Hadoop世界中的大数据
今天我们带来了 Alex Woodie 撰写的文章,分享了他对后 Hadoop 世界的大数据的看法和预测。...
2019-08-20 15:18:28 -
为什么Kafka会成为微服务架构的事实标准?
本文将探讨为什么 Apache Kafka 会成为微服务架构事实上的标准和主干——Kafka 不仅取代了其他传统的中间件,而且人们还使用 DDD 和 Kafka 原生...
2019-08-20 15:14:38