数据挖掘
-
谷歌、甲骨文史诗级版权诉讼案,10 年 API 之争下
最近一桩缠绵十年的案子,因为临审将近,又被大家翻出来。那就是甲骨文和谷歌 API 侵权之争。这桩案子起源于 2009 年,甲骨文斥资 74 亿...
2020-03-31 23:22:09 -
消息队列和 RocketMQ 入门总结
消息队列顾名思义就是存放消息的队列,队列我就不解释了,别告诉我你连队列都不知道似啥吧?所以问题并不是消息队列是什么,而是消...
2020-03-31 22:27:54 -
2020年的4种数据分析主导趋势
随着数据战略成为企业数字业务的关键推动因素,数据管理现代化、分析民主化以及建立信任的必要性在2020年将至关重要。...
2020-03-26 22:19:53 -
三分钟带你了解数据挖掘
今天,我带领大家来了解一下数据挖掘。首先,我们先来了解一下数据挖掘的定义。数据挖掘是指从大量的数据中通过算法搜索隐藏于其中...
2020-03-26 22:19:11 -
数据科学异常值检测原理之经验法则
数据样本符合标准正态分布,正态分布的核心是中心极限定理即:如果一个事物受到多种因素的影响,不管每个因素本身是什么分布,它们...
2020-03-26 22:18:33 -
2020年十个强大的数据建模工具
数据科学可以使企业处理大量信息,并获得曾经花费大量时间才计算出来的宝贵数据。如果企业处理大量数据,那么可以采用数据建模工具...
2020-03-26 22:12:12 -
适用于商业智能团队的优秀数据分析工具
如何知道哪种数据分析工具可以帮助企业实现商业智能目标呢?现在已经完成了所有艰苦的工作,并基于它们的健壮性、集成能力和易用性,...
2020-03-26 22:10:46 -
2020年,5种将死的编程语言
曾几何时,几乎每个人都在使用Perl语言编程。但是那些经常使用的人慢慢地发现,关于这个Perl语言似乎总是有点不对劲。至少我知道有这么...
2020-03-24 23:12:48 -
RabbitMQ和Kafka的比较
异步消息可以作为解耦消息的生产和处理的一种解决方案。提到消息系统,我们通常会想到两种主要的消息模式——消息队列和发布/订阅模...
2020-03-19 23:42:41 -
设计一个数据中台,总共分几步?
本文旨在探讨通用的数据中台架构设计方法,产出物为数据中台的逻辑架构。...
2020-03-19 00:01:32 -
携程 Hadoop 跨机房架构实践
本文将分享携程 Hadoop 跨机房架构实践,包含 Hadoop 在携程的发展情况,整个跨机房项目的背景,我们跨机房的架构选型思路和落地实践,相...
2020-03-19 00:00:33 -
Fast.ai两创始人联合发文,用数据科学解读新冠被
这篇文章与AI技术无关,而是在呼吁大家重视COVID-2019疫情,文章的题目是“新型冠状病毒,社会与你——数据科学家的视角...
2020-03-18 23:56:10 -
结构化数据不应该被人工智能遗忘!
虽然人工智能的最新发展已经从非结构化数据中挖掘出了巨大价值,但对结构化数据而言,其研究和应用也是不可忽视的,因为结构化数据...
2020-03-18 23:52:53 -
Spark 3.0 终于支持 event logs 滚动了
Spark 的 event log 为什么不可以提供类似功能呢?值得高兴的是,即将发布的 Spark 3 0 为我们带来了这个功能(具体参见 SPARK-28594)。...
2020-03-17 23:23:52 -
15 个提高效率的 Python 编程技巧
每次写 Python 都会忘记该怎么写,最后只能去 Stack Overflow 查?我也一样。时间一长,这让人厌倦。...
2020-03-17 23:23:41 -
盘点100个最受欢迎的Java库,看看用过那几个?
续两年,junit 二度成为 GitHub 中最受欢迎的 Java 库。与此同时,Java 日志记录 API slf4j 获得第二名,log4j 排名第四。此外,谷歌的开源项目 ...
2020-03-17 23:23:30 -
Kafka为什么这么快?
在过去的几年里,软件架构领域发生了巨大的变化。人们不再认为所有的系统都应该共享一个数据库。微服务、事件驱动架构和CQRS(命令查...
2020-03-17 23:23:13 -
金融级数据库分布式改造的架构设计要点
银行业从最初的手工记账到会计电算化,到金融电子化,再到现在的金融科技,可以看到金融与科技的结合越来越紧密,人工智能、大数据...
2020-03-14 00:44:52 -
京东出品!写给大家看的数据分析思路(一)
数据分析主要分为 6 大步骤:构建 X 问题 – 提出假设 & 选择指标 – 数据采集与整理 – 数据分析 – 数据呈现 – 提出后续建议。下文将围...
2020-03-10 17:53:55 -
企业面临哪些数据湖管理挑战?
成功的数据治理方案涉及部署策略、标准和流程,以在整个企业中有效正确地利用高质量数据。如果你的企业具有数据湖环境,并希望从中...
2020-03-10 17:53:01 -
分析:亚马逊如何通过数据湖解决大数据挑战?
数据湖是一个集中式安全存储库,可让您以任何规模存储,管理,发现和共享所有结构化和非结构化数据。数据湖不需要预定义的架构,因...
2020-03-10 17:52:41 -
在数据科学中使用 C 和 C++
让我们使用C99和C++11完成常见的数据科学任务。虽然Python和R之类的语言在数据科学中越来越受欢迎,但是C和C++对于高效的数据科学来说是一...
2020-03-10 14:02:01 -
意料之外 情理之中:解读Gartner 2020年数据科学和
最近Gartner发布了数据科学和机器学习(DSML)平台魔力象限报告。数据科学、机器学习和人工智能的市场格局极为分散,竞争激烈且难以理解...
2020-03-04 22:25:59 -
如何首次构建云数据仓库
对很多组织来说,如何首次成功地构建云数据仓库是一个难题,因此需要了解一些知识和技巧。...
2020-03-04 22:12:27 -
Oracle发布基于云的数据科学平台 融入更多自动化
Oracle今天发布了一款基于云的数据科学平台,新平台为企业提供了一个用于分析和人工智能项目的工具包。...
2020-03-04 22:08:44 -
Python3.9又更新了:dict内置新功能,正式版十月见
公开这一版本的原因是希望帮助开发者尽快测试新特性、修复 bug 并测试开源流程。在这一阶段,新特性还在增加,直到迭代到 beta 版本,甚...
2020-03-03 23:25:35 -
数据越多能耗越大?《科学》最新算法模型揭示
今天凌晨,Science 杂志发表了美国西北大学和劳伦斯伯克利国家实验室(LBNL)的最新研究成果,为了能够较为科学准确地探究数据中心能源使用...
2020-03-03 23:25:08 -
秘籍:10个Python字符串处理技巧(附代码)
在探寻文本分析途径时却不知从何下手,该怎么办?那么可以通过这个字符串处理入门教程,来了解一下利用Python处理字符串的一些基本操作...
2020-03-03 23:24:52 -
消息中间件如何对接大数据
现如今,消息中间件已经在很多公司的业务中被广泛使用:业务解耦,消峰填谷,对接大数据,流式计算等等各种玩法层出不穷。...
2020-03-03 23:24:05 -
实时可视化Debug:VS Code 开源新工具,一键解析代
DeBug 太枯燥?让 VS Code 画个图,自动帮你理清数据结构与代码思路,这就是 Reddit 2K 多点赞的开源新工具。...
2020-03-03 23:23:36 -
数据脱敏技术发展趋势与行业应用研判
在降低数据敏感程度的基础上,数据脱敏技术会最大程度上的保持脱敏后数据的可用性,使脱敏后的数据依旧能够满足关联分析、机器学习...
2020-03-03 23:23:18 -
一位数据科学家的独白
最近几年,云的出现以及企业纷纷向互联网转型导致了数据大爆炸。因此,数据科学家在市场上供不应求。...
2020-03-03 23:22:22 -
分析:亚马逊如何通过数据湖解决大数据挑战?
数据湖是一个集中式安全存储库,可让您以任何规模存储,管理,发现和共享所有结构化和非结构化数据。数据湖不需要预定义的架构,因...
2020-03-03 23:22:10 -
26亿美元,谷歌完成史上第三大收购案!数据分析
作为一家商业智能软件和大数据分析平台,Looker可以帮助分析师和其他工作人员定义收入或高价值客户等项目的计算,然后可视化其数据趋...
2020-03-03 23:20:50 -
携程Hadoop跨机房架构实践
本文将分享携程Hadoop跨机房架构实践,包含Hadoop在携程的发展情况,整个跨机房项目的背景,我们跨机房的架构选型思路和落地实践,相关...
2020-03-02 23:13:30