数据挖掘化功大法(15)——线性回归

线性回归是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。分析按照自变量和因变量之间的关系类型,可分为线性回 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(14)——数据整理与数据归约

在我们需要整理的数据中,很多都是经过不同时间由于各种原因生成的数据,有的是可以追溯到源头的,有的是很难追溯的。通常我们会将所有的数据通过各种方式将数据字典收集到一起, 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(13)——矩阵分解

矩阵分解 (decomposition, factorization)是将矩阵拆解为数个矩阵的乘积,可分为三角分解、满秩分解、QR分解、Jordan分解和SVD(奇异值)分解等,常见的有三种:1)三角分解法 (Trian 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(12)——特征值和特征向量

矩阵的特征值和特征向量设A 是一个n 阶方阵,λ是一个数,如果方程AX=λX (1)存在非零解向量,则称 λ 为 A 的一个特征值,相应的非零解向量 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(11)——线性空间

向量空间又称线性空间,是线性代数的中心内容和基本概念之一。在解析几何里引入向量概念后,使许多问题的处理变得更为简洁和清晰,在此基础上的进一步抽象化,形成了与域相联系的 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(10)——HP Vertica

考虑到企业数据仓库的重要战略意义(EDWs)和每年投入的巨额维护和扩展费用,如何容易地访问这些大量信息资产是非常迫切的需求。然而,许多EDWs成为自己成功的受害者。随着时间 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(9)——R语言

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。一、基本介绍:1. 警告:在输入命令 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(8)——相似性和相异性

前面说过了数据矩阵和相异性矩阵,并且对标称属性和二元属性的相异性进行了分析。下面综合看一下矩阵的相异性和相似性。相似性和相异性被许多数据挖掘技术所使用,如聚类、最近 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(7)——矩阵

我们将一个对象的一个属性扩展到多个对象的多个属性,就形成了矩阵。 上面就是一个矩阵的示例。 相异性矩阵:相异度矩阵存储n个对象两两之间的相似性,表现形式是一个n×n 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(6)——显示图表

1、直方图这个是用的比较多的一种图,可以直观的看出变化的趋势。 2、散点图 用于观察数值变量之间是否存在联系。在图中可以清晰看出数据的相关性。如果Y随着X的增大而增加, 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(5)——数据类型

1、数据对象相当于类的概念,在销售系统中,对象可以是顾客、商品和销售情况。属性:属性可以标签的、二元的、序列的或数值的。标签属性:例如充值渠道中的各种充值类型,在数据库中 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(4)——数据挖掘涉及的技术

数据挖掘需要掌握的内容包括:统计学、机器学习、模式识别、数据库和数据仓库、信息检索、可视化、算法、高性能计算等。下图比较清楚的画出了学习数据挖掘需要掌握的知识内容 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(3)——谈谈支持度和置信度

支持度,简单的字面理解就是支持的程度,一般以百分比表示。生活中常见的使用场合有投票、竞选、民意调查等,比如某校高一三班进行班委竞选,该班级共有学生50名,在班长一职的竞选 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(2)——挖掘模式

数据模式包括:特征化与区分、频繁模式、关联和相关性挖掘、分类与回归、聚类分析、离群点分析等。任务可以分为两类:描述性和预测性数据。数据特征化:汇总所研究类的数据。数据 

2016-08-30

数据挖掘 可思数据

数据挖掘化功大法(1)——建立数据仓库的意义

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库是为企业所有级别的决策制定过程提供支持的所有类型数据的战略集合。它是单个数据存储,出于分析性报告和决策支 

2016-08-30

数据挖掘 可思数据

关于几个数据挖掘问题的回答

什么是数据挖掘,数据挖掘要解决什么问题?大家都知道数据挖掘最花时间就是在变量清洗上,如何清洗变量?如何将挖掘成果很好的展示给用户?这些问题也许通过下面这些问答你可以找到 

2016-08-30

数据挖掘 可思数据

以“上大学分析”为例体验什么是数据挖掘

说到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。案例&ld 

2016-08-30

数据挖掘 可思数据

数据挖掘与数据分析、OLAP之间有什么不同之处?

什么是数据挖掘数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模 

2016-08-30

数据挖掘 可思数据

大揭底:从张小龙看爆料腾讯公司数据挖掘的真像

张小龙最近的一句话,“我们很少看统计数据,也几乎没从统计数据里看到用户的喜好。根据统计数据来找需求和方向是挺难的。”引来炮声一片。 有好几个产品经理、技术 

2016-08-30

数据挖掘 可思数据

如何向小白介绍机器学习和数据挖掘?

买芒果嘴馋的你想吃芒果了,于是你走到水果摊,挑了几个让老板过过秤,然后你再根据芒果的斤两付钱走人。显然,买芒果你当然是挑着最甜、最熟的来买(因为你是根据重量而不是质量来掏 

2016-08-30

数据挖掘 可思数据

页次:10/10 每页25 总数245    首页  上一页  下一页  尾页    转到: 
热点图文 更多