做好数据挖掘模型的9条经验总结

数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集 

2018-03-17

数据挖掘 可思数据

盘点:数据挖掘中的十大实用方法

1.基于历史的MBR分析  基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做 

2018-03-07

数据挖掘 可思数据

数据挖掘中的十大实用分析方法

1.基于历史的MBR分析基于历史(Memory-Based Reasoning)的MBR分析方法最主要的概念是用已知的案例(case)来预测未来案例的一些属性(attribute),通常找寻最相似的案例来做比较 

2018-03-07

数据挖掘 可思数据

数据挖掘,正从从线上生活伸向线下

硅谷是一个开采行业。它开采的不是石油或铜矿,而是数据。企业通过尽可能地观察消费者的在线活动来收集数据。这种活动可能是使用社交媒体,进行网络搜索,甚至是鼠标在屏幕 

2018-01-20

数据挖掘 可思数据

决策树分类预测过程可视化

摘要:numpy,pandas用于数值处理,DictVectorizer用于特征处理,graphviz用于模型可视化开始前的准备工作首先导入所需库文件,numpy,pandas用于数值处理,DictVectorizer用于特征处理,g 

2018-01-20

数据挖掘 可思数据

数据模型——数据仓库的灵魂

随着数据量的爆炸式增长,数据仓库或数据平台已经是每家企业或机构不可缺少的工具,而数据模型正是数据仓库的灵魂。本期详细介绍数据模型的概念、分类和应用,相信你一定有兴趣~ 

2018-01-17

数据挖掘 可思数据

数据挖掘知识点整理

1. 数据、信息和知识是广义数据表现的不同形式。2. 主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识3. web挖掘研究的主要流派有:Web结构挖掘、Web使用挖 

2018-01-17

数据挖掘 可思数据

T级数据量下的划分聚类方法CLARANS+

在常规聚类案例中,数据一般都是以iris集或者不足GB级的数据作为测试案例,实际商业运用中,数据量级要远远大于这些。比如滴滴出行15年日均单量就达到1000万单,出行轨迹的数据存 

2018-01-17

数据挖掘 可思数据

对数据驱动的自动化机器学习系统的解读

一、导读本文主要内容是以驾驶行为习惯风险预测模型为例,深度解读一个数据驱动的自动化机器学习系统应该具备的基本功能:模型自我学习的能力。只需生产系统部署一次,避免对于 

2018-01-17

数据挖掘 可思数据

手把手教你如何用 Python 做情感分析

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地。本文帮助你一步步用Python做出自己的情感分析结果,难道你不想试试看?需求如果你关注数据科学研究 

2018-01-17

数据挖掘 可思数据

一种基于用户移动大数据来分析驾驶风险的研究模

1 研究背景风险,一个永恒的话题,特别在汽车保险行业,“互联网+”下汽车共享经济深度影响着企业的风险运营模式,如何将驾驶行为人的多个维度数据进行结合,有效应用到个 

2018-01-17

数据挖掘 可思数据

基于统计思想下的推荐系统

之前在惠普中国算法实验室做过一种基于威尔逊区间法的排序方法,和大家分享一下:我们先做如下设定:(1)每个用户的打分都是独立事件。(2)用户只有两个选择,要么投喜欢'1',要么投不喜欢 

2018-01-17

数据挖掘 可思数据

爬取简书百万页面 分析简书用户画像

在本文中我会尝试如何从0数据开始到获取百万页面,进行用户数据分析、建模,再数据信息化、可视化,生成用户画像分析用户特征。缘起:几个月前正式进驻简书平台,不由的想了解下在 

2018-01-17

数据挖掘 可思数据

关于推荐算法的一些思考

最近做了一个交叉销售的项目,梳理了一些关键点,分享如下,希望对大家有所启发核心目标:在有限资源下,尽可能的提供高转化率的用户群,辅助业务增长初步效果:商家ROI值为50以上,用户日 

2018-01-17

数据挖掘 可思数据

关联规则分析怎么做?你需要知道这3大关键词、4大

关联规则是反映一个事物与其他事物之间的相互依存性和关联性,常用于实体商店或在线电商的推荐系统:通过对顾客的购买记录数据库进行关联规则挖掘,最终目的是发现顾客群体的购 

2018-01-17

数据挖掘 可思数据

数据驱动的理财产品业务增长探索

近两年来互联网金融产品层出不穷,市场同质化严重,如何通过有效的数据分析实现精细化管理并提升用户全生命周期价值,成为了互联网金融行业创新的新风向。4月14日我们在北京主办 

2018-01-17

数据挖掘 可思数据

极光大数据:大数据时代下的数据挖掘简析

随着大数据的兴起,隐藏在大数据背后的相关技术也逐渐被揭开神秘的面纱,其中,数据挖掘即是大数据应用过程中非常重要的环节。以下是国内领先的移动大数据服务商极光大数据的副 

2018-01-17

数据挖掘 可思数据

用随机森林预测NBA球员打什么么位置

引言:众所周知,篮球队分为大前锋、小前锋、得分后卫、控球后卫和中锋五个位置,虽然现在无位置篮球正在兴起,但是我们还是可以用球员的历史数据来预测它的位置。在这里我们就是 

2018-01-17

数据挖掘 可思数据

关联规则推荐算法的原理及实现

关联规则用来发现数据间潜在的关联,最典型的应用是电商网站的购物车分析。本文将通过一个简单的例子来说明关联规则中各个术语的含义以及具体的计算方法。这是一些用户的购 

2018-01-17

数据挖掘 可思数据

银行客户信用评分及实现

想必很多人多有贷款或申请信用卡的经历,那么“大金主”银行的钱从何而来?其中一小部分是银行的自有资本,其余大部分来源于储蓄、资本市场发行债券或股票等,也就是说,& 

2018-01-17

数据挖掘 可思数据

如何快速构建用户画像?

一、什么是用户画像( personas)?Alan Cooper (交互设计之父)最早提出了 persona 的概念:“Personas are a concrete representation of target users.”Persona 是真 

2018-01-17

数据挖掘 可思数据

基于CRISP的数据挖掘有哪些坑?

决策管理系统可以帮助公司改进决策过程,开发数据驱动的敏捷业务系统。 Taylor 在 Kdnuggets上介绍了CRISP数据挖掘流程中常见问题和解决方案。CRISP-DM (cross-industry sta 

2018-01-17

数据挖掘 可思数据

90%的用户画像,都是在做无用功

谈到“用户画像”,伙伴们一个个似乎都很熟练,什么用户属性、用户行为张嘴就来,但是你真的弄懂了用户画像的内涵和意义?用户画像包括哪些方面?用户画像的建构方法?在做 

2018-01-17

数据挖掘 可思数据

携程如何从海量数据中构建精准用户画像?

用户画像作为“大数据”的核心组成部分,在众多互联网公司中一直有其独特的地位。作为国内旅游OTA的领头羊,携程也有着完善的用户画像平台体系。目前用户画像广泛用 

2018-01-17

数据挖掘 可思数据

基于CRISP的数据挖掘有哪些坑?双手奉上破解妙招

本文作者为Decision Management Solutions的CEO James Taylor,是基于数据分析的决策管理系统构建领域的领先专家,他为各种规模的公司提供战略咨询,与客户的各个部门合作,让他们 

2018-01-16

数据挖掘 可思数据

页次:1/10 每页25 总数248    首页  上一页  下一页  尾页    转到: 
热点图文 更多