数据挖掘
-
携程金融大数据风控算法实践
导读:本次报告曾老师主要分享了携程金融风控算法从 0-1 的发展进程,以时间为主线,经历了数据样本由少到多,特征由粗到细,模型由简...
2019-04-22 18:28:23 -
全面解析大数据框架Hadoop主要模块
hadoop Common: 包括Hadoop常用的工具类,由原来的Hadoop core部分更名而来。主要包括系统配置工具Configuration、远程过程调用RPC、序列化机制和H...
2019-04-20 00:02:15 -
推荐算法工程师的成长之道
本文是作者计划的一系列文章中的一篇。后面的文章将涉及到推荐系统的基本介绍、冷启动、商业价值、工程实现、评估等方方面面。这系...
2019-04-19 23:31:35 -
大数据分析建模及其应用建议
通过对数据的收集、存储、再组织和分析建模,隐藏在数据中的重要价值及规律逐渐展现出来,正成为企业转型升级及可持续发展的重要推...
2019-04-18 17:51:37 -
数据分析帮助HCSC掌握了医疗服务提供商的脉动
这家非营利性医疗保险公司正在使用机器学习和预测分析技术来提供一个更好的健康结果和更具成本效率的医疗服务网络。...
2019-04-18 00:17:36 -
如何11步转行数据科学家 (适用数据员/ MIS / BI分析
这是一段令人兴奋的旅程。我已经在几年前经历过了这样的过渡。我看到这个领域随着时间推移而发展,本文的目的是帮助你实现转变。你...
2019-04-18 00:11:17 -
像数据科学家一样思考:12步指南(下)
一旦产品构建完成,你仍然需要做一些事情来使项目更加成功并使你的未来生活更轻松。那么我们如何完成数据科学项目呢?...
2019-04-18 00:10:43 -
智能运维大数据的终极宝典(附图表解析)
生产设备 装备是工业的重要生产工具,其可靠性、性能对工业生产有重大影响。随着工业大数据推进,设备的智能运维被定义为一个重要的...
2019-04-15 23:33:20 -
像数据科学家一样思考:12步指南(中)
下一步是建立统计软件。如果统计是分析和从数据中得出结论的框架,那么软件就是将这个框架付诸行动的工具。数据科学家必须为任何项...
2019-04-12 23:29:39 -
2019值得关注的数据可视化工具TOP5
数据可视化在数据分析过程中的扮演着非常重要的角色。对于数据科学家或数据分析师来说,以更直观、便于查看、甚至更吸引人的视觉效...
2019-04-12 00:24:55 -
数据科学岗位将在未来5年内重新洗牌,你准备好
计算器的工作曾经由人来做;网站管理员曾经是热门职业;中层管理人员也曾配备过秘书。技术的迭代变革了一批又一批职业,数据科学家也不...
2019-04-12 00:16:36 -
Kylin 实时流处理技术探秘
本月在上海举行 Apache Kylin Innovation Meetup 活动中,eBay 大数据平台团队的马刚老师,为大家分享了 Kylin 的实时流式 OLAP 分析的新功能;特别提...
2019-04-12 00:00:20 -
数据挖掘“世界杯”KDD Cup 2019开赛,百度夺得主
近日,中国互联网公司巨头百度公司获得了“KDD CUP 2019”的主办权,KDD CUP素有全球数据挖掘领域“世界杯”之称,是目前数据挖掘领域最高...
2019-04-12 00:00:03 -
为什么说流处理即未来?
本文整理自 Flink 创始公司 dataArtisans(现在为 Ververica)联合创始人兼 CTO Stephan Ewen 在 Flink Forward China 2018 上的演讲《Stream Processing takes on Everyt...
2019-04-10 15:43:24 -
给有抱负的数据科学家的六条建议
现在数据科学的需求量很大,似乎一部分原因是因为数据科学家需要有从业经验。但其实,许多那些和我工作过的最好的数据科学家都来自...
2019-04-10 14:30:17 -
对Ginnie Mae来说,数据分析可用于放贷救灾
2017年的灾难性飓风促使政府全国抵押贷款协会(Ginnie Mae)开发了一个分析仪表板,以减少损失风险,并预测未来灾难的财务影响。...
2019-04-05 21:07:30 -
TensorFlow的新生!
TensorFlow 2 0 带来了大量改变。谷歌工程师 Cassie Kozyrkov 表示:之前的 TensorFlow 已死,而新版 TensorFlow 使它获得重生。...
2019-04-05 18:50:02 -
从术语到Spark,10篇必读大数据学习资源
本文给想进入大数据领域的朋友提供了一系列的资源,由浅入深,比如“需要了解的51条大数据术语”、“学习python的四个理由”、“十一个...
2019-04-03 13:00:59 -
大数据工作流调度系统Easy Scheduler正式开源
Easy Scheduler 大数据工作流调度系统已经开源,欢迎下载交流。Easy Scheduler for Big Data 设计特点: 一个分布式易扩展的可视化DAG工作流任务调度...
2019-04-03 13:00:36 -
利用 Apache Spark SQL 和 DataFrames 扩展关系数据库
无论怎样大肆宣传 NoSQL 数据库的出现,关系数据库都还将继续存在。原因很简单,关系数据库强制执行基本的结构和约束,并提供了很好的...
2019-04-02 19:17:48 -
数据库设计中的 9 大常见错误
作为数据库设计人员,当我们负责数据库项目时,在数据库设计以及把数据库部署到生产环境的过程中可能会遇到一些挑战。...
2019-04-02 19:17:13 -
中国互联网公司开源项目调研报告
近年来,开源技术得到越来越多的重视,微软收购 GitHub、IBM 收购红帽,都表明了开源的价值。国内公司也越来越多的参与开源,加入开源基...
2019-04-02 19:16:34 -
干货 :12个关于数据科学学习的关键提示
数据科学家需要强大的数学和编码能力,但沟通能力和其它软技能也是走向成功不可缺少的基本功。...
2019-04-01 19:13:11 -
R语言有多强大?十个你不知道的功能
本文介绍了十个R语言中的功能,这些当然不是R语言全部的优秀特征。比如你还可以连接到AWS Polly来生成语音合成软件,或者用R语言生成能...
2019-04-01 19:12:44 -
测试报告 RadonDB分布式数据库:从公有云验证到企
近两年来,国内外诸如AWS、Azure等公有云巨头都先后推出了自研的数据库服务,青云QingCloud不仅推出了分布式数据库RadonDB,同时还将这一经过公...
2019-03-30 23:23:21 -
饿了么研发总监:外卖大数据推荐算法中有哪些
今天分享的内容分以下几个方面,首先是饿了么外卖推荐业务形态,然后是搜索推荐平台的目标与定位;接下来会聊聊在外卖推荐领域的特殊...
2019-03-29 18:44:23 -
干货!这才是学习Python的正确打开方式!
Python可谓是世界上最通用、最强大的编程语言之一。人们使用Python可以编写自己的应用程序,创建游戏以及设计算法,甚至还可以为机器人...
2019-03-28 10:54:02 -
数据科学的下一个「超能力」:模型可解释性
很多人重视重视模型的预测能力,却忽略了模型可解释性的重要性,只知其然而不知其所以然。为什么说模型的可解释性这么重要呢?作者就...
2019-03-28 10:53:48 -
架构师必知的各种开源实时流处理系统
这里对目前业界开源的一些实时流处理系统做一次小结,作为日后进行技术调研的参考资料。 S4 S4(Simple Scalable Streaming System)是Yahoo发布的一...
2019-03-28 10:18:03 -
腾讯广告算法大赛再度来袭,算法er不可缺席的未
3月26日,2019腾讯广告算法大赛拉开帷幕,正式面向全球算法圈层启动线上招募,邀你一起见证“硬核算法极客”间的巅峰对决!...
2019-03-27 23:45:35 -
这些数据科学家必备的技能,你拥有哪些?
88%的数据科学家受过高等教育且拥有硕士学位,其中46%拥有博士学位。虽然有些人是例外,但通常需要非常强大的教育背景才能拥有成为数...
2019-03-26 19:01:26 -
企业监控员工绩效的7个大数据工具
如今,大数据正在改变企业管理和评估员工的方式,企业可以尝试使用这些大数据工具来监控员工绩效。...
2019-03-26 18:53:04 -
为何数据科学团队需要通才而非专才
通过功能专业化,每位工人都变得非常娴熟于其所专一的任务,从而提高了效率。人均产出增加了,工厂生产钢针的效率也变得极高。按职...
2019-03-26 18:51:17 -
数据科学家十年后彻底消失?25 年行业元老:无
此前《福布斯》上发表的文章称,到 2029 年,数据科学家岗位将消失,就像 2019 年不会有 MBA 岗位,没有计算机科学岗位一样,因为 MBA、计...
2019-03-26 18:47:28 -
这些数据科学家必备的技能,你拥有哪些?
想要成为数据科学家,没有这些技能怎么能行?...
2019-03-25 23:25:55