数据挖掘
-
如何可视化BERT?你需要先理解神经网络的语言、
Google AI 的 People + AI Research(PAIR)团队近日发布的论文《Visualizing and Measuring the Geometry of BERT》提出了一种可视化和度量 BERT 的几何性质的方法。...
2019-06-16 23:10:36 -
数据科学思维 :打造健康数据驱动组织的 6 条原
数据科学是一个结合数学、编程和可视化技术的领域,它将科学方法应用于特定的业务领域或问题,如预测未来的客户行为、规划空中交通...
2019-06-16 23:09:01 -
Salesforce收购数据分析平台Tableau 估值157亿美元
全球领先的CRM厂商Salesforce和全球最大的分析平台Tableau 6月10日宣布,双方已达成最终的收购协议。...
2019-06-16 23:05:56 -
基于大数据的舆情分析系统架构(架构篇)
互联网的飞速发展促进了很多新媒体的发展,不论是知名的大 V,明星还是围观群众都可以通过手机在微博,朋友圈或者点评网站上发表状态...
2019-06-16 23:03:51 -
数据基础架构正在发生巨变,您准备好了吗?
进入智能世界,核心是数据量的爆炸式增长。 IDC预测全球数据圈将从2018年的33ZB增至2025年的175ZB。一方面海量的数据蕴含着巨大的价值和商...
2019-06-16 23:03:24 -
2019,Java码农还有必要转型大数据开发吗?
作为一名码农,相信你身边的同行业者在过去的一年中,对于大数据的谈论并不少,当然,他们之中也不乏有一些人转型去做了大数据。而...
2019-06-16 23:02:54 -
Hadoop气数已尽:逃离复杂性,拥抱云计算
虽然大数据依然如日中天,但该领域曾经的领头羊 Cloudera、Hortonworks 和 MapR 三家公司最近步履蹒跚,多少掩盖了其几分风光。...
2019-06-16 23:02:21 -
17款数据可视化工具,让你的数据更美观!
想让数据变得更好看?不必成为经验丰富的数据科学家,也不必成为平面设计师。有一些能让数据从简单的表格变成多种多样的图形,地图甚...
2019-06-14 00:19:15 -
有效挖掘客户数据的6个技巧
零售和营销业企业正在收集大量关于客户的数据,但他们并不总是能充分挖掘这些信息的价值。随着新的隐私法规限制对私人数据的使用和...
2019-06-14 00:18:57 -
TensorFlow 等“开源陷阱",会掐住中国 AI 企业
近来美国基于出口管制条例(EAR)规范,要求多个不同领域的企业、组织不得与特定的中国企业往来,这其中除了已为外界所知的原料、芯片、...
2019-06-14 00:17:42 -
5年内最大手笔,谷歌豪掷26亿美元收购数据分析
北京时间 6 月 7 日,谷歌宣布以 26 亿美元收购了数据分析公司 Looker,并将该公司并入 Google Cloud。这是谷歌 21 年历史上第三大收购案,仅次...
2019-06-14 00:17:04 -
终版API已定型,TensorFlow 2.0 Beta蜕变归来
TensorFlow 发布以来,已经成为全世界最广泛使用的深度学习库。但 Tensorflow 1 x 时代最广受诟病的问题是:学习门槛较高、API 重复且复杂、模...
2019-06-14 00:15:40 -
新手如何发布第一个Python项目开源包?这里有一
好不容易码了个 python 项目,是不是很兴奋?那么怎么把这个项目发出去让大家看到呢?本文作者写了一份在 GitHub 上发布 python 包的简单分步指...
2019-06-14 00:14:25 -
构建端到端数据科学项目,从我的Data Scientist I
人们常说,数据科学家的主要工作不是实际的分析和建模,而是数据的整理和清理部分。因此,涉及这些阶段的全周期数据科学项目将更有...
2019-06-14 00:14:08 -
我国区域大数据产业规划布局研究
本文全面梳理我国31个省(区、市)的大数据产业相关政策文件,客观分析我国区域大数据产业的布局现状与问题,针对关键问题进行深入研究...
2019-06-14 00:11:42 -
PB级数据实时查询,滴滴Elasticsearch多集群架构实
Elasticsearch 是基于 Lucene 实现的分布式搜索引擎,提供了海量数据实时检索和分析能力。...
2019-06-14 00:10:01 -
谷歌AI开源张量计算库TensorNetwork,计算速度暴涨
为了解决这个问题,人们利用名为“张量网络”的数据结构,可以专注于与现实问题最为相关的量子态——低能量状态,而忽略其他不相关...
2019-06-14 00:09:15 -
大数据独角兽 Cloudera 股价腰斩,Hadoop将何去何从
6月6日美股开盘后,大数据公司Cloudera股价暴跌43%,一周前,曾经同为大数据独角兽的MapR也传出了面临重大危机的消息。围绕Hadoop进行商业化...
2019-06-14 00:08:46 -
构建AI前的数据准备,SQL要比Python强
作为一名 Web 开发人员,我第一次与数据库和 SQL 产生交集是使用对象关系映射(ORM)。我使用的是 Django 查询集 API,这个界面用户体验很好。...
2019-06-14 00:08:33 -
eBay如何打造基于 Apache Druid 的大数据实时监控系
在 eBay 中,我们将监控技术栈从传统的本地架构转换为基于 Druid 的实时监控系统。在本文中,我们将讨论如何过渡到新技术栈,以及它为我...
2019-06-14 00:07:42 -
Python称霸在即,3年后将取代Java成为最受欢迎开发
最新Tiobe月度排行中Python排名第三,评分为8 5%,比去年同期上升2 77个百分点。Tiobe分析师认为这种趋势将持续下去,Python可能会在三到四年...
2019-06-14 00:07:25 -
基于Kafka的实时计算引擎如何选择?Spark or Flink
目前实时计算的业务场景越来越多,实时计算引擎技术及生态也越来越成熟。以 Spark 和 Flink 为首的实时计算引擎,成为实时计算场景的重点...
2019-06-14 00:07:09 -
Pandas必备技能之“时间序列数据处理”
时间序列数据Time Series Data是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。...
2019-06-14 00:06:59 -
优酷背后的大数据秘密
在本文中优酷数据中台的数据技术专家门德亮分享了优酷从Hadoop迁移到阿里云MaxCompute后对业务及平台的价值。...
2019-06-14 00:06:46 -
独家解读!京东高可用分布式流数据存储的架构
笔者作为架构师,全程参与了 JournalQ 和 JournalKeeper 的设计和开发。这篇文章中,我将跟大家分享在开发这两款产品过程中的一些技术心得和...
2019-06-14 00:06:33 -
基于大数据的舆情分析系统架构(架构篇)
大数据时代,除了媒体信息以外,商品在各类电商平台的订单量,用户的购买评论也都对后续的消费者产生很大的影响。...
2019-06-14 00:06:20 -
百亿级全网舆情分析系统存储设计
这个全网舆情分析系统,可以实现百亿条网页数据的存储、实时新增网页的抓取和存储并能对新增网页做实时的元数据提取。有了提取结果...
2019-06-14 00:06:09 -
SQL on Hadoop 在快手大数据平台的实践与优化
整理自快手大数据架构工程师钟靓近日在 A2M 人工智能与机器学习创新峰会的演讲分享《SQL on Hadoop 在快手大数据平台的实践与优化》。...
2019-06-14 00:05:58 -
为啥Spark 的Broadcast要用单例模式
很多用Spark Streaming 的朋友应该使用过broadcast,大多数情况下广播变量都是以单例模式声明的有没有粉丝想过为什么?...
2019-06-14 00:05:31 -
SparkSQL连接查询中的谓词下推处理
SparkSql 是架构在 Spark 计算框架之上的分布式 Sql 引擎,使用 DataFrame 和 DataSet 承载结构化和半结构化数据来实现数据复杂查询处理,提供的...
2019-06-14 00:05:14 -
影响数据中心正常运行时间的四种网络攻击
据Neustar Research 4月发布的报告声称,从2018年第一季度到今年第一季度,规模不小于100 Gbps的DDoS攻击数量猛增了近1000%。...
2019-06-09 17:59:52 -
Uber 大数据平台的演进(2014~2019)
自2014年以来,Uber 一直致力于开发大数据解决方案,确保数据可靠性,可扩展性和易用性;现在 Uber 正专注于提高他们平台的速度和效率。...
2019-06-09 17:59:18 -
数据分析必不可少之数据仓库!
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。数据仓库本身并不“生产”任何数据,同时自身也...
2019-06-09 17:55:32 -
大数据实战之数据分析与数据建模技术
目前,社交网站、电子商务等网络服务的迅速发展,使得网络服务及网络信息规模裂变式增长,这样就会对大规模数据的处理带来了很大的...
2019-06-06 00:02:51 -
YOCSEF广深思辨:复杂大数据聚类分析的机遇与挑
2019年6月2日,YOCSEF广州分论坛、深圳分论坛在广州大学城中山大学数据科学与计算机学院成功举办了“复杂大数据聚类分析的机遇与挑战在...
2019-06-06 00:01:41