数据挖掘
-
年华数据科技有限公司发布“数据中台解决方案
5月27日,2020“数博发布”活动中,年华数据科技有限公司正式发布了“数据中台解决方案”。该方案包括数据汇聚、数据加工治理、数据资...
2020-05-27 23:33:53 -
部门库建设初探
各级政府都在建设大数据中心,也建设了各种大数据平台,目的是汇聚各部门数据。但在实际过程中,数据的归集、融合一直是比较难的问...
2020-05-24 17:27:41 -
避免数据分析灾难发生的6个技巧
数据分析对公司来说是非常有价值的,它可以提供对数据的深刻见解,而这些见解原本可能是不可见的。...
2020-05-24 17:26:49 -
如何画出优秀的架构图?
架构就是对系统中的实体以及实体之间的关系所进行的抽象描述,是一系列的决策。架构是结构和愿景。系统架构是概念的体现,是对物/信...
2020-05-22 23:04:35 -
质疑谷歌量子优越性:阿里团队发预印本论文,
2019 年见证了许多历史性时刻,但这些历史性时刻仍需经受考验。例如谷歌宣布实现量子优越性(Quantum Supremacy)。当时,谷歌在其刊登于...
2020-05-22 23:03:41 -
手把手教你在 CentOS 上搭建 Kubernetes 集群
使用kubeadm init命令初始化集群之下载Docker镜像到所有主机的实始化时会下载kubeadm必要的依赖镜像,同时安装etcd,kube-dns,kube-proxy,由于我们GF...
2020-05-20 22:50:07 -
互联网公司常用 MySQL 分库分表方案
不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看...
2020-05-20 22:49:53 -
关于数据中台建设之思考
数据中台是聚合和治理跨域数据,将数据抽象封装成服务,提供给前台以业务价值的逻辑概念。数据中台是一套可持续“让企业的数据用起...
2020-05-20 22:49:10 -
Kafka加Flink不是终点!下一代大数据平台Pravega
发展到现在,Apache Kafka 无疑是很成功的,Confluent 公司曾表示世界五百强中有三分之一的企业在使用 Kafka。实时备份机制让它在推荐、广告等...
2020-05-18 23:16:35 -
分类类别不均衡?来试试 Facebook 的学习表征和分
图像分类一直是深度学习领域中非常基本且工业应用广泛的任务,然而如何处理待分类样本中存在的类别不均衡问题是长期困扰学界与工业...
2020-05-08 18:42:20 -
Redis 6.0.0 GA 正式发布,有这些新特性
Redis 创始人宣布 Redis 6.0.0 稳定版正式 GA。正如 Redis 作者 antirez 所说,这是迄今最“企业”化的版本(SSL 与 ACL 等特性与企业极相关),也是...
2020-05-08 10:03:16 -
如何画出优秀的架构图?
架构就是对系统中的实体以及实体之间的关系所进行的抽象描述,是一系列的决策。架构是结构和愿景。系统架构是概念的体现,是对物/信...
2020-05-02 22:50:56 -
动图展示 10 大 Git 命令
尽管 Git 是一款非常强大的工具,但如果我说 Git 用起来简直是噩梦,大多数人也会认同我的说法。我发现在使用 Git 时,在头脑里可视化地...
2020-04-27 23:32:59 -
超全!19 种损失函数,你能认识几个?
当训练有 C 个类别的分类问题时很有效. 可选参数 weight 必须是一个1维 Tensor, 权重将被分配给各个类别. 对于不平衡的训练集非常有效。在多...
2020-04-26 23:15:23 -
DRAM的架构历史和未来
内存是计算机系统设计中的重要主题。在IMEC,我们为独立以及嵌入式应用程序开发了多种新兴的内存技术。包括用于高速缓存级应用的MRA...
2020-04-26 22:42:41 -
浅谈使用Binlog实现MySQL增量备份
在写文章的时候,我一直在纠结,这个到底能不能算增量备份,因为使用binlog的这种方式,按照官方文档的说话,应该叫做 point-in-time ,而...
2020-04-23 12:39:15 -
Flink SQL vs Spark SQL
Spark SQL 的核心是Catalyst优化器,首先将SQL处理成未优化过的逻辑计划(Unresolved Logical Plan),其只包括数据结构,不包含任何数据信息。然后...
2020-04-23 12:39:06 -
什么是Service Mesh
Service Mesh作为下一代微服务技术的代名词,初出茅庐却深得人心一鸣惊人,大有一统微服务时代的趋势。那么到底什么是Service Mesh?一言以...
2020-04-23 12:38:57 -
一篇文章带你逆袭 Kafka
Apache Kafka 是一个快速、可扩展的、高吞吐的、可容错的分布式“发布-订阅”消息系统, 使用 Scala 与 Java 语言编写,能够将消息从一个端点...
2020-04-20 15:57:28 -
中国 SaaS 企业的抱团生态
2014年是中国企业服务热潮开启的元年。以Salesforce为标杆代表的SaaS模式,深深刺激了国内ToB行业从业人士,以及投资人。无论是再造一个中...
2020-04-20 15:56:44 -
船新论文评审Python程序,淘汰人工审核,自动给arXiv打分
什么?同行评审已经可以被AI程序取代了? 就在4月1日,英国牛津大学提出了最新的评审标准算法State-Of-the-Art Review,SOAR,同时开源了它的...
2020-04-16 23:42:33 -
中台崛起的本质是“去ERP化”
中台的崛起代表了一部分中国领先企业的“去 ERP 化”趋势,从以资源集约化为中心走向以用户价值为中心,从闭源单体架构的商业 ERP 套件...
2020-04-16 21:56:21 -
2020年你应该选择哪个Java微服务框架?
至今,Java仍旧是用来构建Web应用的最流行编程语言之一 —— 但是它不得不面对诸如Go,Python和TypeScript等新语言的严峻挑战。在Java世界里,...
2020-04-14 15:59:53 -
7种预测性存储分析工具的比较
日立、Infinidat、Pure Storage和其他存储供应商的存储管理工具采用人工智能技术来提高阵列操作和存储管理效率,为此将对这些供应商提供的...
2020-04-13 12:46:31 -
疫情下中小学在线教育画像:超七成学生使用智能手机
数据挖掘 疫情下的中小学在线教育大数据画像 疫情是块试金石。面对突如其来的新冠肺炎疫情,亿万学生开展大规模在线教育。这是我国教...
2020-04-13 12:17:32 -
10W+ K8s容器数量下,携程如何打造统一弹性调度体
携程K8s容器服务承载着各BU的核心业务,容器数量超过10W,并仍然以每年数倍的速度增长。调度体系也经历了从Mesos上的自研调度器到K8s fo...
2020-04-13 12:17:18 -
中台翻车纪实:一年叫停,员工转岗被裁,资源
正值 2016 年“直播元年”,在短视频风口上,国内某大集团开始调动各业务线的精兵强将,组建新的业务单元,以“业务中台”的形式集合...
2020-04-13 12:16:10 -
Apache Doris在美团外卖数仓中的应用实践
业务团队日常经营分析最典型的场景就是各种维度下的自定义查询,面对如此灵活可变、所见即所得的应用场景,美团平台使用Kylin作为公司...
2020-04-11 00:07:03 -
Serverless 的喧哗与骚动
Serverless 和很多词如微服务一样,是没有精确定义的,也没有事实的标准。什么是事实标准?Kubernetes 是事实标准;对 Java 程序员来说 Sprin...
2020-04-09 23:24:52 -
聊聊分布式事务,再说说解决方案
分布式事务是企业集成中的一个技术难点,也是每一个分布式系统架构中都会涉及到的一个东西,特别是在微服务架构中,几乎可以说是无...
2020-04-09 23:24:34 -
Python-Cartopy包: 地理空间数据可视化
Cartopy 是为了向 Python 添加地图制图功能而开发的扩展库。该项目致力于以 matplotlib 包为基础,用简单直观的方式操作各类地理要素的成图。...
2020-04-08 14:35:06 -
用漫画了解 Linux 内核到底长啥样!
这幅漫画是以一个房子的侧方刨面图来绘画的。使用这样的一个房子来代表 Linux 内核。作为一个房子,最重要的莫过于其地基,在这个图片...
2020-04-08 14:32:16 -
选Python还是选Java?2020年,顶尖程序员最应该掌握的7种编程语言
哪种编程语言最好?这个问题可能永远不会有答案。萝卜白菜,各有所爱,AI 工程师和科学家可以根据项目需要,从众多编程语言中选择最...
2020-04-07 10:55:46 -
RabbitMQ与Kafka的技术差异以及使用注意点
RabbitMQ是一个消息代理,但是Apache Kafka是一个分布式流式系统。好像从语义上就可以看出差异,但是它们内部的一些特性会影响到我们是否能...
2020-04-01 17:48:19 -
core-js 作者入狱 18 个月,2600 万次周下载的开源项
一位彪悍的俄罗斯程序员,名字叫丹尼斯·普什卡列夫(Denis Pushkarev),平时爱好就是飙摩托车。在一次事故中,他以 60 km/h的速度驾驶,结...
2020-03-31 23:22:31