数据挖掘
-
Prometheus 踩坑集锦
监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计...
2020-06-27 23:52:49 -
史上最全的基站天馈知识
简而言之,频率越高,相同线型的百米损耗越大;线型越粗,各频段的损耗差越小。为了将直接安装在电缆上的“连接器”与直接安装在接...
2020-06-27 23:52:38 -
放弃 MBP 用 8GB 的树莓派4 工作一天,是这样的感
说了这么多,8GB 的树莓派 4 到底值不值得上手?作者给出的结论是:如果你想用它当通用电脑,那肯定是不行的。但对于一部分人来说,这...
2020-06-27 23:52:12 -
开源组件Flink性能优化之实时计算延迟填坑记
Flink具备高吞吐、低延迟、纯流式架构、支持对乱序事件的处理、有状态、高度灵活的窗口定制、失败恢复、故障转移、水平扩展、批处理、...
2020-06-27 23:51:47 -
Spark 3.0开发近两年终于发布,流、Python、SQL重大
Spark 诞生于加州大学伯克利分校的 AMPLab 实验室,该实验室致力于数据密集型计算的研究。AMPLab 研究人员与大型互联网公司合作,研究如何...
2020-06-27 23:51:37 -
Kubernetes与GlusterFS的爱恨情仇
Kubernetes,容器管理领域的领导者;GlusterFS,分布式文件系统的后起之秀,他们之间会擦出什么样的火花呢?用Kubernetes部署的应用可以分为无...
2020-06-21 17:53:50 -
如何干掉恶心的 SQL 注入?
JDBC,全称 Java Database Connectivity,是 Java 访问数据库的 API,不依赖于特定数据库 ( database-independent )。所有 Java 持久层技术都基于 JDBC。直接使...
2020-06-21 17:53:30 -
量子编程迎重大突破!量子计算机领域第一种高
在打造强大量子计算机方面,近期出现的一系列技术进步令人振奋。近日,苏黎世联邦理工学院的计算机科学家们又在编程语言领域取得重...
2020-06-21 17:53:18 -
我们为什么不用Kubernetes?
Kubernetes 是一个功能强大的 PaaS 工具包,具有许多安全相关的选项,可以支持各种部署场景。当它成为大家普遍认可的 PaaS 选项时,从安全的...
2020-06-21 17:52:19 -
Apache Spark 3.0.0 正式版终于发布了,重要特性全面
Apache Spark 3.0 增加了很多令人兴奋的新特性,包括动态分区修剪、自适应查询执行、加速器感知调度、支持 Catalog 的数据源API、SparkR 中的向...
2020-06-21 17:52:05 -
深度好文:Linux系统内存知识
Linux 内存是后台开发人员,需要深入了解的计算机资源。合理的使用内存,有助于提升机器的性能和稳定性。本文主要介绍Linux 内存组织结...
2020-06-21 17:51:37 -
微服务下数据一致性的几种实现方式
在介绍微服务下的数据一致性之前,先简单地介绍一下事务的背景。传统单机应用使用一个RDBMS作为数据源。应用开启事务,进行CRUD,提交...
2020-06-21 17:51:23 -
分析了上千张照片发现:R 语言程序员最快乐,
在 IT 的世界里,人们形成了很多种刻板印象,比如“PHP 是最差的编程语言”,或者“Python 只适合初学者”。所幸的是,我们可以通过 Git...
2020-06-21 17:51:10 -
终于搞懂了 TCP 的 11 种状态 ,太不容易了…
本来想写运维过程中,nginx 服务器中 time_wait 的相关测试及解决方法的,然后发现TCP 的状态需要先铺垫一下,于是就整理了这篇文章。网上...
2020-06-21 17:50:56 -
Python中那些低调有趣的模块
python语言上位成功的其中一个原因是其丰富的社区支持,不管你有什么奇奇怪怪的需求,大概率能在网上搜到一个库来便捷实现。这篇文章...
2020-06-21 17:50:37 -
一文弄懂 Gitflow、Github flow、Gitlab flow 的工作流
Git 作为一个源码管理系统,不可避免涉及到多人协作。协作必须有一个规范的工作流程,让大家有效地合作,使得项目井井有条地发展下去...
2020-06-21 17:50:12 -
用Prometheus监控K8S,目前最实用的部署方式都说全
Kubernetes使用Docker进行容器管理,如果说Docker和kubernetes的搭配是云原生时代的基石,那么Prometheus为云原生插上了飞翔的翅膀。随着云原生社...
2020-06-21 17:48:56 -
使用Kubernetes最常犯的10个错误
通常我们要么不设置CPU请求(request)要么将CPU请求设置得很低(这样我们就可以在每个节点上容纳很多Pod),因此节点的使用量会过大。在...
2020-06-21 17:48:22 -
一文搞懂什么是 vlan、三层交换机、网关、DNS、子
VLAN中文是“虚拟局域网”。LAN可以是由少数几台家用计算机构成的网络,也可以是数以百计的计算机构成的企业网络。VLAN所指的LAN特指使用...
2020-06-21 17:47:40 -
基准测试表明, Async Python 远不如同步方式
大多数人都知道 async Python 具有更高的并发性。这意味着对于常见的任务如动态网站或 Web API, async 性能更好。但遗憾的是,async 对于 Python...
2020-06-21 17:46:58 -
分布式锁用 Redis 还是 Zookeeper?
为什么用分布式锁?在讨论这个问题之前,我们先来看一个业务场景:系统A是一个电商系统,目前是一台机器部署,系统中有一个用户下订...
2020-06-21 17:38:54 -
新基建周期中,要让交通数字化成为长期发展引
多家研究机构的研究显示,交通行业正处于数字化转型的关键时期和拐点,未来几年将会呈现爆发式的发展...
2020-06-11 22:47:50 -
深度解读 Flink 1.11:流批一体 Hive 数仓
Flink 1.11 中流计算结合 Hive 批处理数仓,给离线数仓带来 Flink 流处理实时且 Exactly-once 的能力。另外,Flink 1.11 完善了 Flink 自身的 Filesystem...
2020-06-11 22:47:31 -
卧槽!红警代码竟然开源了!!!
有个项目偷偷爬上了热榜的位置,它就是:CnC_Remastered_Collection。这个可不是一般的项目,里面存放的,是由国外知名电子游戏公司 Electron...
2020-06-11 22:47:17 -
浅谈数据挖掘的基本概念及其最常用算法
当前,大数据的理论和应用正在国民经济和生活的各个领域如火如荼的进行。很多人对大数据的基本概念和特点已经有所了解,...
2020-06-04 23:48:17 -
阿里巴巴为什么不用 ZooKeeper 做服务发现?
站在未来的路口,回望历史的迷途,常常会很有意思,因为我们会不经意地兴起疯狂的念头,例如如果当年某事提前发生了,而另外一件事...
2020-06-04 23:15:05 -
交易、账务系统去 Oracle 经验
2013 年 5 月,支付宝最后一台小型机下线,去 “IOE” 取得里程碑进展。支付宝(以及后来的蚂蚁金服)走的是一条跟传统金融行业不同的分...
2020-06-04 23:14:56 -
终于有人把 HTTPS 原理讲清楚了!
大家可能都听说过 HTTPS 协议之所以是安全的是因为 HTTPS 协议会对传输的数据进行加密,而加密过程是使用了非对称加密实现。但其实,HT...
2020-06-04 23:14:46 -
GitHub告警:恶意软件正通过流行开源 IDE 攻击 J
3 月 9 日,GitHub 收到了安全研究员 JJ 发来的警告通知:“我发现了一组感染了恶意程序 Octopus Scanner 的开源库。”随后,GitHub 开始自查,在...
2020-06-04 23:14:36 -
HTTP/3 来了 !未来可期
随着网络技术的发展,1999 年设计的 HTTP/1.1 已经不能满足需求,所以 Google 在 2009 年设计了基于 TCP 的 SPDY,后来 SPDY 的开发组推动 SPDY 成为...
2020-06-04 23:14:24 -
Prometheus Metrics 设计的最佳实践和应用实例
Prometheus 是一个开源的监控解决方案,部署简单易使用,难点在于如何设计符合特定需求的 Metrics 去全面高效地反映系统实时状态,以助力故...
2020-06-04 23:14:11 -
Spark 3.0 自适应查询优化介绍,在运行时加速 Sp
多年以来,社区一直在努力改进 Spark SQL 的查询优化器和规划器,以生成高质量的查询执行计划。最大的改进之一是基于成本的优化(CBO,...
2020-06-04 23:14:01 -
Redis背后的故事
Redis已成为世界上最受欢迎的数据库之一,但当初正是因为Sanfilippo对数据库“缺乏经验”,使他敢于打破“良好”数据库工程的各种神圣规...
2020-06-04 23:13:48 -
美国拟5年内向AI、量子计算等投资千亿美元,「
近日,美国参议院民主党领袖Chuck Schumer提出《无尽前沿法案》(Endless Frontiers Act),拟在未来5年内向美国国家科学基金会投资1000亿美元,...
2020-05-30 22:56:39 -
K8s和YARN都不够好!全面解析Facebook自研流处理服
Facebook 在许多使用场景采用了分布式流处理,包括推荐系统、网站内容交互分析等,这些应用的大规模实时运行需要达成严格的 SLO。为此,...
2020-05-30 22:56:15