五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

[LeetCode] 4. 寻找两个有序数组的中位数

[LeetCode] 4. 寻找两个有序数组的中位数

题目链接:https://leetcode-cn.com/problems/median-of-two-sorted-arrays/ 题目描述: 给定两...

数据规范化

数据规范化

数据规范化就是消除量纲的影响,这点很重要。   对算法的作用 在以梯度和矩阵为核心的算法中,譬如逻辑回归、神经网络、svm,规范化能加快求解...

西瓜书课后习题——第二章

西瓜书课后习题——第二章

2.1 数据集包含500正例和500反例,按照70%的比例划分训练集和验证集,则验证集需要有150个正例、150个反例, 则共有$  \lef...

快手春招实习笔试题(4.13)(非自己做)

快手春招实习笔试题(4.13)(非自己做)

1. 2.  3.      算法岗 1.     &nb...

群论初步

群论初步

前言 orz毒瘤出题人zjt 网上群论的博客太少了,于是只能自己写一写了TAT~ 群的定义与基本性质 群(G,·)(通常简记为群G)由集合G和运算·...

排序算法总结

排序算法总结

  冒泡排序:   冒泡排序是相邻两节点进行比较,大的向后移一个,经过第一轮两两比较和移动,最大的元素移动到了最后,第二轮次大的位于倒数第二个,依次进行。...

ES 17 - (底层原理) Elasticsearch增删改查索引数据的过程

ES 17 - (底层原理) Elasticsearch增删改查索引数据的过程

目录 1 增删改document的流程 1.1 协调节点 - Coordinating Node 1.2 增删改docum...

Restful levels层级 和HATEOAS原则

Restful levels层级 和HATEOAS原则

Restful levels: 要知道API的哪个级别,Richardson引入了一个名为Richardson Maturity Model的模...

[GZOI2019&GXOI2019]省选AFO记

[GZOI2019&GXOI2019]省选AFO记

GZOI=贵州OI PS:今天(4.14)14:00 Content Hunter上有DAY1模拟赛,有兴趣的可以参加一下(来虐场)啊QWQ \(DAY...

并查集平摊代价分析

并查集平摊代价分析

并查集平摊代价分析 1.并查集链表(Linked-list representation of disjoint sets) 1.1 最糙的链表 链表...

基于用户协同过滤--UserCF

基于用户协同过滤--UserCF

UserCF  本系列文章主要介绍推荐系统领域相关算法原理及其实现。本文以项亮大神的《推荐系统实践》作为切入点,介绍推荐系统最基础的算法(可能也是最好用的...

一个免费ss网站的数据爬取过程

一个免费ss网站的数据爬取过程

  引言 爬虫整体概况 主要功能方法 绕过DDOS保护(Cloudflare) post中参数a,b,c的解析...

User Login