五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

《奋斗吧!菜鸟》第四次作业:项目需求调研与分析

《奋斗吧!菜鸟》第四次作业:项目需求调研与分析

项目 内容 这个作业属于哪个课程 任课教师链接 作业要求 h...

祘头君的字符(DFS)

祘头君的字符(DFS)

一、题目 有n名选手在玩游戏,他们每个人有一个字符,每个字符都有自己固定的若干个特征。特征的种类数为k。每个人的特征为特征总集的一个子集。 两个字符的相似...

分治法求众数

分治法求众数

一组数据中,出现次数最多的数就叫这组数据的众数。 如果有两个或两个以上个数出现次数都是最多的,那么这几个数都是这组数据的众数。 如果所有数据出现的次数都一样...

shuffle调优

shuffle调优

目录 一、概述 二、shuffle的定义 三、ShuffleMananger发展概述 四、HashShuffleManager的运行原理...

抽象类的运用

抽象类的运用

package 抽象类运用; abstract class MyShape{  String name;  public&nbs...

动态规划之背包问题

动态规划之背包问题

背包问题泛指以下这一种问题: 给定一组有固定价值和固定重量的物品,以及一个已知最大承重量的背包,求在不超过背包最大承重量的前提下,能放进背包里面的物品的最大...

foreachRDD

foreachRDD

需求: 将统计结果写入到MySQL create table wordcount( word varchar(50) default null,...

Comet OJ - Contest #2 B 她的想法、他的战斗(概率 + 数学)

Comet OJ - Contest #2 B 她的想法、他的战斗(概率 + 数学)

题目描述   Takuru 是一名情报强者,所以他想利用他强大的情报搜集能力来当中间商赚差价。 Takuru 的计划是让 Hinae 帮他去...

anyproxy学习1-windows平台安装和抓手机app上https请求

anyproxy学习1-windows平台安装和抓手机app上https请求

前言 做接口测试肯定离不开抓包,目前比较流行的抓包工具是fiddler和charles,相信并不陌生。这里介绍一个阿里公司研发的一个抓包神器,只需打开we...

Hive的数据倾斜

Hive的数据倾斜

目录 什么是数据倾斜 Hadoop框架的特性 主要表现 容易数据倾斜的情况 产生数据清洗的原因 业务场景 空值产...

SparkStreaming实战(数据库(NoSQL))

SparkStreaming实战(数据库(NoSQL))

完全搞清楚项目需求,思考项目选项,这块就是使用的是数据库,就是HBase,因为它里面有一个非常合适的API,直接调用,即可 功能一: 今天到现在为止...

pexpect &&pxssh

pexpect &&pxssh

python 3.6 pip  install pexpect [root@hostuser src]# vi pexpect_ssh.py...

User Login