五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

Hadoop2.7.6_03_HDFS原理

Hadoop2.7.6_03_HDFS原理

  1. HDFS前言 l  设计思想   分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海...

【JVM】TroubleShooting之内存溢出异常(OOM)与调优

【JVM】TroubleShooting之内存溢出异常(OOM)与调优

1. OOM概述     If your application's execution time becomes...

Hadoop2.7.6_02_HDFS常用操作

Hadoop2.7.6_02_HDFS常用操作

  1. HDFS常用操作 1.1. 查询 1.1.1.  浏览器查询   1.1.2. 命令行查询 [yu...

在CentOS 7上搭建Docker环境

在CentOS 7上搭建Docker环境

  Preface       We commonly use VMware or Vi...

ML(3)——线性回归,ML(附录2)——最小二乘法

ML(3)——线性回归,ML(附录2)——最小二乘法

   在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一...

分布式平台搭建

分布式平台搭建

分布式平台搭建 acmore 2018.6.17 1. 搭建Hadoop 以下操作皆基于Ubuntu 16.04 32位环境 &a...

数据库Mysql的学习(三)-各种约束

数据库Mysql的学习(三)-各种约束

删除数据库表 drop table [if exists] 表一,表二.....; 表分区:比如图书信息表有1000万个图书信息,如何优化他,其中一种方...

什么叫大数据 大数据的概念

什么叫大数据 大数据的概念

  1、大数据定义  对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具...

项目微管理23 - 会议

项目微管理23 - 会议

对于开会,留在四代心中是截然相反的两种印象:一种是能帮助解决问题,而另外一种是浪费时间。   之所以出现这种情况,是因为四代经历过的一部分...

mysql与Oracle的区别

mysql与Oracle的区别

  一、并发性   并发性是oltp数据库最重要的特性,但并发涉及到资源的获取、共享与锁定。   mysql:...

监督学习——AdaBoost元算法提高分类性能

监督学习——AdaBoost元算法提高分类性能

基于数据的多重抽样的分类器 可以将不通的分类器组合起来,这种组合结果被称为集成方法(ensemble method)或者元算法(meta-algorith...

JIRA笔记(一):安装部署JIRA

JIRA笔记(一):安装部署JIRA

(一)     说明 说明JIRA的安装及破解。 操作系统:WIN 10 数据库:Oracle 12C R2(...

User Login