五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

HDFS详解

HDFS详解

  课程大纲(HDFS详解) Hadoop HDFS 分布式文件系统DFS简介...

大数据开发主战场hive (企业hive应用)

大数据开发主战场hive (企业hive应用)

hive在大数据套件中占很的地位,分享下个人经验。 1.在hive日常开发中,我们首先面对的就是hive的表和库,因此我要先了解库,表的命名规范和原则...

IDEA远程连接Hadoop

IDEA远程连接Hadoop

IDEA远程连接Hadoop Win 1.Hadoop配置 下载并配置到本地环境 HADOOP_HOME D:\Tools\hadoop-2.7.7...

wordcount计数

wordcount计数

1.在根目录下创建一个写入文件   2.在hdfs上创建文件夹 3.将写入文件放入文件夹 4.进入mapreduce目录下...

hadoop过程中遇到的错误与解决方法

hadoop过程中遇到的错误与解决方法

本文整理了在hadoop学习过程中遇到的各种问题。 windows下开发环境搭建 大部分情况下,我们都是在windows下开发,hadoop则一般部署于...

Hadoop基础-安装2.7.2

Hadoop基础-安装2.7.2

准备工作 1.修改主机名和ip地址 1 vi /etc/sysconfig/network //修改主机名 2 或vi /etc/hostname...

大规模数据传输,知易行难 — 数据传输与 ETL 平台的架构演进

大规模数据传输,知易行难 — 数据传输与 ETL 平台的架构演进

本文首发于 vivo 互联网技术微信公众号 (https://mp.weixin.qq.com/s/EBaUiMim6LjVHQy2-dCDOg)&n...

hive元数据

hive元数据

本文介绍Hive元数据库中一些重要的表结构及用途,方便Impala、SparkSQL、Hive等组件访问元数据库的理解。 1、存储Hive版本的元数据表(...

HDFS-Shell 文件操作

HDFS-Shell 文件操作

一、操作 HDFS 上的文件有两个命令可以用 hdfs dfs:只能操作 HDFS 上的文件 Usage: hdfs [--config c...

hadoop:如何运行自带wordcount

hadoop:如何运行自带wordcount

https://www.cnblogs.com/xiaomila-study/p/4973662.html  ...

hadoop集群部署上后,在服务器中运行hadoop自带的jar包中的实例报错

hadoop集群部署上后,在服务器中运行hadoop自带的jar包中的实例报错

  异常一:2018-01-09 03:25:37,250 INFO mapreduce.Job: Job job_1515468264727_...

HDFS 概述

HDFS 概述

定义 HDFS(Hadoop Distributed File System)是分布式文件管理系统中的一种,用来管理多台机器上的文件,通过目录树来定位文...

User Login