五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

对线性回归算法的评测

对线性回归算法的评测

一:三种方式   a.均方误差(MSE)   b.均方根误差(RMSE)   c.平均绝对误差(MAE) 二:评测公式   均方误差:对(y_te...

34. Find First and Last Position of Element in Sorted Array

34. Find First and Last Position of Element in Sorted Array

1. 原始题目 给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。...

经典Hash函数的实现

经典Hash函数的实现

Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间,使得数据容易保存。 除此以外,Hash函数往往应用于查找上...

Dijkstra算法——计算一个点到其他所有点的最短路径的算法

Dijkstra算法——计算一个点到其他所有点的最短路径的算法

迪杰斯特拉算法百度百科定义:传送门 gh大佬博客:传送门 迪杰斯特拉算法用来计算一个点到其他所有点的最短路径,是一种时间复杂度相对比较优秀的算法 O(n...

Google开源软负载seesaw

Google开源软负载seesaw

https://github.com/google/seesaw  ------------------------ 在分布式系统中,负载均衡...

学习参考《深度实践Spark机器学习》PDF+吴茂贵

学习参考《深度实践Spark机器学习》PDF+吴茂贵

研究大数据和数据挖掘的都知道,并行化算法研究是大数据领域一个较为重要的研究热点。近年来国内外开始关注在 Spark 平台上如何实现各种机器学习和数据挖掘并行...

图的表示及搜索算法

图的表示及搜索算法

1.图的表示方法 图:G=(V,E),V代表节点,E代表边。 图有两种表示方法:邻接链表和邻接矩阵 邻接链表因为在表示稀疏图(边的条数|E|远远...

consul 集群

consul 集群

   本文主要讲述如何搭建基于docker容器化的consul 搭建。相关consul是什么,用途,请参考consul 官网 ...

排序算法-综述

排序算法-综述

1、冒泡排序算法: 冒泡排序算法是最简单也是最基本的排序算法之一,算法的原理为如下: 原理:将数据当中的每一个元素与之后的元素进行对比,如果当前元素比序...

数据挖掘相关知识

数据挖掘相关知识

Association Rule(关联规则) (1)Support of an Itemset(支持项集) The support of an item...

深度学习之卷积神经网络(CNN)详解与代码实现(二)

深度学习之卷积神经网络(CNN)详解与代码实现(二)

                      &...

结巴分词 (转载)

结巴分词 (转载)

转自一个很不错的博客,结合自己的理解,记录一下。 作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007&nbs...

User Login