五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

欠拟合和过拟合学习笔记

欠拟合和过拟合学习笔记

  欠拟合和过拟合学习笔记   https://blog.csdn.net/u012535605/article/details/...

缓存反向代理-Varnish

缓存反向代理-Varnish

简介 Varnish是一款高性能、开源的缓存反向代理服务器。它从客户端接受请求,并尝试从缓存中响应请求,如果无法从缓存中提供响应,Varnish 向后端服...

MYSQL基本操作(上)

MYSQL基本操作(上)

很久之前,就想做个Mysql的小结,毕竟数据库知识是软件研发的基本技能,这里话不多说,开始总结一波。 数据库基本概念   数据库为高效的存储和处理数据的...

月薪30-50K的大数据工程师们,他们背后是如何学习的

月薪30-50K的大数据工程师们,他们背后是如何学习的

  ​ 这两天小编去了解了下大数据开发相关职位的薪资,主要有hadoop工程师,数据挖掘工程师、大数据算法工程师等,从平均薪资来看,目前大数据...

特征工程的概述

特征工程的概述

在建立模型的时候,最终是希望模型有较好的预测能力,但是在另一方面,也希望模型不要太复杂,以至于能有较好的解释性和适用性。 1、定义 定义:在机器学习或者...

深度学习新星:GAN的基本原理、应用和走向

深度学习新星:GAN的基本原理、应用和走向

深度学习新星:GAN的基本原理、应用和走向     (本文转自雷锋网,转载已获取授权,未经允许禁止转载)原文链接:http://w...

使用Scala开发Apache Kafka的TOP 20大好用实践

使用Scala开发Apache Kafka的TOP 20大好用实践

    本文作者是一位软件工程师,他对20位开发人员和数据科学家使用Apache Kafka的方式进行了最大限度得深入研究,最终...

想从事数据科学相关岗位,这些数学基础“必备”

想从事数据科学相关岗位,这些数学基础“必备”

    很多同学想从事数据科学岗位,对于这个岗位而言,数学知识的储备重要吗? 答案显而易见,掌握好数学对于从事该岗位而言是很重...

linux内核调优参考

linux内核调优参考

对于新部署的机器,需要做一些基本的调优操作,以更改一些默认配置带来的性能问题 1 修改打开文件数   root@mysql:/data/too...

Linux:Gentoo系统的安装笔记(一)

Linux:Gentoo系统的安装笔记(一)

          这次我选择安装Gentoo,用来做我学习的笔记。这次我是使用虚拟机安装Gentoo,一...

寻找“最好”(6)——心的距离

寻找“最好”(6)——心的距离

   “距离”这个词经常在用到,在初中几何上,它指两点间直线的长度,想要测量它很容易,然而果真如此吗?乘坐出租车从家到公司,下车后计价表显示30公...

机器学习核心算法之——贝叶斯方法

机器学习核心算法之——贝叶斯方法

贝叶斯方法 1.贝叶斯公式 贝叶斯公式已经成为机器学习的核心算法之一,诸如拼写检查、语言翻译、海难搜救、生物医药、疾病诊断、邮件过滤、文本分类、侦破案...

User Login