五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

Win10 在 CUDA 10.1 下跑 TensorFlow 2.x

Win10 在 CUDA 10.1 下跑 TensorFlow 2.x

深度学习最热的两个框架是 pytorch 和 tensorflow,pytorch 最新版本是 1.3,tensorflow ...

Keras的TimeDistributed层

Keras的TimeDistributed层

Keras的TimeDistributed层主要用途是在时间维度上进行全连接. 比如Faster RCNN,1张图生成了16个ROI,需要对每一...

机器学习中的特征工程学习

机器学习中的特征工程学习

1. 机器学习的定义 数据 自动分析获取数据 对未知数据仅需预测 2.特征工程意义 意义:会直接的影响机器学习的效果 作用...

Pandas 性能优化 学习笔记

Pandas 性能优化 学习笔记

摘要 本文介绍了使用 Pandas 进行数据挖掘时常用的加速技巧。 实验环境 import numpy as np import pandas as...

机器学习 - Python 02

机器学习 - Python 02

好了,咱们接着上一节的内容,继续学习机器学习中的Python语法部分。这一节算是Python语法的最后一节了。也就是说如果真的看懂了这两节的内容,理论上说就...

自然语言处理学习笔记之一:概要

自然语言处理学习笔记之一:概要

一、自然语言处理的对象:文字(信息来源:图象、语音和文字)。 二、先修课程: 数学分析 概率论与数理统计 线向代数 解析几何 数据...

Deep Clustering Algorithms,深度自编码器(Deep Autoencoder)MATLAB解读

Deep Clustering Algorithms,深度自编码器(Deep Autoencoder)MATLAB解读

Deep Clustering Algorithms 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaj...

贝叶斯决策理论(1)

贝叶斯决策理论(1)

  数据来自于一个不完全清楚的过程。以投掷硬币为例,严格意义上讲,我们无法预测任意一次投硬币的结果是正面还是反面,只能谈论正面或反面出现的概率。在投掷过程中...

指环扫描方案的优势和设备选择指引

指环扫描方案的优势和设备选择指引

   在仓储物流、快递等行业的互联网化的过程中,数据终端(PDA)数据终端(PDA)扮演了不可或缺的重要作用,随着行业的发展,传统的手机数据终端的...

虚拟对抗训练(VAT):一种用于监督学习和半监督学习的正则化方法

虚拟对抗训练(VAT):一种用于监督学习和半监督学习的正则化方法

正则化   虚拟对抗训练是一种正则化方法,正则化在深度学习中是防止过拟合的一种方法。通常训练样本是有限的,而对于深度学习来说,搭设的深度网络是可以最大限度...

高德网络定位算法的演进

高德网络定位算法的演进

1.导读GPS定位精度高,且早已成为移动设备标配,但GPS也具有一些难以克服的缺陷,包括: 冷启动时间长。GPS启动时,需要进行搜星,锁定卫星信号,...

TensorFlow2.0(12):模型保存与序列化

TensorFlow2.0(12):模型保存与序列化

  注:本系列所有博客将持续更新并发布在github上,您可以通过github下载...

User Login