五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

陈意辉的第三次作业

陈意辉的第三次作业

习题1: **1.初始化一个数据集,包括5-10位同学的成绩数据(数据类型不限),数据格式如下: **学号 姓名 Java C语言 Python2017...

OpenCV-Python:形态学操作

OpenCV-Python:形态学操作

常用的形态学操作:腐蚀、膨胀、开运算和闭运算   一、什么叫形态学操作 形态学操作就是改变物体的形状,比如腐蚀就是"变瘦",膨胀就是"变胖"...

python扩展

python扩展

补充一些有趣的知识   1. sys模块方法的补充,打印进度条 import sys,time for i in range(20)...

python爬虫爬取赶集网数据

python爬虫爬取赶集网数据

一.创建项目 scrapy startproject putu 二.创建spider文件 scrapy genspider  patubol...

python 多进程的两种创建方式

python 多进程的两种创建方式

Python中使用线程有两种方式:函数或者用类来包装线程对象。 第一种---------函数 菜鸟教程的我没看懂,说说我自己懂的----看视频理解的...

第三次python作业

第三次python作业

第一题: import random#初始化No=[]Javaaverage=[]Caverage=[]Pythonaverage=[]Average...

selenium中webdriver跳转新页面后定位置新页面的两种方式

selenium中webdriver跳转新页面后定位置新页面的两种方式

刚刚在写Python爬虫的时候用到了selenium , 在跳转新页面时发现无法定位新页面 , 查找不到新页面的元素  一番查询后得到了解决方法...

python中的一切皆对象

python中的一切皆对象

1、函数和类是对象,是Python中的一级公民 (1)将函数和类赋值给一个变量 将函数或类赋值给一个变量,就可以把该变量当成函数或类来使用 1 d...

小项目一---Python日志分析

小项目一---Python日志分析

日志分析 概述   分析的前提 半结构化数据 文本分析  提取数据  一、空格分隔 with o...

virtualenv安装及使用

virtualenv安装及使用

环境 Windows 10 python 3.6.7 安装 virtualenv用于创建虚拟环境,用于隔离不同的python版本的运行,...

爬虫笔记(二)

爬虫笔记(二)

目录 lxml库 基本使用 读取HTML的文档 爬取豆瓣热门电影实例 爬取电影天堂资源实例 B...

Python——爬取百度百科关键词1000个相关网页

Python——爬取百度百科关键词1000个相关网页

Python简单爬虫——爬取百度百科关键词1000个相关网页——标题和简介       网站爬虫由浅入深:慢慢来 &...

User Login