五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

python中OS模块的使用

python中OS模块的使用

OS模块是python中用来对目录操作的一个模块。 基本函数如下: os.mkdir():创建一个目录;os.makedirs():创建多层目录。...

selenium + geckodriver报 Message: Unable to find a matching set of capabilities

selenium + geckodriver报 Message: Unable to find a matching set of capabilities

软件版本 selenium:3.141.0 geckodriver:0.26.0 firefox:firefox-75.0. 网上搜索资料都说是driver...

【Django 2.2文档系列】Model 外键中的on_delete参数用法

【Django 2.2文档系列】Model 外键中的on_delete参数用法

场景 我们用Django的Model时,有时候需要关联外键。关联外键时,参数:on_delete的几个配置选项到底是干嘛的呢,你知道吗? 参数介绍...

【2020Python修炼记】python并发编程(八)IO模型

【2020Python修炼记】python并发编程(八)IO模型

【目录】 一 IO模型介绍 二 阻塞IO(blocking IO) 三 非阻塞IO(non-blocking IO) 四 多路复用IO...

Python制作新冠疫情世界地图

Python制作新冠疫情世界地图

目录 pyecharts模块 简介 Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Py...

如何优化Python占用的内存,面试必学

如何优化Python占用的内存,面试必学

概述 如果程序处理的数据比较多、比较复杂,那么在程序运行的时候,会占用大量的内存,当内存占用到达一定的数值,程序就有可能被操作系统终止,特别是在限制程...

Python爬虫篇(代理IP)--lizaza.cn

Python爬虫篇(代理IP)--lizaza.cn

    在做网络爬虫的过程中经常会遇到请求次数过多无法访问的现象,这种情况下就可以使用代理IP来解决。但是网上的代理IP要么收费,要么没...

Flask基础知识

Flask基础知识

简介: Flask基于python开发并依赖于jinjia2和werkzeug WSGI服务一个微型框架. Werkzeug本质是Socket服务端,用...

Python爬虫-有道翻译

Python爬虫-有道翻译

有道翻译爬虫实现   POST请求: #有道翻译爬虫 from urllib import request import urllib import...

python数据处理的小技巧 超详细 附代码

python数据处理的小技巧 超详细 附代码

      首先祝大家劳动节快乐! 五一劳动节快乐 面对目前的就业情况,自己没有点真本事还真的走不通道,数据...

二、Python爬虫-urllib库数据挖掘

二、Python爬虫-urllib库数据挖掘

使用urllib库数据挖掘 第一个爬虫程序 import re from urllib import request #直接使用request中...

Python3的这些新特性很方便,新手必学

Python3的这些新特性很方便,新手必学

概述   随着Python在机器学习和数据科学领域的应用越来越广泛,相关的Python库也增长的非常快。但是Python本身存在一个非常要命的问题,就...

User Login