五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...

OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...

亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程...

HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...

Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...

Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...

hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...

可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...

Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...

机器学习-支持向量机SVM

机器学习-支持向量机SVM

简介: 支持向量机(SVM)是一种二分类的监督学习模型,他的基本模型是定义在特征空间上的间隔最大的线性模型。他与感知机的区别是,感知机只要找到可以将数据正...

CVPR-2018 那些有趣的新想法

CVPR-2018 那些有趣的新想法

Taylor Guo @ Shanghai - 2018.10.18  缘起 还有什么比顶级会议更适合寻找有趣新想法的地方吗?我们从CVPR...

2019年机器学习:追踪人工智能发展之路

2019年机器学习:追踪人工智能发展之路

2019年机器学习:追踪人工智能发展之路   https://mp.weixin.qq.com/s/HvAlEohfSEJMzRkH3zZtl...

数据分析师:大数据建模,你需要了解九大形式

数据分析师:大数据建模,你需要了解九大形式

数据挖掘是利用业务知识从数据中发现和解释知识的过程,这种知识是以自然或者人工形式创造的新知识。 第一,目标律:业务目标是所有数据解决方案的源头。 &nb...

人工智能AI芯片与Maker创意接轨(下)

人工智能AI芯片与Maker创意接轨(下)

继「人工智能AI芯片与Maker创意接轨」的(上)篇中,认识了人工智能、深度学习,以及深度学习技术的应用,以及(中)篇对市面上AI芯片的类型及解决方案现况做...

特征组合

特征组合

图1. 线性问题 对于图1,可以画一条线将黄点和蓝点分开,这是个线性问题,这条线并不完美,有一两个蓝点可能落在了黄点的一侧,但画的这条线可以很好地做出...

特征工程

特征工程

特征工程指的是将原始数据转换为特征矢量。 机器学习模型通常期望样本表示为实数矢量。这种矢量的构建方法如下:为每个字段衍生特征,然后将它们全部连接到一起。...

人工智能AI芯片与Maker创意接轨 (中)

人工智能AI芯片与Maker创意接轨 (中)

在人工智能AI芯片与Maker创意接轨(上)这篇文章中,介绍人工智能与深度学习,以及深度学习技术的应用,了解内部真实的作业原理,让我们能够跟上这波AI新浪潮...

什么是pytorch(3神经网络)(翻译)

什么是pytorch(3神经网络)(翻译)

神经网络 torch.nn 包可以用来构建神经网络。 前面介绍了 autograd包, nn 依赖于 autograd 用于定义和求导模型。 nn.Mo...

TensorFlow学习之路1-TensorFlow介绍

TensorFlow学习之路1-TensorFlow介绍

TensorFlow是一个采用数据流图(data flow graphs),用于数据计算的开源软件库。 什么是数据流图? TensorFlow的数据流图...

数据分析

数据分析

数据分析作用 在商业领域中,进行数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的...

解决CUDA driver version is insufficient for CUDA runtime version

解决CUDA driver version is insufficient for CUDA runtime version

问题 在服务器上安装mxne的GPU版本 sudo pip install mxnet-cu80==1.2.1 然后在gpu上创建数据 import...

User Login