五分钟轻松了解Hbase面向列的存储

[置顶] 五分钟轻松了解Hbase面向列的存储

说明:从严格的列式存储的定义来看,Hbase并不属于列式存储,有人称它为面向列的存储,请各位看官注意这一点。 行式存储 传统的数据库是关...
OpenTSDB/HBase的调优过程整理

[置顶] OpenTSDB/HBase的调优过程整理

背景 过年前,寂寞哥给我三台机器,说搞个新的openTSDB集群。机器硬件是8核16G内存、3个146G磁盘做数据盘。 我说这太抠了,寂寞哥说之前的TS...
亿级 ELK 日志平台构建部署实践

[置顶] 亿级 ELK 日志平台构建部署实践

本篇主要讲工作中的真实经历,我们怎么打造亿级日志平台,同时手把手教大家建立起这样一套亿级 ELK 系统。日志平台具体发展历程可以参考上篇 「从 ELK 到...
HBase数据压缩编码探索

[置顶] HBase数据压缩编码探索

摘要: 本文主要介绍了hbase对数据压缩,编码的支持,以及云hbase在社区基础上对数据压缩率和访问速度上了进行的改进。前言你可曾遇到这种需求,...
Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

[置顶] Ambari2.7.3 和HDP3.1.0搭建Hadoop集群

一、环境及软件准备 1、集群规划...
Ambari2.6.2 HDP2.6.5 大数据集群搭建

[置顶] Ambari2.6.2 HDP2.6.5 大数据集群搭建

Ambari 2.6.2 中 HDFS-2.7.3 YARN-2.7.3 HIVE-1.2.1 HBASE-1.1.2 ZOOKEEPER-3.4.6 SP...
hadoop-2.7.7 HA完全分布式集群部署详解

[置顶] hadoop-2.7.7 HA完全分布式集群部署详解

1.Hadoop HA简介及工作原理Hadoop NameNode官方开始支持HA集群默认是从2.0开始,之前的版本均是不支持NameNode HA的高可用...
可怕的黑暗料理之暗黑谷歌搜索神器

[置顶] 可怕的黑暗料理之暗黑谷歌搜索神器

1.暗黑谷歌的由来 有这么一款搜索引擎,它一刻不停的在寻找着所有和互联网关联的PLC、摄像头、红绿灯、打印机、路由器、交换机、服务器、数据库等等各种软硬件...
Oracle12c跨平台迁移之linux至windows

[置顶] Oracle12c跨平台迁移之linux至windows

近期应朋友邀请协助处理一起oracle数据库跨平台迁移的项目,需求为迁移centos 7.2 linux的oracle12.2数据库至windo...
PyTorch实现TPU版本CNN模型

PyTorch实现TPU版本CNN模型

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 随着深度学习模型在各种应用中的成功实施,现在是时候获得...
C++机器学习库介绍

C++机器学习库介绍

作者|ALAKH SETHI 编译|VK 来源|Analytics Vidhya 介绍 我喜欢使用C++。C++是我学习过的第一种编程语言,我喜欢在机器...
假设检验:使用p值来接受或拒绝你的假设

假设检验:使用p值来接受或拒绝你的假设

作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 检验是统计学中最基本的概念之一。不仅在数据科学中,假设检验在各个领域都很...
使用python脚本统一重命名训练图片文件名

使用python脚本统一重命名训练图片文件名

  Yolo算法,在进行模型训练时,常常使用VOC数据格式。   将图片文件复制到JPEGImages目录下,需要对文件名进行VOC标准格式编号重命名,如...
生成流畅文本方法

生成流畅文本方法

作者|Aaron Abrahamson 编译|VK 来源|Towards Data Science 在沙丘魔堡2000上训练文本生成模型 沙丘魔堡是一个...
KNNImputer:一种可靠的缺失值插补方法

KNNImputer:一种可靠的缺失值插补方法

作者|KAUSHIK 编译|VK 来源|Analytics Vidhya 概述 学会用KNNImputer来填补数据中的缺失值 了解缺失...
SparseNN中的优化

SparseNN中的优化

作者|The AI LAB 编译|VK 来源|Medium 对SparseNN模型的过拟合进行研究,并探索了多种正则化方法,如嵌入向量的max-norm/...
基于TorchText的PyTorch文本分类

基于TorchText的PyTorch文本分类

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 文本分类是自然语言处理的重要应用之一。在机器学习中有多...
蒙特卡洛方法分析Web页面浏览量

蒙特卡洛方法分析Web页面浏览量

作者|Michael Grogan 编译|VK 来源|Towards Data Science 蒙特卡洛这种方法在金融等领域得到了广泛的应用,以便对各种风...
PyTorch实现用于文本生成的循环神经网络

PyTorch实现用于文本生成的循环神经网络

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag 自然语言处理(NLP)有很多有趣的应用,文本生成就是其...
使用微软Power BI进行时间序列预测

使用微软Power BI进行时间序列预测

作者|GUEST 编译|VK 来源|Analytics Vidhya 介绍 时间序列预测是机器学习的一个非常重要的领域,因为它让你能够提前“预见”并...
深度学习及pytorch基础

深度学习及pytorch基础

【任务一】视频学习心得及问题总结 根据下面三个视频的学习内容,写一个总结,最后列出没有学明白的问题。 【任务二】代码练习 在谷歌 Colab 上完成代...

User Login