2019-4(2)-数据挖掘学习笔记 随笔 第1张第一章 走进数据科学

数据挖掘技术:

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

1、分类-classfication

overfitting:

2019-4(2)-数据挖掘学习笔记 随笔 第2张

 

最常用算法:knn、Decision Tress2019-4(2)-数据挖掘学习笔记 随笔 第3张

confusion Matrix

2019-4(2)-数据挖掘学习笔记 随笔 第4张2019-4(2)-数据挖掘学习笔记 随笔 第5张

 

Receiver Operating Cjaracterostic   

2019-4(2)-数据挖掘学习笔记 随笔 第6张

auc值(0-1之间,越大越好)

2、聚类-clusterinng

最常用算法:K-Means

特殊的聚类:Hierarchical clustering 

2019-4(2)-数据挖掘学习笔记 随笔 第7张

 

3、关联规则-Association Rule

2019-4(2)-数据挖掘学习笔记 随笔 第8张

 

特点:强应用型

4、回归-Regression

overfitting问题:

 2019-4(2)-数据挖掘学习笔记 随笔 第9张

 

数据挖掘-Data preprocessing

G.I.G.O.

2019-4(2)-数据挖掘学习笔记 随笔 第10张

 

Internet Privacy --privacy protection

例子(吸毒调查问卷填写):

 2019-4(2)-数据挖掘学习笔记 随笔 第11张

 

Cloud Computing 

PAYG:saas  paas  issa

 2019-4(2)-数据挖掘学习笔记 随笔 第12张

 

Parallel Computing 

cpu + gpu   产品:Mobile superComputing(invidia TK1)  

 

 

 注意事项:

数据、算法、计算工具缺一不可。

尝试用简单的模型,如knn + k-menas+Linear

有没有规律可挖掘,别做无用功(如彩票预测)

不要犯盲人摸象的错误。

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄