FM（Factorization Machines）

佚名 7年前 (2019-04-16) 随笔 732人围观抢沙发百度已收录

摘自

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

一、FM简介

1、FM又叫因子分解机。被广泛应用到广告点击中，跟LR相比，效果据说是强了不少。这个个人觉得还是利用数据集测试下比较靠谱。其主要解决的问题是当数据比较稀疏的时候，特征组合的问题。

2、以一个广告点击的例子。特征如下图所示

One hot编码后的特征如下图所示

当类型值特别多的时候，One-hot的特征量就会变得特别大。有些互联网特征有上亿纬就是这么来的。采用FM可以很好的学习这些特征之间的关系。

FMs allow parameter estimation under very sparse data where SVMs fails.
FMs have linear complexity, can be optimized in the primal and do not rely on support vectors like SVMs.
FMs are a general predictor that can work with any real valued feature vector. In contrast to this, other state-of-the-art factorization models work only on very restricted input data.