Bayesian Statistics for Genetics | 贝叶斯与遗传学
贝叶斯的思考逻辑十分接近人脑的思维;人脑的优势根本就不是计算,在纯数值计算方面,几十年前的计算器就已经秒杀人脑了。
人脑的核心能力就是推理,而记忆在推理中扮演了重要的角色,我们都是基于我们已知的常识来做出推理。贝叶斯推断就是如此,先验就是常识,在我们有了新的观测数据后,就可以根据likelihood来更新先验,得到后验,更新记忆。
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。
贝叶斯方法已经渗透到了生物信息和遗传统计的方方面面了,发表的文章不计其数。
学通贝叶斯,以后在数据分析和工具开发方面肯定就能获得一席的立足之地,混口饭吃不是问题。
先学习一门课程:
Module 20: Bayesian Statistics for Genetics - 超赞,值得啃完!
以下是一些肤浅的笔记:
Session 0, Course outline
Session 1, Introductions, motivations for Bayes, overview of Bayesian statistics
想学通贝叶斯,PPT开头推荐的这几本书都得看。
贝叶斯学派和频率学派之分再次证明,看待世界的角度远不止一种,没有绝对正确之分。(相对论和量子力学)
概率论的基础框架:可重复试验、变量、概率分布。必须是可重复,不可重复事件没有概率,如果我们活在三体世界也是没有概率的,因为不可预测。
贝叶斯定理的核心,从两个对称的角度达到同一个目的:交集,但交集并不重要,我们看中的是它连接的两端。
疾病诊断的一个常识,如果疾病是小概率事件(小于0.01),那么即使诊断的特异性和敏感性都很好(大于0.9),即使你被诊断为阳性,你真为阳性的概率仍然很低。原因就是分子太小,分母得足够小才行,也就是特异性必须达到0.99才行。韦恩图真厉害,得知癌症发病率、特异性和敏感性,就可以算出venn图中每一部分的面积。
从概率学的角度来看待一维和二维的贝叶斯定理。
Session 2, Review of probability, binomial sampling
Session 3, Binomial sampling continued. R notes [.Rmd, .pdf]
Session 4, Linear models. R script [.R]
Session 5, Multinomial sampling. R notes [.Rmd, .pdf]
Session 6, Model selection and model averaging. R script [.R]
Session 7, Generalized linear models. R notes [.Rmd, .pdf]
Session 8, Meta-analysis No R code for this session
Session 9, Testing and multiple testing [.Rmd , .pdf]
Session 10, Imputation, and software [.R, for DIC/WAIC examples]

更多精彩