对一个学生是否能够拿到推荐信来建模,选取五个变量如下图:
1.贝叶斯公式 2.利用图结构优势降低模型的复杂度 2.1定义贝叶斯网络五个变量的依赖关系如下: 试题难度和智力影响着考试成绩,考试成绩影响能不能得到推荐信,整理影响着高考成绩 。定义条件概率表:
d节点没有复节点,用先验概率表示条件概率,试题难度低的概率是0.6,试题难度高的概率0.4。
Grade节点有两个复节点,条件概率表第一行概率表示:在i取i0、d取d0的情况下,g分别取到g1 g2 g3的概率。其他变量的条件概率表以此类推。
用贝叶斯建模,需要的参数会大幅降低:
举两个不同的例子:
2.2条件独立性
为了介绍贝叶斯网络的条件独立性,引入概率影响流动性:
一定的观测条件,是指有无观测变量,观测变量的值是否确定。
另一个例子,第一行代表:当w不属于观测变量,那么X会影响Y;当w属于观测变量,那么X不会影响Y。
2.3概率影响流动性和条件独立性的关联概率影响流动性和迹关联,有效迹引入d分离,d分离与条件独立相关。
2.4贝叶斯网络中的独立性
根据此定理,可以将2.2中的例子简化:
3.贝叶斯网络推理 3.1 因果推理(顺箭头方向)下图具体的值后文会有介绍:
3.2 证据推断(逆箭头方向)
3.3 交叉因果推断(双向箭头) 4.小结
注: