论文部分内容阅读
Logistic回归模型主要研究二分响应变量与影响结果的一些解释变量之间的关系.在这里解释变量可以是离散型、连续型或混合型,且没有假设分布.响应变量y={0,1].(失败/成功)通常服从伯努利分布,即E(Y)=P(Y=1)=π,0<π<1.MCMC(Monte Carlo Markov Chain)的基本思想是通过建立一个平稳分布为π(x)的Markov链,并得到样本,基于此样本进行各种统计推断.优点是适用广泛,且收敛速度不会降低.本文首先利用MCMC方法对多元Logistic回归模型中的参数进行估计,并将得到的估计结果与传统用极大似然估计得到的估计结果相比较.结果发现:利用两种估计方法得到的参数估计结果相近,极大似然估计得到的参数估计结果落在MCMC的95%的置信区间内,说明用MCMC估计参数的方法是可行的,结果是可靠的.其次,针对二分类变量问题,经典Logistic回归是合适的.实际中由于不同原因导致观测结果不精确,响应变量处于0,1之间,且没有概率分布,变化的模型误差不能完全归功于随机性现象,更自然和可行的措施是将响应变量用语言变量来表示,此时响应类别是相对模糊的状态,且不能认为响应变量服从伯努利概率分布.成功的概率P(Y=1)无法计算.因此将Logistic回归模型与模糊集理论相结和合作为一种新的模型,构建了具有清晰输入-模糊输出的模糊Logistic回归模型,其中系数与输出均用LR-型模糊数表示.用成功的可能性替代概率,这些可能性可以由一些语义词描述.然后基于截集构造了模糊数之间的距离,利用此距离得到了上述模型中模糊参数的最小二乘估计.最后将模型应用在三个临床案例中,三个模型中估计结果的相容性指数分别为0.54,0.46,0.32,说明模糊Logistic回归模型是有效的.