论文部分内容阅读
由于生命现象的复杂性,在医学应用中实际遇到的有些数据,其因变量虽然是连续的但在某一点上受到了限制或者说被截取(censored)了,而出现其取值不正确的情况。对于这样的实际问题,由于连续的因变量被截取从而使该变量形成截取分布,截取分布是连续分布和离散分布的混合分布,当以这些因变量进行统计建模时,传统的线性回归模型就不再适用,如最小二乘法被证明是不一致的,本次研究的Tobit模型能够很好地解决这个问题。在满足正态性和方差齐性的经典假设条件下,用最大似然法估计Tobit模型是一致和渐近正态的,然而在医学研究领域中,相当多的数据资料并不服从正态分布,尤其是存在异方差性,在这种情况下应用最大似然法估计参数就会出现不一致的结果。半参数估计是一种参数和非参数估计的混合,比相应的参数模型更能一致的估计参数,而且比非参数模型估计更精确,其优点是无需假定误差项分布,所以它对非正态和异方差是稳健的。本文主要概括介绍Tobit模型的两种半参数估计方法:对称修剪最小二乘法(SCLS)和截取最小绝对离差估计(CLAD)。同时在经典假设条件下,通过模拟研究,比较了最小二乘回归模型,Tobit模型和断尾回归模型(truncated regression model)的估计效果,表明当因变量被截取时,Tobit模型是最适合的模型;在违反经典假设条件下,模拟研究了最大似然参数估计和半参数SCLS、CLAD估计的效果,结果证明半参数估计优于参数估计。在医学应用实例分析部分,应用Tobit模型研究分析2004年山西省太原市城市居民医疗费用支出的影响因素。国内对医疗费用的研究大部分是针对门诊病人的门诊医疗费用和住院病人的住院医疗费用,采用的统计学方法大部分是多元回归模型分析、logistic回归分析、因子分析等传统的统计学方法。然而仅仅研究病人这个群体的医疗费用支出是不够的,研究对象应该扩展到一般人群当中。在一般人群中医疗费用支出的调查研究需考虑到医疗费用取值存在的因变量受限问题。本文应用Tobit模型从更广泛的一般人群(山西省太原市城市居民)中研究影响医疗费用支出的因素,为山西省医疗费用体制的改革和医疗保险制度的改革提供更有效的统计学方法依据和研究结论。