论文部分内容阅读
随着计算机时代的到来,语料库已经成为语言学、语言教学、自然语言处理等领域的重要工具,并形成一门新兴学科——语料库语言学。语料标注是语料库语言学研究的重要内容,是决定语料库建设质量的重要环节,其中语篇结构标注是继句法结构标注之后的重要环节。目前国内外一些重要语料库建设项目在句法结构标注方面已经颇具规模,但在语篇结构标注方面还很少见,其原因在于语篇结构标注的理论基础——语篇结构形式化理论尚不成熟。20世纪80年代以来,语篇结构研究逐渐成为语言学研究的热点,多种语篇结构形式化理论相继提出。本研究尝试以语料库语言学为视角,以语篇结构标注为目标,对几种主要的语篇结构形式化理论进行理论分析和标注应用的比较研究,从而为构建成熟的语篇结构形式化理论提供参考。本论文共分为六章。第一章为引论,介绍了研究背景、研究问题及意义和论文组织结构。第二章为文献综述,对相关术语进行了界定,介绍了四种语篇结构形式化理论的研究现状:修辞结构理论(RST)、语篇表征理论(DRT)、切分语篇表征理论(SDRT)和信息依存模型(IDM)。第三章介绍了四种语篇结构形式化理论进行语篇分析的相关步骤和技术。其中:RST和IDM主要采用树或图结构,以相关软件为支撑实现语篇分析;DRT和SDRT主要采取逻辑表达式和框图实现语篇分析,目前还没有相关软件支撑。第四章对四种语篇结构形式化理论进行理论分析和标注应用。以语料标注一般原则和语篇连贯性为标准分析不同理论,并以具体的语篇结构标注加以验证。第五章为结论。研究结果表明:1)从语料标注一般原则的可分离性和可操作性来看,RST和IDM表现较好,更适合语篇结构标注,DRT和SDRT则较差。从语义关系描写精度来看,IDM相较RST更胜一筹。2)从对语篇连贯性的描写来看,SDRT和IDM能够从语篇宏观结构、微观结构两个方面进行较为全面的描述,RST侧重语篇的宏观结构,而DRT更侧重语篇微观结构。总体来看,IDM比较适合作为语篇结构标注的理论基础。