复句关系标记的搭配研究

复句关系标记的搭配研究

作者:姚双云 著

出版社:华中师范大学出版社

出版年:2008-06-01

评分:5分

ISBN:9787562237389

所属分类:民俗文化

书刊介绍

复句关系标记的搭配研究 目录


导论
**章研究背景:“小句中枢理论”与复句信息工程
引言
**节“小句中枢理论”在中文信息处理中的应用
一、应用于词语的自动切分和标注
二、应用于短语的识别和标注
三、应用于歧义的消解
四、应用于语法实体复杂特征集的描写
第二节“小句中枢理论”与复句信息工程
一、复句研究的重要意义
二、复句信息工程的研究内容、目标和开展
三、关于“汉语复句语料库”
第三节“汉语复句语料库”的利用
一、利用统计数据了解关系标记的使用频率
二、利用复句语料库统计关系标记的搭配距离
三、利用标注语料库发现关系标记的搭配模式
四、利用标注语料库进行关系标记的识别
小结
第二章词语搭配的理论体系与关系标记的搭配
引言
**节词语搭配理论体系的介绍
一、搭配的定义
二、搭配研究发展的几个重要阶段
三、国内搭配研究的开展及简单评价
第二节关系标记搭配研究的意义、内容和手段
一、关系标记搭配研究的重要意义
二、关系标记搭配研究的主要内容
三、本研究中用到的基本统计方法
第三节本书开展研究的语料准备
一、本书使用的两个语言资源
二、对研究语料的预处理
三、对本书统计数据的说明
小结
第三章关系标记搭配的基本情况与相关分析
引言
**节关系标记的分布情况与使用频率
一、各类关系标记的分布情况
二、单个关系标记的使用频率
第二节关系标记的搭配强度与语义的衍生
一、关系标记搭配强度的统计分析
二、常见的搭配强度大、共现次数多的搭配结构
三、从搭配强度与意义的衍生看“语表”对“语里”的影响
第三节关系标记的搭配距离与相关句法特征
一、关系标记的搭配距离分析
二、搭配距离与相关格式的“表—里—值”分析
第四节关系标记的语义韵
一、“语义韵”的界定与关系标记的“语义韵”
二、原因标记“多亏”的“语义韵”分析
小结
第四章递进标记的搭配、关联与易位
引言
**节递进标记搭配的基本情况与个案分析
一、递进标记搭配的基本情况
二、反递格式“不仅/不但……反而”前搭配项“表—里—值”的分析
第二节递进层级句式的关联与易位
一、递进层级句式的语义类型
二、递进层级句式的关联
三、递进层级句式的易位
小结
第五章连词“结果”的语法化与共时平面的搭配
引言
**节“结果”的语法化及语义类型分析
一、“结果”在历时纵线上的两个不同形式及其用法
二、“结裹”的语义演变及“结果”虚化过程
三、连词“结果”虚化的动因
四、连词“结果”虚化的特点
五、“结果”虚化的认知基础与类型学意义
六、连词“结果”的语义分析
第二节“结果”的连词典型性问题及其共时平面的使用情况
一、“结果”的连词典型性聚类分析
二、连词“结果”的分布、句法位置与搭配
第三节“结果”和“所以”的搭配差异
一、关联句类的差异
二、与因果标记搭配强度的差异
小结
第六章关系标记的连用与异类搭配
引言
**节关系标记的连用
一、关系标记连用的分类
二、关系标记连用基本情况的统计与分析
三、影响关系标记连用的重要因素
四、关系标记连用的语用价值
第二节关系标记的异类搭配
一、关系标记组合的三种形式
二、异类标记搭配的基本模式
三、异类标记的搭配强度及语用价值
四、异类标记的搭配与复句层次的划分
小结
全书总结
一本书的结论
二本书的意义
三本书的不足及今后的工作
附录一“《人民日报》语料样本”265个关系标记的出现次数
附录二“《人民日报》语料样本”常见搭配模式的MI值统计数据
附录三“《人民日报》语料样本”常见搭配模式的Z值统计数据
附录四“《人民日报》语料样本”中共现次数、MI值和Z值均在前95位的54组搭配格式
附录五“《人民日报》语料样本”中常见搭配标记的平均搭配距离
附录六“因为……所以”与“之所以……是因为”搭配距离对比检索语料
附录七90个含有标记“多亏”的检索例句
附录八122个“不仅……反而”的检索例句
附录九关系标记的异类搭配部分语料
参考文献
后记

复句关系标记的搭配研究 内容简介

本书以关系标记为切入点,以“小句中枢”和“词语发配”为理论背景,将搭配研究基本手段与“两个三角”,即“表-里-值”小三角和“普-方-古”大三角的研究方法紧密地结合起来,利用“汉语复句语料库”与“《人民日报》语料样本”作为数据支持,追求对语言事实的“观察充分”、“描写充分”和“解释充分”。研究中运用了统计分析、层次聚类等多种跨学科研究方法,目的是从全新的角度来观察和分析关系标记搭配的句式与语义特点。

复句关系标记的搭配研究 节选

**章研究背景:“小句中枢理论”与复句信息工程
引言
本章介绍全书的研究背景——“小句中枢理论”与复句信息工程。主要包括两节:**节“‘小句中枢理论,在中文信息处理中的应用”,从词语的自动切分和标注、短语的识别和标注、歧义的消解、语法实体复杂特征集的描写四个方面讨论“小句中枢理论”在中文信息处理领域的应用;第二节“‘小句中枢理论’与复句信息工程”,讨论复句信息工程的研究内容、研究目标以及“汉语复句语料库”的建设和利用等问题。
**节“小句中枢理论”在中文信息处理中的应用
“小句中枢理论”的核心内容是“句管控”,“句管控”思想在解决中文信息处理面临的一些难题中可以发挥作用。“小句中枢理论”中的“小三角”研究思路实际上是人们全面认识和描述事物的一种方法,从信息论的角度来说是一种全信息表示法,它和当前自然语言处理倡导的“复杂特征集”的描写在本质上是相通的。在中文信息处理中,小句中枢理论可以应用于以下几个方面。
一、应用于词语的自动切分和标注
词语的自动切分和标注是进行汉语句法分析的前提。目前,汉语的自动分词和词性标注基本上达到了能够实际应用的水平,但准确率还有待提高。未登录词的识辨和歧义切分字段的处理是自动分词研究中遇到的两个主要困难,不能识别未登录词或者错误的识别都会导致不正确的标注。汉语中,词的兼类现象特别是活用现象大量存在,增加了分词系统中词库的建设难度。即使在词库中确定了形形色色的兼类词,也难以确定兼类词的具体词性,因为兼类词处于此句法环境中可能是甲类词,而处于彼句法环境中可能是乙类词。活用的现象更复杂,什么词可以活用,可以活用为什么词,都很难把握。然而,兼类也好,活用也好,任何词进入到具体的句子之中,就一定会受到句子的约束和管控。正因如此,“句管控”思想在理论与实践上具有不言而喻的价值。
……

相关推荐

微信二维码