1 句法学
1.1 转换生成语法
-
深层结构(\(\text{D}-\)结构或 \(\text{DS}\))与表层结构(\(\text{S}-\)结构或 \(\text{SS}\))
- 深层结构与表层结构的理论(\(\text{DS/SS}\) 理论)解决基础表象式和导出表象式之间的关系问题
- 将基础表象式的结构称为深层结构
- 将导出表象式的结构称为表层结构,\(\text{Chomsky}\) 将其细分为语音形式(\(\text{PF}\))和逻辑形式(\(\text{LF}\))两个层次
-
这个句法理论中有两类规则:① 基础规则(\(\text{base}\));② 转换规则(\(\text{TR}\))
- 在深层结构中起作用的是短语结构规则(\(\text{PS}\))和词汇的插入规则(\(\text{LIR}\)),两者基础生成深层结构表象式
- 深层结构表象式既是基础规则的输出,又作为转换规则的输入
- 深层结构与表层结构的理论(\(\text{DS/SS}\) 理论)解决基础表象式和导出表象式之间的关系问题
-
标准理论:称属于如下语法理论的每一种设计方案为标准理论
-
语法转换系统以不同的方式决定数量无限却由有限的短语标记构成的序列 \(K\),每一个短语标记序列 \(P_{1}, P_{2}, \cdots, P_{n}\) 应符合
- 表层结构:称以下情况中的 \(P_{0}\) 为 \(K\) 类开头的短语标记,把 \(K\) 类里的短语标记称为由这种语法生成的语法结构
- \(P_{n}\) 是表层结构
- 每一个 \(P_{i}\) 是按照语法规则的条件所允许的方式通过对 \(P_{i-1}\) 应用一定的转换规则构成
- 没有一种 \(P_{i}\) 能使 \(P_{0}, P_{1}, \cdots, P_{n}\) 符合前两个条件
- 与词汇成分 \(I\) 有关的词汇转换把包含下一级结构 \(Q\) 的短语标记 \(P\) 映射到现在通过用 \(I\) 替换 \(Q\) 构成的短语标记 \(P^{\prime}\) 上
- 设在 \(K\) 中序列为 \(P_{1}, P_{2}, \cdots, P_{n}\),其中有 \(i\),如果 \(j<i\),则由 \(P_{j}\) 构成的 \(P_{j+1}\) 所使用的转换是词汇的;如果 \(j \geqslant i\),则由 \(P_{j}\) 构成的 \(P_{j+1}\) 所使用的转换是非词汇的.称 \(P_{i}\) 为序列 \(P_{1}, \cdots, P_{n}\) 里的后词汇结构,也称作深层结构
- 表层结构:称以下情况中的 \(P_{0}\) 为 \(K\) 类开头的短语标记,把 \(K\) 类里的短语标记称为由这种语法生成的语法结构
-
标准理论规定每一个语句都有语法结构 \(\Sigma = (P_1, P_2, \cdots, P_i, \cdots, P_n)\)
- 短语标记是最基本的语法单位,全部短语标记构成的结构称为短语结构,是语句的深层结构
- 深层结构是按照一定的规则由短语标记生成的,体现的是语句的语义
- 深层结构按照一定的规则转换为表层结构,体现的是语句的语音
-
1.1.1 短语结构理论
-
短语结构规则:形如 \(X \rightarrow Y\) 的规则,即「重写 \(X\) 为 \(Y\)」,其中 \(X, Y\) 为一个或多个范畴,并称这些规则的集合为一个语法
- 常用范畴
- \(\text{S}\):语句
- \(\text{VP}\) 与 \(\text{V}\):动词短语与动词
- \(\text{NP}\) 与 \(\text{N}\):名词短语与名词
- \(\text{PP}\) 与 \(\text{P}\):介词短语与介词
- \(\text{AP}\) 与 \(\text{A}\):形容词短语与形容词
- \(\text{ADVP}\) 与 \(\text{ADV}\):副词短语与副词
- \(\text{M}\):情态词
- \(\text{D}\):限定词
- 常用短语规则
- 名词短语
- \(\text{NP} \to \text{D N}\)
- \(\text{NP} \to \text{D N PP}\)
- \(\text{NP} \to \text{D N S}'\)
- \(\text{NP} \to \text{(D) N}\)
- \(\text{NP} \to \text{NP N}\)
- 时态与情态
- \(\text{S} \to \text{NP Aux VP}\)
- \(\text{Aux} \to \text{Tense(Modal)}\)
- \(\text{Aux} \to \text{Tense(Modal)(Neg)}\)
- 动词短语
- \(\text{VP} \to \text{V NP}\)
- \(\text{VP} \to \text{V (NP)}\)
- \(\text{PP} \to \text{P NP}\)
- \(\text{VP} \to \text{V NP PP}\)
- \(\text{VP} \to \text{V S}\)
- \(\text{S}' \to \text{Comp S}\),其中 \(\text{S}'\) 为从句补语
- \(\text{VP} \to \text{V S'}\)
- 形容词与副词短语
- \(\text{AP} \to \text{A (PP)}\)
- \(\text{VP} \to \text{V AP}\)
- \(\text{VP} \to \text{(ADV) V (NP) (ADV)}\)
- \(\text{S} \to \text{(ADV) NP Aux VP (ADV)}\)
- 名词短语
- 常用范畴
-
短语标记:标示语句的要素结构的形式符号,例如 \(\text{Chomsky}\) 在『句法结构』中用如下短语结构规则
\[ \begin{aligned} & \text{S} \to \text{NP VP} \\ & \text{NP} \to \text{TN} \\ & \text{T} \to \textit{the} \\ & \text{N} \to \textit{man, ball, etc.} \\ & \text{V} \to \textit{hit, took, etc.} \end{aligned} \]得到语句 \(\textit{the man hit the ball}\) 的一个推导:
\[ \begin{aligned} & \text{S} \\ & \text{NP VP} \\ & \text{T N VP} \\ & \text{T N V NP} \\ & \text{T N V T N} \\ & \textit{the man hit the ball} \end{aligned} \]-
短语标记可用树图表示:
- 每一个节点带有一个标记符,其中分枝节点带有范畴符;叶节点除非为空,否则以合适的语词符(词汇项)来标记
- 同一短语标记中任意两个节点之间构成支配或(直接)先行关系
-
当短语标记简写为序列形式,一般规定语词符和终端符连接的括号以及最外层括号可省略:
\[ [{}_{\text{S}} [{}_{\text{NP}} [{}_{\text{T}} \textit{ the} ] [{}_{\text{N}} \textit{ man} ] ] [{}_{\text{VP}} [{}_{\text{V}} \textit{ hit} ] [{}_{\text{NP}} [{}_{\text{T}} \textit{ the} ] [{}_{\text{N}} \textit{ ball} ] ] ] ] \]
-
1.1.2 词库理论
- 一个句法成分由三个要素构成
- 由范畴中立的规则图解和规则强制构成的一套原则组成的范畴成分
- 由一个语言中的所有语词排列构成的词汇(或词典)连同对这些语词的特殊语形、语义、音位和形态特征的规定
- 与适当的语词层的范畴节点词项(语词)相关联的词汇排列原则
- 词汇:人们说话时在头脑中使用的词典,是一种语言中语词的清单.每个词项的词典条目包含对该语词所从属的句法范畴的限定
- 词汇编排原则:词典中任何属于给定语词范畴的词项都能够插入任意短语标记的相应的范畴节点之下
- 词汇插入规则:在叶节点 \(Y\) 下插入词项 \(X\),其中 \(Y\) 与 \(X\) 的范畴特征一致,\(Y\text{P}\) 与 \(X\) 的次范畴化属性一致
- 范畴特征:四种主要的语词范畴动词、形容词、名词和介词可以被分析为两类二元的范畴特征的组合,即名词性的范畴特征 \([+\text{N}]\) 与非名词性的范畴特征 \([-\text{N}]\);动词性的范畴特征 \([+\text{V}]\) 与非动词性的范畴特征 \([-\text{V}]\)
- 在这样的假设之下,四类主要的语词可以被分析为下面的范畴特征的组合
- \(\text{Verb}=[+\text{V},-\text{N}]\)
- \(\text{Adjective}=[+\text{V},+\text{N}]\)
- \(\text{Noun}=[-\text{V},+\text{N}]\)
- \(\text{Preposition}=[-\text{V},-\text{N}]\)
- 可将简单范畴分解为范畴特征,从而对各种范畴进一步分类
- 在这样的假设之下,四类主要的语词可以被分析为下面的范畴特征的组合
1.1.3 转换理论
- 短语范畴的转换
- 主题化规则:移动任意的短语 \(X\text{P}\), 并将其置于语句成分的最左端
- \(\text{wh}-\)移动:移动任意 \(\text{wh}-\)短语到补语化成分的节点之下
- \([+\text{Q}]-\text{Comp}\) 条件:只有当 \(\text{Comp}\) 具有范畴特征 \([+\text{Q}]\) 时, \(\text{wh}-X\text{P}\) 才能移动到该补语化成分节点 \(\text{Comp}\) 之下
- \(\text{wh}-\)隔离条件:作 \(\text{wh}-X\text{P}\) 移动的内含子句所属的补语化节点 \(\text{Comp}\) 受主句动词的支配,从而能支配该 \(\text{wh}-\)短语
- 复合 \(\text{NP}\) 条件:在一个含有子句 \(S^{\prime}\) 的复合名词短语中,可以将其中的 \(\text{wh}-\)短语移出
- 循环条件:如果一个 \(\text{wh}-\)移动是不受约束的,或是可以连续进行的,则它应该首先移动到最近的补语化节点 \(\text{Comp}\) 之下,并按此规定逐级移动到最大的一个节点 \(\text{Comp}\) 之下
- \(\text{NP}-\)移动:移动 \(\text{NP}\) 到一个语义为空的主语位置,如果 \(\text{NP}\)
- 不包含于一个有时态变化的子句中的时态语句条件(\(\text{TSC}\)):名词短语 \(\text{NP}\) 只能从没有时态变化的从句移动到去除了目标主语位置的一个语义为空的主语位置上
- 受限定的主语不与其目标位置相分离的受限定主语条件(\(\text{SSC}\))
- 名词短语 \(\text{NP}\) 不能超过其所在的从合的主语而直接进入主句主语的位置
- 不定式等没有时态变化的从的中的名词短语 \(\text{NP}\) 也不能移动到被动式主句的主语位置
- 附加成分转换:移动任意短语 \(X\text{P}\),并将其置于动词短语 \(\text{VP}\) 的最右端
- 笨重名词短语的转移:移动一个「笨重」的名词短语 \(\text{NP}\),并将其置于动词短语 \(\text{VP}\) 成分的最右端
- 终端范畴的转换
- 主要动词的词缀跳跃:词范畴节点 \(\text{Aux}\) 移动时态\范畴 \(\text{Tense}\) 到动词范畴节点 \(\text{V}\) 之下,如果
- \(\text{Aux}\) 不支配一个情态动词或否定词范畴
- \(\text{V}\) 具有特征属性 \([-\text{AUX}]\)
- \(\text{VP}\) 不支配具有特征属性 \([+\text{AUX}]\) 的动词范畴 \(\text{V}\)
- \(\text{Aux}\) 邻近支配目标动词 \(\text{V}\) 的动词短语 \(\text{VP}\)
- 助动词的 \(\text{V}-\)提升:提升动词范畴 \(\text{V}\) 到助动词范畴节点 \(\text{Aux}\) 之下,如果
- \(\text{V}\) 具有特征属性 \([+\text{AUX}]\)
- \(\text{Aux}\) 不支配一个情态动词范畴
- \(\text{do}-\)支持的否定语句:插入 \(\text{do}\) 以支持胶着时态,其中「胶着」指 \(\text{do}\) 的语法时态作用仅限定其从左边与主要动词联结在一起
- \(\text{yes}-\text{no}\) 问句中的主语—助动词倒置:移动助动词范畴 \(\text{Aux}\) 到引导词范畴 \(\text{Comp}\) 之下,如果
- \(\text{Comp}\) 具有特征属性 \([+\text{Q}]\)
- \(\text{Comp}\) 位于一个要子句中
- 主要动词的词缀跳跃:词范畴节点 \(\text{Aux}\) 移动时态\范畴 \(\text{Tense}\) 到动词范畴节点 \(\text{V}\) 之下,如果
1.2 原则和参数理论
1.2.1 X-阶标理论
-
每一个短语结构都具有如下结构形式
- 称短语结构 \(X\text{P}\) 为 \(X\) 的最大投射,\(X\) 为该投射的中心词,这是一个最大投射的必须要素
- 称 \(\text{Comp}\) 为 \(X\) 的补语,中心词与补语组成一个新的结构成分,记作 \(X^{\prime}\),称为单撇投射
- 投射原理:每一个语法层次(\(\text{LF, DS, SS}\))上的表达式都是从词汇投射的,这些表达式遵循词汇项的次范畴性质
-
词汇短语结构:词汇短语中心词的类型与其词性相关,短语 \(X\text{P}\) 和范畴 \(X\) 两个层次对描写短语结构的所有细节已经充分够用
- 中间层次 \(X^{\prime}\) 的结构规则
- \(X' \to X \text{ complement(s)}\) 或
- \(X' \to \text{complement(s) } X\)
- 限定词、中心词和补语的规则和结构:\(X'' \to \text{specifier } X' \to \text{ complement}\)
- 中间层次 \(X^{\prime}\) 的结构规则
-
功能短语结构
-
变形短语(\(\text{IP}\))有两个内在层次:① \(\text{IP}(\text{I}'')\):包含 \(\text{I}'\) 和一个限定成分;② \(\text{I}'\):包含 \(\text{I}\) 和一个补语
- \(\text{IP}(\text{I}'')\) 处于结构的最高层,\(\text{I}'\) 连同其左侧的限定成分处于中间层,\(\text{I}\) 与其右侧的补语处于最底层
- 中心成分 \(\text{I}\) 并不必然是词汇中的一个词项,而是一个表示时态与数的一致性的抽象特征的综合体
-
补语化成分短语(\(\text{CP}\)):包括 \(\text{C}'\) 和 \(\text{C}\) 两个常见的层次,并带有可能的限定成分和补语
-
-
结构表现层与移动:表层结构和深层结构之间的关系在于移动,即表层结构等于深层结构加移动
1.2.2 θ-理论与功能范畴
-
词汇项概述:谓词表达了论元之间的意义关系,这些语义角色称为论题成分角色,简称为 \(\theta-\)角色
- 任何语句都必须包括一个谓词,其所涉及的实体称为论元.任何谓词的词汇项都包括该谓词的论元所承担的 \(\theta-\)角色
- 主体:行为的发出者
- 受体:行为的承受者
- 目标:预期的行为终点
- 主题:行为所移动的事物
-
谓词与论元角色的关系可以用一个结构来表达,即其语义角色框架,称为 \(\theta-\)格式
- 一个谓词选择特定数量的论元来充当特定的 \(\theta-\)角色,将谓词对其论元的限定能力称为语义选择,简称为 \(s-\)选择
- 确定词项的补语类型的选择称为范畴选择,简称为 \(c-\)选择
两者的区别在于后者仅涉及补语,前者涉及所有的论元
- 任何语句都必须包括一个谓词,其所涉及的实体称为论元.任何谓词的词汇项都包括该谓词的论元所承担的 \(\theta-\)角色
-
投射原理:在每一个句法结构层次如 \(\text{LF}\) 结构、深层和表层结构中的表达形式都是从词汇投射而来的,在这种投射中各种表达形式保留词项原有的子范畴属性
- 在某些语言中,语句成分可以按照转换规则进行移动,但词汇所带有的结构信息却不能被这种转换所改变
- 对所有语言来说这都是一条具有普遍性的原则,即转换不能改变词汇的范畴属性
- \(\theta-\)标准:每一个论元担任一个且仅担任一个 \(\theta-\)角色,而每一个 \(\theta-\)角色被指派给一个且仅指派给一个论元
- 完全解释(\(\text{FI}\))原则:语言系统的使用中,句法表层结构 \(\text{PF}\) 和 \(\text{LF}\) 的成分必须接受合适解释,即得到指向意义的认可
- \(\theta-\)理论研究 \(\theta-\)角色的分配,这些角色包括行为的主体等
- 在某些语言中,语句成分可以按照转换规则进行移动,但词汇所带有的结构信息却不能被这种转换所改变
- 语法功能(\(\text{GF}\)):在 \(X-\)阶标理论中,主语和宾语是作为语句结构中的特殊配置,而非作为独立的单位来理解
- \(\text{GF}\) 主语:由 \(\text{VP}\) 直接支配的 \(\text{NP}(\text{N}'')\)
- \(\text{GF}\) 宾语:由 \(\text{V}'\) 直接支配的 \(\text{NP}(\text{N}'')\),即动词 \(\text{N}\) 的补语
1.2.3 移动与格理论
- 无限制移动:移动 \(\alpha\),其中 \(\alpha\) 代表任何范畴
- \(\text{NP}-\)移动:包含深层结构中一个论元位置与一个空论元位置之间的连接,这个空论元位置既不包含一个现实的 \(\text{NP}\),也没有一个指派给它的 \(\theta\) 角色
- \(\text{wh}-\)移动:\(\text{wh}-\)短语的移动
- 在 \(\text{wh}-\)移动中,深层结构中没有任何论元位置可供 \(\text{wh}-\)短语移动,因为主语和宾语的位置都已被占据
- 双重占位补语过滤参数:补语化系统不能同时包含一个 \(\text{wh}-\)成分和一个补语化成分
- 格理论:关于抽象格的分配及其在形态上的实现的理论
- 不论是结构格还是内在格,都是由格的指派者指派到名词短语 \(\text{NP}\) 上
- 主格由表层结构的 \(\text{AGR}\) 指派给语法功能的主语
- 宾格由表层结构的动词 \(\text{V}\) 指派给语法功能的宾语
- 宾格还由介词 \(\text{P}\) 指派给深层结构的介词的语法功能宾语
- 属格由深层结构中的结构 \(\text{NP}[\text{NP__}]\) 所指派
- 在带有内在格的语言中,格由深层结构中的指派者(如动词)所指派
- 格筛选:每一个在语音上实现的 \(\text{NP}\) 都必须被指派(抽象)格
- 各种语言的格的区别可以用格的原则和参数来表示
- 邻接性原则和参数:格的指派者与格是毗邻关系,即格的指派者与格应该紧密相连
- 方向性原则和参数:① 在中心词前置的语言中,格的指派采取右指向;② 在中心词后置的语言中,格的指派采取左指向
- 异常格标记:在英语中,如果一个补语子句是限定性的,则子句中的主语采用主格
- 不论是结构格还是内在格,都是由格的指派者指派到名词短语 \(\text{NP}\) 上
1.2.4 管辖理论
- 成分统制:即 \(c-\)统制,是最基本的管辖关系
- \(\alpha\) 成分统制 \(\beta\) 当且仅当 \(\alpha\) 不支配 \(\beta\) 且对所有 \(\gamma[X\text{P}]\),如果 \(\gamma\) 支配 \(\alpha\),则 \(\gamma\) 也支配 \(\beta\)
- 变元 \(\gamma\) 表示成分统制运算的域:如果 \(\gamma\) 是一个 \(X\text{P}\),则 \(\alpha\) 的成分统制域是在它上面并包含它的第一个 \(X\text{P}\)
- \(\alpha\) 将成分统制所有那些在其域中的成分,而此域并不包含在 \(\alpha\) 自身之中
- 称 \(X\text{P}\) 为支配 \(\text{X}\) 的第一个极大投射,据此定义的统制关系被称为 \(m-\)统制
- \(\alpha\) 成分统制 \(\beta\) 当且仅当 \(\alpha\) 不支配 \(\beta\) 且对所有 \(\gamma[X\text{P}]\),如果 \(\gamma\) 支配 \(\alpha\),则 \(\gamma\) 也支配 \(\beta\)
- 管辖:带有两个限制条件的成分统制
- \(\alpha\) 管辖 \(\beta\) 当且仅当 ① \(\alpha\) 是一个管辖者;② \(\alpha\) 和 \(\beta\) 相互成分统制
- 格指派原则:格只能在管辖之下被指派
- 主格只能被指派到限定性子句主语的位置,因为只有这个位置是主格的指派者 \(\text{AGR}\) 所管辖的
- 宾格主要被指派给动词和介词的宾语,因为只有这个位置是动词和介词所管辖的
- 例外格标记:不存在补语化成分短语 \(\text{CP}\),而只有简单的时态短语 \(\text{TP}\)
- 控制结构:被限定在非限定子句的主语位置上的 \(\text{PRO}\) 不受管辖
- 约束:\(\alpha\) 约束 \(\beta\) 当且仅当 ① \(\alpha\) 成分统制 \(\beta\);② \(\alpha\) 和 \(\beta\) 具有共同的索引下标
- 约束理论:在同一子句中,代词成分不能有一个成分统制的先行词
- 一个向首重复成分在本地论域中是受约束的
- 一个代名词在本地论域中是自由的
- 一个指称表达式是自由的
-
显式表达式与空范畴的关系
显式表达式 空范畴 句首重复 代名词 反身代词 \(\text{NP}-\)遗迹 \(+\) \(-\) 人称代词 \(\text{Pro}\) \(-\) \(+\) 指称表达式 \(\text{wh}-\)遗迹 \(-\) \(-\) — \(\text{PRO}\) \(+\) \(+\)
- 约束理论:在同一子句中,代词成分不能有一个成分统制的先行词
1.3 最简方案
-
\(\text{MP}\) 模型重新建立语法机制:去除不必要的原则和参数,只保留最基本的东西,将语法还原到最小程度,使语法更具解释力
- 词项列举:表达式的形成是通过选择词项,然后再建立结构描述,称建立结构描述所需要的词项为列举
- 释出点:在计算过程的某一点上,结果被一分为二
- 释出操作可以将 \(\text{SD}\) 中的信息以任意的方式进行分割
- 语义信息不允许出现在语音形式 \(\text{PF}\) 中,语音信息也不允许出现在逻辑形式 \(\text{LF}\) 中
- 核查:去除与语义和语音无关的内容
- 融合:将已经构造出来的单元组成更大的单元
- 移动:在树的构造中,计算系统也要在树中移动各种成分,如同在转换语法中所做的那样
- 拖延和自顾:在特殊的情况下移动必须被限定在本地
- 极小联结条件:\(\alpha\) 应该做「最短的移动」
- 拖延原则:在生成成功的 \(\text{LF}\) 表达式的过程中,要尽量延缓去做任何事情,除非有必要去做
- 自顾原则:任何成分的移动都是为了满足自身的要求,而不管别的成分
- 经济原则:所有表达式和用来处理它们的程序应该尽可能地俭省
-
最简方案何以可能:\(\text{MP}\) 的设计作为一种语言理论把语言表达式看做不过是一种形式对象,以最佳方式满足接口条件
- 去除深层和表层结构:所有的条件都是接口条件,语言表达式就是这种接口条件的最佳实现
- 去除管辖:通过特征核查建立一种关于词序和动词移动的简单理论
- 去除 \(X-\)阶标:\(\text{MP}\) 模型中的融合运算与 \(X-\)阶标理论中的极大投射完全一致
- 极大投射就是一个结构中最远的那个成分的投射
- 某些成分可以既是一个语词,同时也是一个极大投射