diff --git a/README.md b/README.md index ceb2dda..b4d854d 100644 --- a/README.md +++ b/README.md @@ -3,7 +3,7 @@ ```yaml 标题: 通用写作律法 创建时间: 2023年8月26日 -版本: 0.0.10-beta +版本: 0.0.11-beta ``` 通用写作律法(General Writing Laws)是由 @@ -126,24 +126,15 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge + GWLM 1-3:标点符号 - 标点符号是辅助断句、标示的符号,所以移除标点符号后,仍然可以获悉文字大意, - 但增加了阅读的复杂度,还有歧义。 - - 用来断句的符号是「点号」,标示的符号是「标号」。 + 详见 [GWLM 15834-2-1 标点符号 (punctuation)](#gwlm-15834-2-1-标点符号-punctuation)。 + GWLM 1-4:点号(点符号) - 表示各种强度的停顿符号。 - - 用于句末的「句末点号」,表示一句话的结束。包括句号、问号、叹号。 - - 用于句内的「句内点号」,表示句内的各种停顿。包括逗号、顿号、分号、冒号。 + 详见 [GWLM 15834-2-6 点号](#gwlm-15834-2-6-点号)。 + GWLM 1-5 标号(标示符号) - 起到标示作用的符号,使用标号能够快速识别某段文字的作用。 - - 包括引号、括号、破折号、省略号、着重号、连接号、间隔号、书名号、专名号、分隔号。 + 详见 [GWLM 15834-2-7 标号](#gwlm-15834-2-7-标号)。 ## GWLM 2 书写系统空间 @@ -254,7 +245,7 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge + GWLM 3-2-2:引号。 - + GWLM 3-2-4:书名号(包括使用斜体表示书名)。 + + GWLM 3-2-4:书名号(包括使用斜体标示书名)。 + GWLM 3-3:单位符号与数字之间需要增加空格,例外: @@ -428,10 +419,8 @@ GWLM 3-6-1 与 GWLM 3-7-1 的结果看起来相同,当其作用的领域不同 ### 各种文字的兼容性 各地文字之间存在兼容性,比如 DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Google 和 Microsoft 这些知名公司, -都已经成为了事实上的中文 [外来语][],属于直接使用的外来词,就像是香港常用的张 Sir 来表示张先生一样, -没有必要使用引号标注。 - -[外来语]: https://zh.wikipedia.org/wiki/外来语 +都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词, +就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。 但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。 @@ -505,19 +494,75 @@ Emoji 被视作半角字符,并且连续使用时,Emoji 之间也需要有 《GB/T 15834-2011 标点符号用法标准》这个标准存在一些模糊的情况,所以这里尝试使用更精确的模块替代部分标准。 -主要目的是重写出一个符合 CC-BY 4.0 协议,并兼容《GB/T 15834-2011 标点符号用法标准》的模块, +主要目的是重写出一个符合 CC-BY 4.0 协议,并兼容《GB/T 15834-2011 标点符号用法标准》的模块。 这样在未来就不需要以不够开放的资料,作为 GWLM 的基础,但是任重道远,还有大量待重写的部分。 -### GWLM 15834-4-5 顿号 +### GWLM 15834-1 范围 + +本模块规定了简体中文标点符号的用法,适用于简体中文书写系统。 + +### GWLM 15834-2 简体中文标点符号词汇表 + +#### GWLM 15834-2-1 标点符号 (punctuation) + +标点符号是辅助断句、标示的符号,所以移除标点符号后,仍然可以获悉文字大意, +但增加了阅读的复杂度,还有歧义。 + +用来断句的符号是「点号」,标示的符号是「标号」。 + +#### GWLM 15834-2-2 句子 (sentence) + +〔待完成重写〕 + +#### GWLM 15834-2-3 复句 (complex sentence) + +〔待完成重写〕 + +#### GWLM 15834-2-4 分句 (clause) + +〔待完成重写〕 + +#### GWLM 15834-2-5 语段 (expression) + +〔待完成重写〕 + +#### GWLM 15834-2-6 点号 + +表示各种强度的停顿符号,分为「句末点号」和「句内点号」。 + +##### GWLM 15834-2-6-1 句末点号 + +表示一句话的结束。包括句号、问号、叹号。 + +##### GWLM 15834-2-6-2 句内点号 + +表示句内各种不同性质的停顿。包括逗号、[顿号](#gwlm-15834-4-5-顿号)、 +分号、冒号。 + +#### GWLM 15834-2-7 标号 + +起到标示作用的符号,使用标号(标识符号)能够快速识别某段文字的作用。 + +包括引号、括号、破折号、省略号、着重号、[连接号](#gwlm-15834-4-13-连接号)、 +[间隔号](#gwlm-15834-4-14-间隔号)、 +书名号、专名号、[分隔号](#gwlm-15834-4-17-分隔号)。 + +### GWLM 15834-3 未定义 + +《GB/T 15834-2011 标点符号用法标准》的 2 与 3 小节被合并到了 GWLM 15834-2,所以 GWLM 15834-3 暂时空缺。 + +### GWLM 15834-4 标点符号的定义、形式和基本用法 + +#### GWLM 15834-4-5 顿号 GWLM 15834-4-5 是替代《GB/T 15834-2011 标点符号用法标准》4.5 小节的模块, 描述了顿号的定义、形式和基本用法。 -+ 4.5.1 定义 ++ GWLM 15834-4-5-1 定义 + 句内点号的一种,表示语段中并列词语之间或某些序次语之后的停顿。 -+ 4.5.2 形式 ++ GWLM 15834-4-5-2 形式 + 顿号的形式是「、」。 @@ -525,9 +570,9 @@ GWLM 15834-4-5 是替代《GB/T 15834-2011 标点符号用法标准》4.5 小节 | :---: | :------: | | 、 | `U+3001` | -+ 4.5.3 基本用法 ++ GWLM 15834-4-5-3 基本用法 - + 4.5.3.1 作为弱于逗号的停顿,示例: + + GWLM 15834-4-5-3-1 作为弱于逗号的停顿,示例: > 我准备讲两个问题:一、CSGO 经济系统是什么?二、怎样学好 CSGO 经济系统? @@ -535,7 +580,8 @@ GWLM 15834-4-5 是替代《GB/T 15834-2011 标点符号用法标准》4.5 小节 > 寻血猎犬总是不断、不断地重伤倒地。 - + 4.5.3.2 作为「连词」的替代符号(「连词」即连接两个词语的词语,比如「和」「跟」「与」及「或者」)。 + + GWLM 15834-4-5-3-2 作为「连词」的替代符号(「连词」即连接两个词语的词语, + 比如「和」「跟」「与」及「或者」)。 > 《Apex 英雄》是一款专注于角色、小队制的大逃杀射击游戏。 @@ -559,16 +605,16 @@ GWLM 15834-4-5 是替代《GB/T 15834-2011 标点符号用法标准》4.5 小节 > 我喜欢《Apex 英雄》(游戏)《机器人总动员》(电影)《我兔斯基你》(绘本)「东方 Project」(文化) 这些作品。 -### GWLM 15834-4-13 连接号 +#### GWLM 15834-4-13 连接号 GWLM 15834-4-13 是替代《GB/T 15834-2011 标点符号用法标准》4.13 小节的模块, 描述了连接号的定义、形式和基本用法。 -+ 4.13.1 定义 ++ GWLM 15834-4-13-1 定义 + 标号的一种,标示某些相关联成分之间的连接。 -+ 4.13.2 形式 ++ GWLM 15834-4-13-2 形式 + 连接号的形式有短横线「-」、一字线「―」和浪纹线「~」三种。 @@ -580,14 +626,19 @@ GWLM 15834-4-13 是替代《GB/T 15834-2011 标点符号用法标准》4.13 小 + 其他相似符号: - | 符号 | Unicode | 名称 | - | :---: | :------: | ---------------------------------------------------- | - | ~ | `U+007E` | [Tilde](https://www.compart.com/en/unicode/U+007E) | - | — | `U+2014` | [Em Dash](https://www.compart.com/en/unicode/U+2014) | + | 符号 | Unicode | 名称 | + | :---: | :------: | ------------------------------------------------------------------- | + | ~ | `U+007E` | [Tilde](https://www.compart.com/en/unicode/U+007E) | + | ‐ | `U+2010` | [Hyphen](https://www.compart.com/en/unicode/U+2010) | + | ‑ | `U+2011` | [Non-Breaking Hyphen](https://www.compart.com/en/unicode/U+2011) | + | − | `U+2212` | [Minus Sign](https://www.compart.com/en/unicode/U+2212) | + | – | `U+2013` | [En Dash](https://www.compart.com/en/unicode/U+2013) | + | — | `U+2014` | [Em Dash](https://www.compart.com/en/unicode/U+2014) | + | - | `U+FF0D` | [Fullwidth Hyphen-Minus](https://www.compart.com/en/unicode/U+FF0D) | -+ 4.13.3 基本用法 ++ GWLM 15834-4-13-3 基本用法 - + 4.13.3.1 存在连接关系,比如: + + GWLM 15834-4-13-3-1 存在连接关系,比如: + 复合名词:「印度-欧亚板块」「吐鲁番―哈密盆地」。 @@ -595,11 +646,11 @@ GWLM 15834-4-13 是替代《GB/T 15834-2011 标点符号用法标准》4.13 小 + 复姓人名:「康斯坦策·阿马莉·冯·布劳恩施班克―阿尔布雷希茨贝格」(Constanze Amalie von Braunschbank-Albrechtsberger)。 - + 4.13.3.2 存在序列关系,比如: + + GWLM 15834-4-13-3-2 存在序列关系,比如: + 元素、化合物:「碳-14」「碳-12」「3-戊酮」。 - + 对附件标记序号:「图-12」「表-2」。 + + 对附件标识序号:「图-12」「表-2」。 + 电话号码:「+1 (917) 285-7362」。[^bpn] @@ -607,7 +658,7 @@ GWLM 15834-4-13 是替代《GB/T 15834-2011 标点符号用法标准》4.13 小 [^bpn]: 此电话号码来自《疑犯追踪》([Person of Interest](https://personofinterest.fandom.com/wiki/(917)_285-7362))。 - + 4.13.3.3 表示起止或范围,比如: + + GWLM 15834-4-13-3-3 标示起止或范围,比如: + 经济计划:「中国-中亚-西亚经济走廊」。 @@ -617,47 +668,98 @@ GWLM 15834-4-13 是替代《GB/T 15834-2011 标点符号用法标准》4.13 小 + 重量:「40~60 千克」「四十~六十千克」。 -### GWLM 15834-4-17 分隔号 +#### GWLM 15834-4-14 间隔号 + +GWLM 15834-4-14 是替代《GB/T 15834-2011 标点符号用法标准》4.14 小节的模块, +描述了间隔号的定义、形式和基本用法。 + ++ GWLM 15834-4-14-1 定义 + + + 标号的一种,标示某些相关联成分之间的分界。 + ++ GWLM 15834-4-14-2 形式 + + + 间隔号的形式是「·」。 + + | 符号 | Unicode | 名称 | + | :---: | :------: | ------------------------------------------------------- | + | · | `U+00B7` | [Middle Dot](https://www.compart.com/en/unicode/U+00B7) | + + + 其他相似符号: + + | 符号 | Unicode | 名称 | + | :---: | :------: | ---------------------------------------------------------------- | + | ‧ | `U+2027` | [Hyphenation Point](https://www.compart.com/en/unicode/U+2027) | + | ・ | `U+30FB` | [Katakana Middle Dot](https://www.compart.com/en/unicode/U+30FB) | + ++ GWLM 15834-4-14-3 基本用法 + + + GWLM 15834-4-14-3-1 标示被翻译为汉字的人名。 + + > 阿姆罗·雷 (Amuro Ray) + + + GWLM 15834-4-14-3-2 标示作品名与篇(章、卷)名之间的分界。 + + > 《汉志·蜀王本记》 + + + GWLM 15834-4-14-3-3 标示词牌、曲牌、诗体名等和题名之间的分界。 + + > 《天净沙·即事》 + + + GWLM 15834-4-14-3-4 用在构成标题或栏目名称的并列词语之间。 + + > 《游戏·人》 + + + GWLM 15834-4-14-3-5 以月、日为标志的事件或节日,在数字间使用。如果是汉字数字, + 仅在一、十一和十二月后用间隔号(防止歧义)。 + + > 五一二大地震 + + > 十二·十世界人权日 + + > 12·25 圣诞节 + +#### GWLM 15834-4-17 分隔号 GWLM 15834-4-17 是替代《GB/T 15834-2011 标点符号用法标准》4.17 小节的模块, 描述了分隔号的定义、形式和基本用法。 -+ 4.17.1 定义 ++ GWLM 15834-4-17-1 定义 + 标号的一种,标示诗行、节拍及某些相关文字的分隔。 -+ 4.17.2 形式 ++ GWLM 15834-4-17-2 形式 + 分隔号的形式是「/」「/」。 - | 符号 | Unicode | - | :---: | :------: | - | / | `U+002F` | - | / | `U+FF0F` | + | 符号 | Unicode | 名称 | + | :---: | :------: | -------------------------------------------------------------- | + | / | `U+002F` | [Solidus](https://www.compart.com/en/unicode/U+002F) | + | / | `U+FF0F` | [Fullwidth Solidus](https://www.compart.com/en/unicode/U+FF0F) | 备注:GWLM 15834-4-17 本身并未指定半角或全角的分隔号(斜线、斜杠) -+ 4.17.3 基本用法 ++ GWLM 15834-4-17-3 基本用法 - + 4.17.3.1 诗歌接排时分隔诗行。 + + GWLM 15834-4-17-3-1 诗歌接排时分隔诗行。 > 洛阳城东路/桃李生路旁/花花自相对/叶叶自相当。 - + 4.17.3.2 标示诗文中的音节节拍。 + + GWLM 15834-4-17-3-2 标示诗文中的音节节拍。 > 床前/看月光,疑是/地上霜。 - + 4.17.3.3 分隔供选择或可转换的两项,表示「或」。 + + GWLM 15834-4-17-3-3 分隔供选择或可转换的两项,标示「或」。 > 这部手机需要指纹/密码来解锁。 - + 4.17.3.4 分隔组成一对的两项,表示「和」。 + + GWLM 15834-4-17-3-4 分隔组成一对的两项,标示「和」。 > 这是 12/13 赛季最强的武器。 > 乒乓球混合双打的组合有水谷隼/伊藤美誠、埃马纽埃尔·勒贝松/袁嘉楠。 - + 4.17.3.5 分隔层级或类别。 + + GWLM 15834-4-17-3-5 分隔层级或类别。 > 行政区划分:省/县/乡/村。