From 2b216532138534291fe6c500bb7afab802c77ad5 Mon Sep 17 00:00:00 2001 From: gledos Date: Mon, 4 Sep 2023 19:04:31 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E5=88=B0=200.0.20-beta?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 重置 GWLM 2 书写系统空间,移除了计分相关内容,因为毫无意义…… GWLM 3 暂未重新设计,仍然不可用。 --- README.md | 335 +++++++++++++++++++++++------------------------------- 1 file changed, 145 insertions(+), 190 deletions(-) diff --git a/README.md b/README.md index 96445eb..9e87702 100644 --- a/README.md +++ b/README.md @@ -3,7 +3,7 @@ ```yaml 标题: 通用写作律法 创建时间: 2023年8月26日 -版本: 0.0.19-beta +版本: 0.0.20-beta ``` 《通用写作律法(General Writing Laws)》是由 @@ -146,9 +146,9 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge 创建时间: 2023年8月26日 ``` -「书写系统空间」是为文字的不同书写系统划分空间,并为各种部分指定「书写系统属地规范」。 +「书写系统空间」是为文字的不同书写系统划分空间,然后为「标点符号空位」填入合适的符号。 -### 划分空间 +### GWLM 2-1 书写系统空间核心规则 1. 将文字以标点符号空缺的状态排开。 @@ -171,11 +171,11 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge end ``` -2. 标示「书名」「数字」「计量单位符号」等特殊的情况。 +2. 标示「外语」「作品名名」「数字」「计量单位符号」等「片段环境」。 ```mermaid --- - title: "标示「书名」「数字」及「计量单位符号」等特殊的情况" + title: "标示「外语」「作品名名」「数字」「计量单位符号」等「片段环境」" --- flowchart TD @@ -186,21 +186,23 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge 1C["Steve Jobs"] 1D["中出现过的词语"] - subgraph Sub_A[未添加标点符号] + subgraph Sub_A[ ] direction LR - subgraph Sub_E[作品名] + subgraph Sub_E["作品名(英语)"] 1C end + subgraph Sub_F["词语(英语)"] + 1A + end 1A --- 1B --- 1C --- 1D end ``` -3. 标示「片段环境」和「书写系统环境」。 - +3. 标示「书写系统环境」。 ```mermaid --- - title: "标示「片段环境」和「书写系统环境」" + title: "标示「书写系统环境」" --- flowchart TD @@ -213,207 +215,145 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge subgraph Sub_A["书写系统环境(简体中文)"] direction LR - subgraph Sub_B["常规片段(英文)"] - 1A - end - subgraph Sub_C["常规片段(简体中文)"] - 1B - end - subgraph Sub_D["作品名(英文)"] + subgraph Sub_E["作品名(英语)"] 1C end - subgraph Sub_E["常规片段(简体中文)"] - 1D + subgraph Sub_F["词语(英语)"] + 1A end 1A --- 1B --- 1C --- 1D end ``` -4. 「标点符号空位」分数化。 +4. 按照「书写系统环境」的语言填写所有的标点符号。 - 1. 「书写系统环境」记作 5 分; - 2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分; - 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分; + > apple是乔布斯传《Steve Jobs》中出现过的词语。 -5. 特殊规则。 +### GWLM 2-2 词间距修补 - 1. 作品名的「片段环境」直接影响书名号。 +〈GWLM 2-2 词间距修补〉是为 CJK 等方块文字不依靠 [词间距](https://en.wikipedia.org/wiki/Word_spacing) +提供的修补措施,启用后将为有词间距的语言添加词间距。 -6. 根据分数填写各种书写系统的标点符号。 +备注:在 GWLM 中,「词间距」与「空格字符」是同义词。 - ```mermaid - --- - title: "演示 1" - --- - flowchart TD +| 语言环境 | 默认状态 | 启用 GWLM 2-2 | +| -------- | --------------------------------- | ------------------------------------ | +| 简体中文 | Treatyourselfwell这句座右铭不错。 | Treat yourself well 这句座右铭不错。 | - %% 我们的客户有 Apple、Facebook、Google 和 Microsoft。 +因为中文等语言没有词间距,直接引用其他语言的内容就会挤在一起。 - 1A["我们的客户有"] - 1B["Apple"] - 1C["Facebook"] - 1D["Google"] - 1E["和"] - 1F["Microsoft"] +### GWLM 2-3 作品名修补 - subgraph Sub_A[未添加标点符号] - direction LR - 1A --- 1B --- 1C --- 1D --- 1E --- 1F - end +〈GWLM 2-3 作品名修补〉是为书名号以及斜体修补的规则,直接使用作品名以来源主体的语言的书名表达方式。 - %% 分割线 +| \ | 类型 | 作品地理属性 | 标题语言 | 作品语言 | +| ---------------- | ---- | ------------ | ------------- | ------------- | +| Carmen | 歌剧 | 法国 | fr | fr | +| Carmen | 歌剧 | 法国 | en | fr | +| 卡门 | 歌剧 | 法国 | zh_Hans | fr | +| David | 雕塑 | 意大利 | en, it, fr ,… | / | +| 大卫像 | 雕塑 | 意大利 | zh_Hans | / | +| WALL•E | 电影 | 全球发行 | en, it, fr ,… | en, it, fr ,… | +| 机器人总动员 | 电影 | 全球发行 | zh_Hans | zh_Hans | +| 千と千尋の神隠し | 电影 | 全球发行 | jp | jp | +| 千与千寻 | 电影 | 全球发行 | zh_Hans | zh_Hans | - subgraph Sub_B[处理] - direction LR - 2A["1. 「书写系统环境」记作 5 分; - 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;"] --> 2B["对每个标点符号位置都计算分数"] - end +如此表所示,Carmen(卡门[歌剧])是欧洲许多语言都共通的名称,这时可以使用作品地理属性来决定作品名的表示方法。 - %% 分割线 +各地的作品名标记方式: - 3A["我们的客户有"] - 3B["Apple"] - 3C["Facebook"] - 3D["Google"] - 3E["和"] - 3F["Microsoft"] ++ 中文 - subgraph Sub_C[标点符号分数] - direction LR - 3A --- |"简中 7 - 英文 2"| 3B --- |"简中 5 - 英文 4"| 3C --- |"简中 5 - 英文 4"| 3D --- |"简中 7 - 英文 2"| 3E --- |"简中 7 - 英文 2"| 3F - end + 直接参考 GWLM 15834 即可。 - Sub_A --> Sub_B --> Sub_C - ``` ++ 英文 - --- + 通常使用 [斜体](https://en.wikipedia.org/wiki/Italic_type) 或者 + [引号](https://en.wikipedia.org/wiki/Quotation_marks),细节待编写。 - ```mermaid - --- - title: "演示 2(数学)" - --- - flowchart TD ++ 法文 - %% 元素依次为 1, 3, 4, 9, 12, 16, 27, … + 通常使用 [斜体](https://fr.wikipedia.org/wiki/Italique_(typographie)) 或者 + [Guillemet 引号](https://fr.wikipedia.org/wiki/Guillemet),细节待编写。 - 1A["元素依次为"] - 1B["1"] - 1C["3"] - 1D["4"] - 1E["9"] - 1F["12"] - 1G["16"] - 1H["17"] - 1I["…"] ++ 其他语言待编写。 - subgraph Sub_A[未添加标点符号] - direction LR - 1A --- 1B --- 1C --- 1D --- 1E --- 1F --- 1G --- 1H --- 1I - end +### GWLM 2-4 括号修补 - %% 分割线 +〈GWLM 2-4 括号修补〉是为括号修补的规则,直接使用文字来源主体的语言的括号表达方式。 - subgraph Sub_B[处理] - direction LR - 2A["1. 「书写系统环境」记作 5 分; - 2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分; - 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分。"] --> 2B["对每个标点符号位置都计算分数"] - end +### GWLM 2-5 引号修补 - %% 分割线 +〈GWLM 2-5 引号修补〉是为引号的规则,直接使用文字来源主体的语言的括号表达方式。 - 3A["元素依次为"] - 3B["1"] - 3C["3"] - 3D["4"] - 3E["9"] - 3F["12"] - 3G["16"] - 3H["17"] - 3I["…"] +### GWLM 2-6 外来语修补 - subgraph Sub_C[标点符号分数] - direction LR - 3A --- |"简中 7 - 数学 4"| 3B --- |"简中 5 - 数学 6"| 3C --- |"简中 5 - 数学 6"| 3D --- |"简中 5 - 数学 6"| 3E --- |"简中 5 - 数学 6"| 3F --- |"简中 5 - 数学 6"| 3G --- |"简中 5 - 数学 6"| 3H --- |"简中 5 - 数学 6"| 3I - end +前言: - Sub_A --> Sub_B --> Sub_C --> Sub_D["元素依次为 1, 3, 4, 9, 12, 16, 27, …"] - ``` +使用语言来描述语言,就会涉及到 [使用与提及的区别](https://en.wikipedia.org/wiki/Use–mention_distinction) +问题,就像下面的笑话一样: - --- +> 甲:如何设置壁纸? +> +> 乙:设置个性化。 +> +> 甲:我就是不知道如何设置个性化,才询问,你回答这个对我没有用。 +> +> 乙:进入「设置」,点击「个性化」。 +> +> 甲:啊? - ```mermaid - --- - title: "演示 3(外语书名号)" - --- - flowchart TD +所以现在大多数语言在提及某个词语时,使用引号、斜体等方式,标记被提及而不是在使用的词语, +是比较常用的方式。(但过度使用可能会显得迂腐。) - %% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。 +使用外国的文字通常也是属于「提及」,所以需要使用引号、斜体等方式标记。 - 1A["apple"] - 1B["是乔布斯传"] - 1C["Steve Jobs"] - 1D["中出现过的词语"] +〈GWLM 2-6 外来语修补〉是为引号修补的规则,放弃对一部分具有通用性的直接使用的外来语, +使用引号或者斜体等方式进行标记。 - subgraph Sub_A[未添加标点符号] - direction LR - 1A --- 1B --- 1C --- 1D - end - - %% 分割线 - - subgraph Sub_B[处理] - direction LR - 2A["1. 「书写系统环境」记作 5 分; - 2. 根据标点符号空位的左右的「片段环境」,各记作 2 分; - 3. 作品名的左右「标点符号空位」,记作 10 分。"] --> 2C["对每个标点符号位置都计算分数"] - 2B["1. 作品名的「片段环境」直接影响书名号。"] - end - - %% 分割线 - - 3A["apple"] - 3B["是乔布斯传"] - 3C["Steve Jobs"] - 3D["中出现过的词语"] - - subgraph Sub_C[标点符号分数] - direction LR - 3A --- |"英文 2 - 简中 7"| 3B --- |"简中 7 - 英文 2(书名号受影响)"| 3C --- |"英文 2(书名号受影响) - 简中 7"| 3D - end - - Sub_A --> Sub_B --> Sub_C --> Sub_D["apple 是乔布斯传 𝑆𝑡𝑒𝑣𝑒 𝐽𝑜𝑏𝑠 中出现过的词语。"] - ``` - -### 使用引号标记外语 - -> 简体中文语言环境:我们的客户有 Apple、Facebook、Google 和 Microsoft。 - -> 英语语言环境:Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. - -各地文字之间存在兼容性,阿拉伯数字基本上融入了大部分书写系统,所以不需要当作外语使用引号标记。 - -DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司, -都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词, +如果文字已经成为了事实上的,直接使用的 [外来语](https://zh.wikipedia.org/wiki/外来语), +比如 DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司。 就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。 -但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。 +| 语言环境 | 默认状态 | 启用 GWLM 2-6 | +| -------- | ------------------------------------------------------------ | --------------------------------------------------------- | +| 简体中文 | 我们的客户有「Apple」「Facebook」「Google」和「Microsoft」。 | 我们的客户有 Apple、Facebook、Google 和 Microsoft。 | +| 英语 | Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. | Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. | + +### GWLM 2-7 数学修补 + +前言: + +理论上出现关于数学的内容,都需要使用当地的语言的标点符号,比如: + +> 元素依次为 1、3、4、9、12、16、27…… + +> The elements are 1, 3, 4, 9, 12, 16, 27, … + +但是间隔的宽度能看到明显差异,在常规字体自动排版的情况下,顿号的宽度是全角(一个汉字宽度), +而西式逗号与空格的宽度加起来仅有半角(半个汉字宽度),这可能会导致顿号排出来的数字不利于数学内容展示。 + +〈GWLM 2-7 数学修补〉是为数学内容修补的规则,将数学内容,以西式标点进行书写,包括以下内容。 + +> [!WARNING] +> +> 具体情况,还需要进一步研究,这里只是随意编写了一点内容。 + +1. 数组使用西式写法。 + + > 元素依次为 1, 3, 4, 9, 12, 16, 27, …,然后…… + + 像这样,省略号也要使用西式省略号。但数组外部,比如省略号后的逗号,依然使用「书写系统环境」的标点符号。 + +2. 多个式子横排时,之间的标点符号使用西式。 + + > 假设 a = 1, b = 2,那么…… + + > 假设 a = 1; b = 2,那么…… + +3. 式子单独为一行时,居中并使用西式句点结尾。 + + >

a × b = 10c.

## GWLM 3 书写系统规范 @@ -432,11 +372,24 @@ GWLM 3 待修改,因为与 GWLM 2 存在矛盾。* + 繁体中文以《[重訂標點符號手冊][]》作为标点符号用法标准。 +[GB/T 15834—2011 标点符号用法标准]: http://www.moe.gov.cn/ewebeditor/uploadfile/2015/01/13/20150113091548267.pdf + [重訂標點符號手冊]: https://language.moe.gov.tw/001/Upload/FILES/SITE_CONTENT/M1/HAU/haushou.htm 其他地区的书写系统基本没有硬性规定的正字法、标点符号用法标准,所以暂不定义。 -+ GWLM 3-0:尊重产品名词等专有名词的书写规范。[^ccg_108] +### GWLM 3-1 尊重专有名词 + +产品名词可以参考官方网站、印刷品或者含有名称的地方,然后检查间距或书写情况,如果官方的使用混乱, +视作没有规范。[^ccg_108] + +[^ccg_108]: sgalal, 《[關於中文與英文、中文與數字間添加間距的疑問 · Issue #108 · sparanoid/chinese-copywriting-guidelines](https://github.com/sparanoid/chinese-copywriting-guidelines/issues/108)》, GitHub, 2020-01-27. (参照 2023-08-27). + +没有作者定义的专有名词,比如「维生素C」「U盘」「USBフラッシュドライブ」这类由第三方翻译而来的专有名词, +视作没有规范。 + + + -+ GWLM 3-2:片段环境会影响首尾有成对的符号,例外: + + GWLM 3-3:单位符号与数字之间需要增加空格,例外: @@ -698,7 +654,6 @@ Emoji 被视作半角字符,并且连续使用时,Emoji 之间也需要有 并兼容《[GB/T 15834—2011 标点符号用法标准][]》的模块。这样在未来就不需要以不够开放的资料, 作为 GWLM 的基础,但是任重道远,还有大量待重写的部分。 -[GB/T 15834—2011 标点符号用法标准]: http://www.moe.gov.cn/ewebeditor/uploadfile/2015/01/13/20150113091548267.pdf 《GB/T 15834—2011 标点符号用法标准》属于推荐标准。即使是 《[GB/T 1.1—2020 标准化工作导则第1部分 标准化文件的结构和起草规则][]》9.4.2.4, @@ -779,7 +734,7 @@ GWLM 15834-5, GWLM 15834-6, GWLM 15834-7 下的一切内容。 包括 [引号](#gwlm-15834-4-8-引号)、 -[狭义括号](#gwlm-15834-4-9-狭义括号)、 +[括号](#gwlm-15834-4-9-括号)、 [书名号](#gwlm-15834-4-15-书名号)。 ### GWLM 15834-3 未定义 @@ -1142,10 +1097,10 @@ GWLM 15834-4-8 是替代《GB/T 15834—2011 标点符号用法标准》4.8 的 > > 「不管是英文还是什么,别给我加上一堆片假名啊!」 -#### GWLM 15834-4-9 狭义括号 +#### GWLM 15834-4-9 括号 GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的模块, -描述了狭义括号的定义、形式和基本用法。 +描述了括号的定义、形式和基本用法。 + GWLM 15834-4-9-1 定义 @@ -1153,7 +1108,7 @@ GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的 + GWLM 15834-4-9-2 形式 - 狭义括号的形式有圆括号:「(」「)」;方括号:「[」「]」;六角括号:「〔」「〕」;方头括号:「【」「】」, + 括号的形式有圆括号:「(」「)」;方括号:「[」「]」;六角括号:「〔」「〕」;方头括号:「【」「】」, 每套都由左、右括号组成。也能使用其他具有前后关系的词语形容,比如前、后括号;开、关括号。 | 符号 | Unicode | 名称 | @@ -1216,7 +1171,7 @@ GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的 > 【工信部】中华人民共和国工业和信息化部。主管工业和信息产业的组成部门。 - + GWLM 15834-4-9-3-6 自然语言中,狭义括号不宜嵌套。如果嵌套应交替使用。(顺序不定,文章中符合一定规律即可。) + + GWLM 15834-4-9-3-6 自然语言中,括号不宜嵌套。如果嵌套应交替使用。(顺序不定,文章中符合一定规律即可。) > (当时那把剑离我的喉咙只有 0.01 公分,但是四分之一炷香之后[一炷香的时间大约是一小时], > 那把剑的女主人将会彻底地爱上我,因为我决定说一个谎话。) @@ -1240,7 +1195,7 @@ GWLM 15834-4-10 是替代《GB/T 15834—2011 标点符号用法标准》4.10 + GWLM 15834-4-10-3 基本用法 - + GWLM 15834-4-10-3-1 类似括号的用法(也可用 [括号](#gwlm-15834-4-9-狭义括号); + + GWLM 15834-4-10-3-1 类似括号的用法(也可用 [括号](#gwlm-15834-4-9-括号); 二者的区别另见附录 B.1.7)。 > 人的道路是没有中断的,而且是一直联系在一起的东西——不管是多么渺小的事件。 @@ -1696,7 +1651,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17 | 叹号 | ⁈ | / | ‼ | ‼! | | 两个叹号 | / | / | ‼! | / | -+ GWLM 15834-5-1-3 括号(引号、狭义括号、书名号)的位置和书写形式。 ++ GWLM 15834-5-1-3 广义括号(引号、括号、书名号)的位置和书写形式。 | 符号 | 置于文字 | 宽度 | 方位 | 行首使用 | | :---: | :--------: | :---: | :--------------: | :------: | @@ -1863,11 +1818,11 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17 暂略*。(因为无法找到「选题名」的含义,不确定这段规则的含义。) -8. 狭义括号用法补充规则。 +8. 括号用法补充规则。 - 狭义括号分为句内和句外,句内应紧跟须解释的词语之后,而句外应放置在末尾点号之后。 + 括号分为句内和句外,句内应紧跟须解释的词语之后,而句外应放置在末尾点号之后。 - > 自然语言(非数学公式、编程语言等)中,狭义括号可以嵌套,但应交替使用。(顺序不定,文章中符合一定规律即可。) + > 自然语言(非数学公式、编程语言等)中,括号可以嵌套,但应交替使用。(顺序不定,文章中符合一定规律即可。) 9. 省略号用法补充规则。 @@ -1954,7 +1909,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17 7~8 : 0001-01-07, 2d section 引号 3 : 0001-01-03, 1d - section 狭义括号 + section 括号 3 : 0001-01-03, 1d %% section 破折号 %% "\" : 0001-01-01, 10d @@ -2150,9 +2105,9 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17 示例 8:俗话说:“墙头一根草,风吹两边倒。”用这句话来形容此辈再恰当不过。 --> - 2. 行文中狭义括号内外的标点用法 + 2. 行文中括号内外的标点用法 - 句内狭义括号通常不用句号,句外狭义括号根据内容长度和复杂程度决定标点符号。 + 句内括号通常不用句号,句外括号根据内容长度和复杂程度决定标点符号。 > 《植物大战僵尸》的高清版本很少(iPad 上面的 HD 版不够高清,所以不算),而 EA 显然忘记了 PC 平台…… @@ -2287,7 +2242,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17 - 4. 带有狭义括号的顺序词后,不用点号。 + 4. 带有括号的顺序词后,不用点号。 > 网站平台应当重点受理处置以下涉企网络侵权信息举报:(一)混淆企业主体身份的仿冒性信息; > (二)影响公众公正评判的误导性信息;(三)不符合企业客观实际的谣言性信息;……