更新到 0.0.20-beta

重置 GWLM 2 书写系统空间,移除了计分相关内容,因为毫无意义……

GWLM 3 暂未重新设计,仍然不可用。
This commit is contained in:
gledos 2023-09-04 19:04:31 +08:00
parent d7591f2348
commit 2b21653213

335
README.md
View File

@ -3,7 +3,7 @@
```yaml
标题: 通用写作律法
创建时间: 2023年8月26日
版本: 0.0.19-beta
版本: 0.0.20-beta
```
<ruby>通用写作律法<rp>(</rp><rt>General Writing Laws</rt><rp>)</rp></ruby>》是由
@ -146,9 +146,9 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
创建时间: 2023年8月26日
```
「书写系统空间」是为文字的不同书写系统划分空间,并为各种部分指定「书写系统属地规范」
「书写系统空间」是为文字的不同书写系统划分空间,然后为「标点符号空位」填入合适的符号
### 划分空间
### GWLM 2-1 书写系统空间核心规则
1. 将文字以标点符号空缺的状态排开。
@ -171,11 +171,11 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
end
```
2. 标示「书名」「数字」「计量单位符号」等特殊的情况
2. 标示「外语」「作品名名」「数字」「计量单位符号」等「片段环境」
```mermaid
---
title: "标示「书名」「数字」及「计量单位符号」等特殊的情况"
title: "标示「外语」「作品名名」「数字」「计量单位符号」等「片段环境」"
---
flowchart TD
@ -186,21 +186,23 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
1C["Steve Jobs"]
1D["中出现过的词语"]
subgraph Sub_A[未添加标点符号]
subgraph Sub_A[ ]
direction LR
subgraph Sub_E[作品名]
subgraph Sub_E["作品名(英语)"]
1C
end
subgraph Sub_F["词语(英语)"]
1A
end
1A --- 1B --- 1C --- 1D
end
```
3. 标示「片段环境」和「书写系统环境」。
3. 标示「书写系统环境」。
```mermaid
---
title: "标示「片段环境」和「书写系统环境」"
title: "标示「书写系统环境」"
---
flowchart TD
@ -213,207 +215,145 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
subgraph Sub_A["书写系统环境(简体中文)"]
direction LR
subgraph Sub_B["常规片段(英文)"]
1A
end
subgraph Sub_C["常规片段(简体中文)"]
1B
end
subgraph Sub_D["作品名(英文)"]
subgraph Sub_E["作品名(英语)"]
1C
end
subgraph Sub_E["常规片段(简体中文"]
1D
subgraph Sub_F["词语(英语)"]
1A
end
1A --- 1B --- 1C --- 1D
end
```
4. 「标点符号空位」分数化
4. 按照书写系统环境」的语言填写所有的标点符号。
1. 「书写系统环境」记作 5 分;
2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;
> apple是乔布斯传《Steve Jobs》中出现过的词语。
5. 特殊规则。
### GWLM 2-2 词间距修补
1. 作品名的「片段环境」直接影响书名号。
〈GWLM 2-2 词间距修补〉是为 CJK 等方块文字不依靠 [词间距](https://en.wikipedia.org/wiki/Word_spacing)
提供的修补措施,启用后将为有词间距的语言添加词间距。
6. 根据分数填写各种书写系统的标点符号
备注:在 GWLM 中,「词间距」与「空格字符」是同义词
```mermaid
---
title: "演示 1"
---
flowchart TD
| 语言环境 | 默认状态 | 启用 GWLM 2-2 |
| -------- | --------------------------------- | ------------------------------------ |
| 简体中文 | Treatyourselfwell这句座右铭不错。 | Treat yourself well 这句座右铭不错。 |
%% 我们的客户有 Apple、Facebook、Google 和 Microsoft
因为中文等语言没有词间距,直接引用其他语言的内容就会挤在一起。
1A["我们的客户有"]
1B["Apple"]
1C["Facebook"]
1D["Google"]
1E["和"]
1F["Microsoft"]
### GWLM 2-3 作品名修补
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D --- 1E --- 1F
end
〈GWLM 2-3 作品名修补〉是为书名号以及斜体修补的规则,直接使用作品名以来源主体的语言的书名表达方式。
%% 分割线
| | 类型 | 作品地理属性 | 标题语言 | 作品语言 |
| ---------------- | ---- | ------------ | ------------- | ------------- |
| Carmen | 歌剧 | 法国 | fr | fr |
| Carmen | 歌剧 | 法国 | en | fr |
| 卡门 | 歌剧 | 法国 | zh_Hans | fr |
| David | 雕塑 | 意大利 | en, it, fr ,… | |
| 大卫像 | 雕塑 | 意大利 | zh_Hans | |
| WALL•E | 电影 | 全球发行 | en, it, fr ,… | en, it, fr ,… |
| 机器人总动员 | 电影 | 全球发行 | zh_Hans | zh_Hans |
| 千と千尋の神隠し | 电影 | 全球发行 | jp | jp |
| 千与千寻 | 电影 | 全球发行 | zh_Hans | zh_Hans |
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;"] --> 2B["对每个标点符号位置都计算分数"]
end
如此表所示Carmen卡门歌剧是欧洲许多语言都共通的名称这时可以使用作品地理属性来决定作品名的表示方法。
%% 分割线
各地的作品名标记方式:
3A["我们的客户有"]
3B["Apple"]
3C["Facebook"]
3D["Google"]
3E["和"]
3F["Microsoft"]
+ 中文
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"简中 7
英文 2"| 3B --- |"简中 5
英文 4"| 3C --- |"简中 5
英文 4"| 3D --- |"简中 7
英文 2"| 3E --- |"简中 7
英文 2"| 3F
end
直接参考 GWLM 15834 即可。
Sub_A --> Sub_B --> Sub_C
```
+ 英文
---
通常使用 [斜体](https://en.wikipedia.org/wiki/Italic_type) 或者
[引号](https://en.wikipedia.org/wiki/Quotation_marks),细节待编写。
```mermaid
---
title: "演示 2数学"
---
flowchart TD
+ 法文
%% 元素依次为 1, 3, 4, 9, 12, 16, 27, …
通常使用 [斜体](https://fr.wikipedia.org/wiki/Italique_(typographie)) 或者
[Guillemet 引号](https://fr.wikipedia.org/wiki/Guillemet),细节待编写。
1A["元素依次为"]
1B["1"]
1C["3"]
1D["4"]
1E["9"]
1F["12"]
1G["16"]
1H["17"]
1I["…"]
+ 其他语言待编写。
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D --- 1E --- 1F --- 1G --- 1H --- 1I
end
### GWLM 2-4 括号修补
%% 分割线
〈GWLM 2-4 括号修补〉是为括号修补的规则,直接使用文字来源主体的语言的括号表达方式。
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分。"] --> 2B["对每个标点符号位置都计算分数"]
end
### GWLM 2-5 引号修补
%% 分割线
〈GWLM 2-5 引号修补〉是为引号的规则,直接使用文字来源主体的语言的括号表达方式。
3A["元素依次为"]
3B["1"]
3C["3"]
3D["4"]
3E["9"]
3F["12"]
3G["16"]
3H["17"]
3I["…"]
### GWLM 2-6 外来语修补
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"简中 7
数学 4"| 3B --- |"简中 5
数学 6"| 3C --- |"简中 5
数学 6"| 3D --- |"简中 5
数学 6"| 3E --- |"简中 5
数学 6"| 3F --- |"简中 5
数学 6"| 3G --- |"简中 5
数学 6"| 3H --- |"简中 5
数学 6"| 3I
end
前言:
Sub_A --> Sub_B --> Sub_C --> Sub_D["元素依次为 1, 3, 4, 9, 12, 16, 27, …"]
```
使用语言来描述语言,就会涉及到 [使用与提及的区别](https://en.wikipedia.org/wiki/Usemention_distinction)
问题,就像下面的笑话一样:
---
> 甲:如何设置壁纸?
>
> 乙:设置个性化。
>
> 甲:我就是不知道如何设置个性化,才询问,你回答这个对我没有用。
>
> 乙:进入「设置」,点击「个性化」。
>
> 甲:啊?
```mermaid
---
title: "演示 3外语书名号"
---
flowchart TD
所以现在大多数语言在提及某个词语时,使用引号、斜体等方式,标记被提及而不是在使用的词语,
是比较常用的方式。(但过度使用可能会显得迂腐。)
%% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。
使用外国的文字通常也是属于「提及」,所以需要使用引号、斜体等方式标记。
1A["apple"]
1B["是乔布斯传"]
1C["Steve Jobs"]
1D["中出现过的词语"]
〈GWLM 2-6 外来语修补〉是为引号修补的规则,放弃对一部分具有通用性的直接使用的外来语,
使用引号或者斜体等方式进行标记。
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D
end
%% 分割线
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
2. 根据标点符号空位的左右的「片段环境」,各记作 2 分;
3. 作品名的左右「标点符号空位」,记作 10 分。"] --> 2C["对每个标点符号位置都计算分数"]
2B["1. 作品名的「片段环境」直接影响书名号。"]
end
%% 分割线
3A["apple"]
3B["是乔布斯传"]
3C["Steve Jobs"]
3D["中出现过的词语"]
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"英文 2
简中 7"| 3B --- |"简中 7
英文 2书名号受影响"| 3C --- |"英文 2书名号受影响
简中 7"| 3D
end
Sub_A --> Sub_B --> Sub_C --> Sub_D["apple 是乔布斯传 𝑆𝑡𝑒𝑣𝑒 𝐽𝑜𝑏𝑠 中出现过的词语。"]
```
### 使用引号标记外语
> 简体中文语言环境:我们的客户有 Apple、Facebook、Google 和 Microsoft。
> 英语语言环境Our clients include “百度”, “腾讯”, “金山” and “奇虎360”.
各地文字之间存在兼容性,阿拉伯数字基本上融入了大部分书写系统,所以不需要当作外语使用引号标记。
DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司,
都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词,
如果文字已经成为了事实上的,直接使用的 [外来语](https://zh.wikipedia.org/wiki/外来语)
比如 DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司。
就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。
但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。
| 语言环境 | 默认状态 | 启用 GWLM 2-6 |
| -------- | ------------------------------------------------------------ | --------------------------------------------------------- |
| 简体中文 | 我们的客户有「Apple」「Facebook」「Google」和「Microsoft」。 | 我们的客户有 Apple、Facebook、Google 和 Microsoft。 |
| 英语 | Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. | Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. |
### GWLM 2-7 数学修补
前言:
理论上出现关于数学的内容,都需要使用当地的语言的标点符号,比如:
> 元素依次为 1、3、4、9、12、16、27……
> The elements are 1, 3, 4, 9, 12, 16, 27, …
但是间隔的宽度能看到明显差异,在常规字体自动排版的情况下,顿号的宽度是全角(一个汉字宽度),
而西式逗号与空格的宽度加起来仅有半角(半个汉字宽度),这可能会导致顿号排出来的数字不利于数学内容展示。
〈GWLM 2-7 数学修补〉是为数学内容修补的规则,将数学内容,以西式标点进行书写,包括以下内容。
> [!WARNING]
>
> 具体情况,还需要进一步研究,这里只是随意编写了一点内容。
1. 数组使用西式写法。
> 元素依次为 1, 3, 4, 9, 12, 16, 27, …,然后……
像这样,省略号也要使用西式省略号。但数组外部,比如省略号后的逗号,依然使用「书写系统环境」的标点符号。
2. 多个式子横排时,之间的标点符号使用西式。
> 假设 a = 1, b = 2那么……
> 假设 a = 1; b = 2那么……
3. 式子单独为一行时,居中并使用西式句点结尾。
> <p align="center">a × b = 10c.</p>
## GWLM 3 书写系统规范
@ -432,11 +372,24 @@ GWLM 3 待修改,因为与 GWLM 2 存在矛盾。*
+ 繁体中文以《[重訂標點符號手冊][]》作为标点符号用法标准。
[GB/T 15834—2011 标点符号用法标准]: http://www.moe.gov.cn/ewebeditor/uploadfile/2015/01/13/20150113091548267.pdf
[重訂標點符號手冊]: https://language.moe.gov.tw/001/Upload/FILES/SITE_CONTENT/M1/HAU/haushou.htm
其他地区的书写系统基本没有硬性规定的正字法、标点符号用法标准,所以暂不定义。
+ GWLM 3-0尊重产品名词等专有名词的书写规范。[^ccg_108]
### GWLM 3-1 尊重专有名词
产品名词可以参考官方网站、印刷品或者含有名称的地方,然后检查间距或书写情况,如果官方的使用混乱,
视作没有规范。[^ccg_108]
[^ccg_108]: sgalal, 《[關於中文與英文、中文與數字間添加間距的疑問 · Issue #108 · sparanoid/chinese-copywriting-guidelines](https://github.com/sparanoid/chinese-copywriting-guidelines/issues/108)》, GitHub, 2020-01-27. (参照 2023-08-27).
没有作者定义的专有名词比如「维生素C」「U盘」「USBフラッシュドライブ」这类由第三方翻译而来的专有名词
视作没有规范。
<!--
### GWLM 3-0尊重产品名词等专有名词的书写规范。[^ccg_108]
[^ccg_108]: sgalal, 《[關於中文與英文、中文與數字間添加間距的疑問 · Issue #108 · sparanoid/chinese-copywriting-guidelines](https://github.com/sparanoid/chinese-copywriting-guidelines/issues/108)》, GitHub, 2020-01-27. (参照 2023-08-27).
@ -445,18 +398,21 @@ GWLM 3 待修改,因为与 GWLM 2 存在矛盾。*
没有作者定义的专有名词比如「维生素C」「U盘」「USBフラッシュドライブ」这类翻译而来的专有名词
视作没有规范。
-->
<!--
+ GWLM 3-1各书写系统的写作方法在能在片段环境中完整生效例外
+ GWLM 3-1-1句首大写。
+ -->
+ GWLM 3-2片段环境会影响首尾有成对的符号例外
<!-- + GWLM 3-2片段环境会影响首尾有成对的符号例外
+ GWLM 3-2-1括号。
+ GWLM 3-2-2引号。
+ GWLM 3-2-4书名号包括使用斜体标示书名
+ GWLM 3-2-4书名号包括使用斜体标示书名 -->
+ GWLM 3-3单位符号与数字之间需要增加空格例外
@ -698,7 +654,6 @@ Emoji 被视作半角字符并且连续使用时Emoji 之间也需要有
并兼容《[GB/T 15834—2011 标点符号用法标准][]》的模块。这样在未来就不需要以不够开放的资料,
作为 GWLM 的基础,但是任重道远,还有大量待重写的部分。
[GB/T 15834—2011 标点符号用法标准]: http://www.moe.gov.cn/ewebeditor/uploadfile/2015/01/13/20150113091548267.pdf
《GB/T 15834—2011 标点符号用法标准》属于推荐标准。即使是
《[GB/T 1.1—2020 标准化工作导则第1部分 标准化文件的结构和起草规则][]》9.4.2.4
@ -779,7 +734,7 @@ GWLM 15834-5, GWLM 15834-6, GWLM 15834-7 下的一切内容。
包括
[引号](#gwlm-15834-4-8-引号)、
[狭义括号](#gwlm-15834-4-9-狭义括号)、
[括号](#gwlm-15834-4-9-括号)、
[书名号](#gwlm-15834-4-15-书名号)。
### GWLM 15834-3 未定义
@ -1142,10 +1097,10 @@ GWLM 15834-4-8 是替代《GB/T 15834—2011 标点符号用法标准》4.8 的
>
> 「不管是英文还是什么,别给我加上一堆片假名啊!」
#### GWLM 15834-4-9 狭义括号
#### GWLM 15834-4-9 括号
GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的模块,
描述了狭义括号的定义、形式和基本用法。
描述了括号的定义、形式和基本用法。
+ GWLM 15834-4-9-1 定义
@ -1153,7 +1108,7 @@ GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的
+ GWLM 15834-4-9-2 形式
狭义括号的形式有圆括号:「(」「)」;方括号:「[」「]」;六角括号:「〔」「〕」;方头括号:「【」「】」,
括号的形式有圆括号:「(」「)」;方括号:「[」「]」;六角括号:「〔」「〕」;方头括号:「【」「】」,
每套都由左、右括号组成。也能使用其他具有前后关系的词语形容,比如前、后括号;开、关括号。
| 符号 | Unicode | 名称 |
@ -1216,7 +1171,7 @@ GWLM 15834-4-9 是替代《GB/T 15834—2011 标点符号用法标准》4.9 的
> 【工信部】中华人民共和国工业和信息化部。主管工业和信息产业的组成部门。
+ GWLM 15834-4-9-3-6 自然语言中,狭义括号不宜嵌套。如果嵌套应交替使用。(顺序不定,文章中符合一定规律即可。)
+ GWLM 15834-4-9-3-6 自然语言中,括号不宜嵌套。如果嵌套应交替使用。(顺序不定,文章中符合一定规律即可。)
> (当时那把剑离我的喉咙只有 0.01 公分,但是四分之一炷香之后[一炷香的时间大约是一小时],
> 那把剑的女主人将会彻底地爱上我,因为我决定说一个谎话。)
@ -1240,7 +1195,7 @@ GWLM 15834-4-10 是替代《GB/T 15834—2011 标点符号用法标准》4.10
+ GWLM 15834-4-10-3 基本用法
+ GWLM 15834-4-10-3-1 类似括号的用法(也可用 [括号](#gwlm-15834-4-9-狭义括号)
+ GWLM 15834-4-10-3-1 类似括号的用法(也可用 [括号](#gwlm-15834-4-9-括号)
二者的区别另见附录 B.1.7)。
> 人的道路是没有中断的,而且是一直联系在一起的东西——不管是多么渺小的事件。
@ -1696,7 +1651,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17
| 叹号 | ⁈ | | ‼ | ‼! |
| 两个叹号 | | | ‼! | |
+ GWLM 15834-5-1-3 括号(引号、狭义括号、书名号)的位置和书写形式。
+ GWLM 15834-5-1-3 广义括号(引号、括号、书名号)的位置和书写形式。
| 符号 | 置于文字 | 宽度 | 方位 | 行首使用 |
| :---: | :--------: | :---: | :--------------: | :------: |
@ -1863,11 +1818,11 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17
暂略*。(因为无法找到「选题名」的含义,不确定这段规则的含义。)
8. 狭义括号用法补充规则。
8. 括号用法补充规则。
狭义括号分为句内和句外,句内应紧跟须解释的词语之后,而句外应放置在末尾点号之后。
括号分为句内和句外,句内应紧跟须解释的词语之后,而句外应放置在末尾点号之后。
> 自然语言(非数学公式、编程语言等)中,狭义括号可以嵌套,但应交替使用。(顺序不定,文章中符合一定规律即可。)
> 自然语言(非数学公式、编程语言等)中,括号可以嵌套,但应交替使用。(顺序不定,文章中符合一定规律即可。)
9. 省略号用法补充规则。
@ -1954,7 +1909,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17
7~8 : 0001-01-07, 2d
section 引号
3 : 0001-01-03, 1d
section 狭义括号
section 括号
3 : 0001-01-03, 1d
%% section 破折号
%% "" : 0001-01-01, 10d
@ -2150,9 +2105,9 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17
示例 8俗话说“墙头一根草风吹两边倒。”用这句话来形容此辈再恰当不过。
-->
2. 行文中狭义括号内外的标点用法
2. 行文中括号内外的标点用法
句内狭义括号通常不用句号,句外狭义括号根据内容长度和复杂程度决定标点符号。
句内括号通常不用句号,句外括号根据内容长度和复杂程度决定标点符号。
> 《植物大战僵尸》的高清版本很少iPad 上面的 HD 版不够高清,所以不算),而 EA 显然忘记了 PC 平台……
@ -2287,7 +2242,7 @@ GWLM 15834-4-17 是替代《GB/T 15834—2011 标点符号用法标准》4.17
<!-- 示例 2本课一共讲解三个要点A. 生理停顿B. 逻辑停顿C. 语法停顿。 -->
4. 带有狭义括号的顺序词后,不用点号。
4. 带有括号的顺序词后,不用点号。
> 网站平台应当重点受理处置以下涉企网络侵权信息举报:(一)混淆企业主体身份的仿冒性信息;
> (二)影响公众公正评判的误导性信息;(三)不符合企业客观实际的谣言性信息;……