更新到 0.0.19-beta

+ 重置 GWLM 2 书写系统空间,使用 mermaid 绘图,并添加分数化规范。
+ 问题:因为修改了 GWLM 2,所以下游的 GWLM 3 暂时失效,待修复。
This commit is contained in:
gledos 2023-09-02 14:03:49 +08:00
parent b08409d8ff
commit d7591f2348

309
README.md
View File

@ -3,7 +3,7 @@
```yaml
标题: 通用写作律法
创建时间: 2023年8月26日
版本: 0.0.18-beta
版本: 0.0.19-beta
```
<ruby>通用写作律法<rp>(</rp><rt>General Writing Laws</rt><rp>)</rp></ruby>》是由
@ -108,18 +108,18 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
### 书写系统词汇表
+ GWLM 1-0书写系统 (writing system)、字符 (character)
+ GWLM 1-0 书写系统 (writing system)、字符 (character)
指 Unicode 字符集中的所有字符,包含数字、文字(字母文字、象形文字)、标点符号和其他符号。
使用方式:描述指向的是某一地区的字符,那么使用书写系统,比如「中文书写系统」「英文书写系统」,
描述指向的的字符没有地区性质,那么使用字符,比如「全角字符」「半角字符」「所有的字符」「表意字符」
+ GWLM 1-1数字
+ GWLM 1-1 数字
这里是指狭义上的阿拉伯数字,包括半角 0123456789 以及全角0123456789。
+ GWLM 1-2文字
+ GWLM 1-2 文字
这里是指狭义上的文字,属于字符的子集,仅包含字母文字、象形文字等直接表意字符,即字典、
词典收录的文字。
@ -127,11 +127,11 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
使用方式:这里仅对书写系统来规范,不会涉及狭义的语言,即口语,所以尽量减少「语言」一词,
比如使用「英文」替代「英语」。
+ GWLM 1-3标点符号
+ GWLM 1-3 标点符号
详见〈[GWLM 15834-2-1 标点符号 (punctuation)](#gwlm-15834-2-1-标点符号-punctuation)〉。
+ GWLM 1-4点号(点符号)
+ GWLM 1-4 点号(点符号)
详见〈[GWLM 15834-2-6 点号](#gwlm-15834-2-6-点号)〉。
@ -150,63 +150,270 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
### 划分空间
1. 标示「书名」「数字」以及「计量单位符号」等特殊的情况
1. 将文字以标点符号空缺的状态排开
```text
+======+==========+==========+==============+================+==+====+
原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB |
+======+==========+==========+==============+================+==+====+
特殊环境 | · | 书名 | · ·数·单位|
+------+----------+----------+--------------+----------------+--+----+
```mermaid
---
title: "将文字以标点符号空缺的状态排开"
---
flowchart TD
%% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。
1A["apple"]
1B["是乔布斯传"]
1C["Steve Jobs"]
1D["中出现过的词语"]
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D
end
```
备注GitHub 的代码块并没有严格调用浏览器默认的等宽字体,结果会造成排版错位,
需要回到 GitHub 顶部,然后点击右上角的 Raw 按钮查看原始的等宽内容。
2. 标示「书名」「数字」「计量单位符号」等特殊的情况。
关于特殊环境的详细处理方式,请参照 GWLM 3-5。
```mermaid
---
title: "标示「书名」「数字」及「计量单位符号」等特殊的情况"
---
flowchart TD
2. 标示外文的「片段环境」:
%% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。
```text
+======+==========+==========+==============+================+==+====+
原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB |
+======+==========+==========+==============+================+==+====+
特殊环境 | · | 书名 | · ·数·单位|
+------+----------+----------+--------------+----------------+--+----+
片段环境 | en | | en | · · · |
+------+----------+----------+--------------+----------------+--+----+
1A["apple"]
1B["是乔布斯传"]
1C["Steve Jobs"]
1D["中出现过的词语"]
subgraph Sub_A[未添加标点符号]
direction LR
subgraph Sub_E[作品名]
1C
end
1A --- 1B --- 1C --- 1D
end
```
这些外文片段的书写系统环境被称为「片段环境」。
3. 标示「片段环境」和「书写系统环境」。
3. 定义「书写系统环境」:
通过标题和表意文字都是中文,能够给文章整体设下「简体中文」的「书写系统环境/环境变量」。
```mermaid
---
title: "标示「片段环境」和「书写系统环境」"
---
flowchart TD
```text
+======+==========+==========+==============+================+==+====+
原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB |
+======+==========+==========+==============+================+==+====+
特殊环境 | · | 书名 | · ·数·单位|
+------+----------+----------+--------------+----------------+--+----+
片段环境 | en | | en | · · · |
+------+----------+----------+--------------+----------------+--+----+
书写系统环境 · · · zh-Hans · · · |
+------+----------+----------+--------------+----------------+--+----+
%% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。
1A["apple"]
1B["是乔布斯传"]
1C["Steve Jobs"]
1D["中出现过的词语"]
subgraph Sub_A["书写系统环境(简体中文)"]
direction LR
subgraph Sub_B["常规片段(英文)"]
1A
end
subgraph Sub_C["常规片段(简体中文)"]
1B
end
subgraph Sub_D["作品名(英文)"]
1C
end
subgraph Sub_E["常规片段(简体中文)"]
1D
end
1A --- 1B --- 1C --- 1D
end
```
### 文字属地规范
4. 「标点符号空位」分数化。
+ 「片段环境」没有占满一句话时,不应该使用「片段环境」的属地语法,比如英文的句首大写。
1. 「书写系统环境」记作 5 分;
2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;
+ 在并列外语词语时,使用「书写系统环境」的属地语法的顿号,比如:
5. 特殊规则。
> 简体中文语言环境:我们的客户有 Yahoo、Facebook, Inc.、Microsoft Corporation 和 Google。
1. 作品名的「片段环境」直接影响书名号
> 英语语言环境Our clients include “百度”, “腾讯”, “金山” and “奇虎360”.
6. 根据分数填写各种书写系统的标点符号。
备注是否使用引号包围外语请参考《GWLM 3 兼容性》的〈[各种文字的兼容性](#各种文字的兼容性)〉
章节。
```mermaid
---
title: "演示 1"
---
flowchart TD
%% 我们的客户有 Apple、Facebook、Google 和 Microsoft。
1A["我们的客户有"]
1B["Apple"]
1C["Facebook"]
1D["Google"]
1E["和"]
1F["Microsoft"]
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D --- 1E --- 1F
end
%% 分割线
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;"] --> 2B["对每个标点符号位置都计算分数"]
end
%% 分割线
3A["我们的客户有"]
3B["Apple"]
3C["Facebook"]
3D["Google"]
3E["和"]
3F["Microsoft"]
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"简中 7
英文 2"| 3B --- |"简中 5
英文 4"| 3C --- |"简中 5
英文 4"| 3D --- |"简中 7
英文 2"| 3E --- |"简中 7
英文 2"| 3F
end
Sub_A --> Sub_B --> Sub_C
```
---
```mermaid
---
title: "演示 2数学"
---
flowchart TD
%% 元素依次为 1, 3, 4, 9, 12, 16, 27, …
1A["元素依次为"]
1B["1"]
1C["3"]
1D["4"]
1E["9"]
1F["12"]
1G["16"]
1H["17"]
1I["…"]
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D --- 1E --- 1F --- 1G --- 1H --- 1I
end
%% 分割线
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分;
3. 根据标点符号空位的左右的「片段环境」,各记作 2 分。"] --> 2B["对每个标点符号位置都计算分数"]
end
%% 分割线
3A["元素依次为"]
3B["1"]
3C["3"]
3D["4"]
3E["9"]
3F["12"]
3G["16"]
3H["17"]
3I["…"]
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"简中 7
数学 4"| 3B --- |"简中 5
数学 6"| 3C --- |"简中 5
数学 6"| 3D --- |"简中 5
数学 6"| 3E --- |"简中 5
数学 6"| 3F --- |"简中 5
数学 6"| 3G --- |"简中 5
数学 6"| 3H --- |"简中 5
数学 6"| 3I
end
Sub_A --> Sub_B --> Sub_C --> Sub_D["元素依次为 1, 3, 4, 9, 12, 16, 27, …"]
```
---
```mermaid
---
title: "演示 3外语书名号"
---
flowchart TD
%% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。
1A["apple"]
1B["是乔布斯传"]
1C["Steve Jobs"]
1D["中出现过的词语"]
subgraph Sub_A[未添加标点符号]
direction LR
1A --- 1B --- 1C --- 1D
end
%% 分割线
subgraph Sub_B[处理]
direction LR
2A["1. 「书写系统环境」记作 5 分;
2. 根据标点符号空位的左右的「片段环境」,各记作 2 分;
3. 作品名的左右「标点符号空位」,记作 10 分。"] --> 2C["对每个标点符号位置都计算分数"]
2B["1. 作品名的「片段环境」直接影响书名号。"]
end
%% 分割线
3A["apple"]
3B["是乔布斯传"]
3C["Steve Jobs"]
3D["中出现过的词语"]
subgraph Sub_C[标点符号分数]
direction LR
3A --- |"英文 2
简中 7"| 3B --- |"简中 7
英文 2书名号受影响"| 3C --- |"英文 2书名号受影响
简中 7"| 3D
end
Sub_A --> Sub_B --> Sub_C --> Sub_D["apple 是乔布斯传 𝑆𝑡𝑒𝑣𝑒 𝐽𝑜𝑏𝑠 中出现过的词语。"]
```
### 使用引号标记外语
> 简体中文语言环境:我们的客户有 Apple、Facebook、Google 和 Microsoft。
> 英语语言环境Our clients include “百度”, “腾讯”, “金山” and “奇虎360”.
各地文字之间存在兼容性,阿拉伯数字基本上融入了大部分书写系统,所以不需要当作外语使用引号标记。
DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司,
都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词,
就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。
但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。
## GWLM 3 书写系统规范
@ -215,6 +422,10 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLMGe
创建时间: 2023年8月26日
```
GWLM 3 待修改,因为与 GWLM 2 存在矛盾。*
---
书写系统规范由词典、语法、正字法、标点符号用法标准以及其他细节组成。
+ 简体中文以《[GB/T 15834—2011 标点符号用法标准][]》作为标点符号用法标准。
@ -415,14 +626,6 @@ GWLM 3-6-1 与 GWLM 3-7-1 的结果看起来相同,当其作用的领域不同
创建时间: 2023年8月26日
```
### 各种文字的兼容性
各地文字之间存在兼容性,比如 DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Google 和 Microsoft 这些知名公司,
都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词,
就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。
但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。
### 兼容其他规范
简介里有提到因为《律法》是模块化的,所以可以选配各种不同的规范,所以现有的排版规范也可以使用《律法》来实现。