From d7591f23488da1ce249de723de8b7ac2af78eb04 Mon Sep 17 00:00:00 2001 From: gledos Date: Sat, 2 Sep 2023 14:03:49 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=E5=88=B0=200.0.19-beta?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit + 重置 GWLM 2 书写系统空间,使用 mermaid 绘图,并添加分数化规范。 + 问题:因为修改了 GWLM 2,所以下游的 GWLM 3 暂时失效,待修复。 --- README.md | 309 ++++++++++++++++++++++++++++++++++++++++++++---------- 1 file changed, 256 insertions(+), 53 deletions(-) diff --git a/README.md b/README.md index 9340c18..96445eb 100644 --- a/README.md +++ b/README.md @@ -3,7 +3,7 @@ ```yaml 标题: 通用写作律法 创建时间: 2023年8月26日 -版本: 0.0.18-beta +版本: 0.0.19-beta ``` 《通用写作律法(General Writing Laws)》是由 @@ -108,18 +108,18 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge ### 书写系统词汇表 -+ GWLM 1-0:书写系统 (writing system)、字符 (character) ++ GWLM 1-0 书写系统 (writing system)、字符 (character) 指 Unicode 字符集中的所有字符,包含数字、文字(字母文字、象形文字)、标点符号和其他符号。 使用方式:描述指向的是某一地区的字符,那么使用书写系统,比如「中文书写系统」「英文书写系统」, 描述指向的的字符没有地区性质,那么使用字符,比如「全角字符」「半角字符」「所有的字符」「表意字符」 -+ GWLM 1-1:数字 ++ GWLM 1-1 数字 这里是指狭义上的阿拉伯数字,包括半角 0123456789 以及全角0123456789。 -+ GWLM 1-2:文字 ++ GWLM 1-2 文字 这里是指狭义上的文字,属于字符的子集,仅包含字母文字、象形文字等直接表意字符,即字典、 词典收录的文字。 @@ -127,11 +127,11 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge 使用方式:这里仅对书写系统来规范,不会涉及狭义的语言,即口语,所以尽量减少「语言」一词, 比如使用「英文」替代「英语」。 -+ GWLM 1-3:标点符号 ++ GWLM 1-3 标点符号 详见〈[GWLM 15834-2-1 标点符号 (punctuation)](#gwlm-15834-2-1-标点符号-punctuation)〉。 -+ GWLM 1-4:点号(点符号) ++ GWLM 1-4 点号(点符号) 详见〈[GWLM 15834-2-6 点号](#gwlm-15834-2-6-点号)〉。 @@ -150,63 +150,270 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge ### 划分空间 -1. 标示「书名」「数字」以及「计量单位符号」等特殊的情况。 +1. 将文字以标点符号空缺的状态排开。 - ```text - +======+==========+==========+==============+================+==+====+ - 原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB | - +======+==========+==========+==============+================+==+====+ - 特殊环境 | · | 书名 | · ·数·单位| - +------+----------+----------+--------------+----------------+--+----+ + ```mermaid + --- + title: "将文字以标点符号空缺的状态排开" + --- + flowchart TD + + %% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。 + + 1A["apple"] + 1B["是乔布斯传"] + 1C["Steve Jobs"] + 1D["中出现过的词语"] + + subgraph Sub_A[未添加标点符号] + direction LR + 1A --- 1B --- 1C --- 1D + end ``` - 备注:GitHub 的代码块并没有严格调用浏览器默认的等宽字体,结果会造成排版错位, - 需要回到 GitHub 顶部,然后点击右上角的 Raw 按钮查看原始的等宽内容。 +2. 标示「书名」「数字」「计量单位符号」等特殊的情况。 - 关于特殊环境的详细处理方式,请参照 GWLM 3-5。 + ```mermaid + --- + title: "标示「书名」「数字」及「计量单位符号」等特殊的情况" + --- + flowchart TD -2. 标示外文的「片段环境」: + %% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。 - ```text - +======+==========+==========+==============+================+==+====+ - 原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB | - +======+==========+==========+==============+================+==+====+ - 特殊环境 | · | 书名 | · ·数·单位| - +------+----------+----------+--------------+----------------+--+----+ - 片段环境 | en | | en | · · · | - +------+----------+----------+--------------+----------------+--+----+ + 1A["apple"] + 1B["是乔布斯传"] + 1C["Steve Jobs"] + 1D["中出现过的词语"] + + subgraph Sub_A[未添加标点符号] + direction LR + subgraph Sub_E[作品名] + 1C + end + 1A --- 1B --- 1C --- 1D + end ``` - 这些外文片段的书写系统环境被称为「片段环境」。 +3. 标示「片段环境」和「书写系统环境」。 -3. 定义「书写系统环境」: - 通过标题和表意文字都是中文,能够给文章整体设下「简体中文」的「书写系统环境/环境变量」。 + ```mermaid + --- + title: "标示「片段环境」和「书写系统环境」" + --- + flowchart TD - ```text - +======+==========+==========+==============+================+==+====+ - 原文 | apple 是乔布斯传 steve jobs 中出现过的词语 电子版大小为不到 10 MiB | - +======+==========+==========+==============+================+==+====+ - 特殊环境 | · | 书名 | · ·数·单位| - +------+----------+----------+--------------+----------------+--+----+ - 片段环境 | en | | en | · · · | - +------+----------+----------+--------------+----------------+--+----+ - 书写系统环境 · · · zh-Hans · · · | - +------+----------+----------+--------------+----------------+--+----+ + %% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。 + + 1A["apple"] + 1B["是乔布斯传"] + 1C["Steve Jobs"] + 1D["中出现过的词语"] + + subgraph Sub_A["书写系统环境(简体中文)"] + direction LR + subgraph Sub_B["常规片段(英文)"] + 1A + end + subgraph Sub_C["常规片段(简体中文)"] + 1B + end + subgraph Sub_D["作品名(英文)"] + 1C + end + subgraph Sub_E["常规片段(简体中文)"] + 1D + end + 1A --- 1B --- 1C --- 1D + end ``` -### 文字属地规范 +4. 「标点符号空位」分数化。 -+ 「片段环境」没有占满一句话时,不应该使用「片段环境」的属地语法,比如英文的句首大写。 + 1. 「书写系统环境」记作 5 分; + 2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分; + 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分; -+ 在并列外语词语时,使用「书写系统环境」的属地语法的顿号,比如: +5. 特殊规则。 - > 简体中文语言环境:我们的客户有 Yahoo、Facebook, Inc.、Microsoft Corporation 和 Google。 + 1. 作品名的「片段环境」直接影响书名号。 - > 英语语言环境:Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. +6. 根据分数填写各种书写系统的标点符号。 - 备注:是否使用引号包围外语,请参考《GWLM 3 兼容性》的〈[各种文字的兼容性](#各种文字的兼容性)〉 - 章节。 + ```mermaid + --- + title: "演示 1" + --- + flowchart TD + + %% 我们的客户有 Apple、Facebook、Google 和 Microsoft。 + + 1A["我们的客户有"] + 1B["Apple"] + 1C["Facebook"] + 1D["Google"] + 1E["和"] + 1F["Microsoft"] + + subgraph Sub_A[未添加标点符号] + direction LR + 1A --- 1B --- 1C --- 1D --- 1E --- 1F + end + + %% 分割线 + + subgraph Sub_B[处理] + direction LR + 2A["1. 「书写系统环境」记作 5 分; + 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分;"] --> 2B["对每个标点符号位置都计算分数"] + end + + %% 分割线 + + 3A["我们的客户有"] + 3B["Apple"] + 3C["Facebook"] + 3D["Google"] + 3E["和"] + 3F["Microsoft"] + + subgraph Sub_C[标点符号分数] + direction LR + 3A --- |"简中 7 + 英文 2"| 3B --- |"简中 5 + 英文 4"| 3C --- |"简中 5 + 英文 4"| 3D --- |"简中 7 + 英文 2"| 3E --- |"简中 7 + 英文 2"| 3F + end + + Sub_A --> Sub_B --> Sub_C + ``` + + --- + + ```mermaid + --- + title: "演示 2(数学)" + --- + flowchart TD + + %% 元素依次为 1, 3, 4, 9, 12, 16, 27, … + + 1A["元素依次为"] + 1B["1"] + 1C["3"] + 1D["4"] + 1E["9"] + 1F["12"] + 1G["16"] + 1H["17"] + 1I["…"] + + subgraph Sub_A[未添加标点符号] + direction LR + 1A --- 1B --- 1C --- 1D --- 1E --- 1F --- 1G --- 1H --- 1I + end + + %% 分割线 + + subgraph Sub_B[处理] + direction LR + 2A["1. 「书写系统环境」记作 5 分; + 2. 「辅助书写系统环境」,如数学文章,将数字记作 2 分; + 3. 根据标点符号空位的左右的「片段环境」,各记作 2 分。"] --> 2B["对每个标点符号位置都计算分数"] + end + + %% 分割线 + + 3A["元素依次为"] + 3B["1"] + 3C["3"] + 3D["4"] + 3E["9"] + 3F["12"] + 3G["16"] + 3H["17"] + 3I["…"] + + subgraph Sub_C[标点符号分数] + direction LR + 3A --- |"简中 7 + 数学 4"| 3B --- |"简中 5 + 数学 6"| 3C --- |"简中 5 + 数学 6"| 3D --- |"简中 5 + 数学 6"| 3E --- |"简中 5 + 数学 6"| 3F --- |"简中 5 + 数学 6"| 3G --- |"简中 5 + 数学 6"| 3H --- |"简中 5 + 数学 6"| 3I + end + + Sub_A --> Sub_B --> Sub_C --> Sub_D["元素依次为 1, 3, 4, 9, 12, 16, 27, …"] + ``` + + --- + + ```mermaid + --- + title: "演示 3(外语书名号)" + --- + flowchart TD + + %% apple 是乔布斯传 _Steve Jobs_ 中出现过的词语。 + + 1A["apple"] + 1B["是乔布斯传"] + 1C["Steve Jobs"] + 1D["中出现过的词语"] + + subgraph Sub_A[未添加标点符号] + direction LR + 1A --- 1B --- 1C --- 1D + end + + %% 分割线 + + subgraph Sub_B[处理] + direction LR + 2A["1. 「书写系统环境」记作 5 分; + 2. 根据标点符号空位的左右的「片段环境」,各记作 2 分; + 3. 作品名的左右「标点符号空位」,记作 10 分。"] --> 2C["对每个标点符号位置都计算分数"] + 2B["1. 作品名的「片段环境」直接影响书名号。"] + end + + %% 分割线 + + 3A["apple"] + 3B["是乔布斯传"] + 3C["Steve Jobs"] + 3D["中出现过的词语"] + + subgraph Sub_C[标点符号分数] + direction LR + 3A --- |"英文 2 + 简中 7"| 3B --- |"简中 7 + 英文 2(书名号受影响)"| 3C --- |"英文 2(书名号受影响) + 简中 7"| 3D + end + + Sub_A --> Sub_B --> Sub_C --> Sub_D["apple 是乔布斯传 𝑆𝑡𝑒𝑣𝑒 𝐽𝑜𝑏𝑠 中出现过的词语。"] + ``` + +### 使用引号标记外语 + +> 简体中文语言环境:我们的客户有 Apple、Facebook、Google 和 Microsoft。 + +> 英语语言环境:Our clients include “百度”, “腾讯”, “金山” and “奇虎360”. + +各地文字之间存在兼容性,阿拉伯数字基本上融入了大部分书写系统,所以不需要当作外语使用引号标记。 + +DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Facebook、Google 和 Microsoft 这些知名公司, +都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词, +就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。 + +但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。 ## GWLM 3 书写系统规范 @@ -215,6 +422,10 @@ GWLM 0 是收录通用写作律法模块的清单,会收录所有的 GWLM(Ge 创建时间: 2023年8月26日 ``` +GWLM 3 待修改,因为与 GWLM 2 存在矛盾。* + +--- + 书写系统规范由词典、语法、正字法、标点符号用法标准以及其他细节组成。 + 简体中文以《[GB/T 15834—2011 标点符号用法标准][]》作为标点符号用法标准。 @@ -415,14 +626,6 @@ GWLM 3-6-1 与 GWLM 3-7-1 的结果看起来相同,当其作用的领域不同 创建时间: 2023年8月26日 ``` -### 各种文字的兼容性 - -各地文字之间存在兼容性,比如 DNA、NBA 和 FPS 这些英文缩写,以及 Apple、Google 和 Microsoft 这些知名公司, -都已经成为了事实上的中文 [外来语](https://zh.wikipedia.org/wiki/外来语)。属于直接使用的外来词, -就像是香港常用的张 Sir 来表示张先生一样,没有使用引号标示的必要。 - -但是如果是中文、俄文或者日文,出现在英文环境,就需要使用引号包围了。 - ### 兼容其他规范 简介里有提到因为《律法》是模块化的,所以可以选配各种不同的规范,所以现有的排版规范也可以使用《律法》来实现。