Refine WH Telemetry Protocol documentation in schema.md; enhance clarity by detailing field descriptions, types, and requirements for versioning, message types, and metadata, ensuring comprehensive understanding of the protocol structure.

2025-07-08 11:22:43 +08:00
parent f552dc75f9
commit fa04055e57
1 changed files with 62 additions and 61 deletions
--- a/schema.md
+++ b/schema.md
@ -29,32 +29,32 @@ WH Telemetry Protocol（WHTP）是一套专为物联网场景设计的轻量级
 | fields    | 是   | `Field[]`       | 采集字段数组                                   |
 | metadata  | 否   | object          | 消息级元数据                                   |
-### Version (`version`)
+### 版本
-必填。正整数，仅表示协议主版本号。当前版本为 **1**。
+`version` 描述协议主版本号, 必填, 其类型为 `number`, 仅表示协议主版本号。当前版本为 **1**。
-### 消息类型 (`msg_type`)
+### 消息类型
-必填。字符串。目前仅允许 `"telemetry"`，用于上传遥测数据。
+`msg_type` 描述消息类型, 必填, 其类型为 `string`, 目前仅允许 `"telemetry"`，用于上传遥测数据。
-### 消息模式 (`mode`)
+### 消息模式
-可选，字符串，默认 `"descriptive"`。
+`mode` 描述消息模式, 可选, 其类型为 `string`, 默认 `"descriptive"`。
 * `descriptive` —— 自描述模式，允许在字段 `metadata` 中携带全部上下文信息，消息本身即可被独立解析。
 * `strict` (RFU, reserved for future use) —— 严格模式，不允许出现字段级 `metadata`，字段定义需通过外部文档约定，适用于带宽受限或固定 Schema 场景。(目前无实际意义, 需要与二进制协议配合)
-### 设备 ID (`dev_id`)
+### 设备ID
-必填。设备唯一标识，采用 [NanoID](https://github.com/ai/nanoid) 格式（如 `2B1oj2S5k7kS8mL_QaCs`），在设备生命周期内保持不变。
+`dev_id` 描述设备唯一标识, 必填, 其类型为 `string`, 采用 [NanoID](https://github.com/ai/nanoid) 格式（如 `2B1oj2S5k7kS8mL_QaCs`），在设备生命周期内保持不变。
-### 设备类型 (`dev_type`)
+### 设备类型
 ```typescript
 type DeviceType = string | { type_id: string } | { type_name: string }
 ```
-必选。用于标识设备类别或型号。支持三种写法：
+`dev_type` 描述设备型号, 必填, 其类型为 `DeviceType`, 用于标识设备类别或型号。支持三种写法：
 1. **字符串**：例如 `"device_type_name"`；与 `{ "type_name": string }` 等价
 2. **对象** `{ "type_id": NanoID }`；NanoID 为设备型号的唯一标识, 由平台分配
@ -67,7 +67,9 @@ type DeviceType = string | { type_id: string } | { type_name: string }
 > - 对于长期稳定的系统, 推荐使用 `{ "type_id": NanoID }` 格式, 作为稳定的唯一标识符
 > - 对于临时场景, 可以使用 `string` 或 `{ "type_name": string }` 格式
-### 根级时间戳 (`timestamp`)
+### 根级时间戳
 `timestamp` 描述消息生成时刻, 其类型为 `Timestamp`
 ```typescript
 type Timestamp =
@ -95,14 +97,13 @@ type Timestamp =
 > [!NOTE]
 > 根级 (root-level) 时间戳表示消息生成或入队时刻, 字段级 (field-level) 时间戳表示实际数据采样时刻, 应使用字段级时间戳进行所有时间序列分析
-### 消息描述字段组 (`fields`)
+### 消息描述字段组
-必填。`Field` 对象数组，数组中每个元素代表一个测量项，其 `id` 在同一条消息内必须唯一。
+`fields` 描述消息中包含的测量项, 其类型为 `Field[]`, 数组中每个元素代表一个测量项, 其 `id` 在同一条消息内必须唯一, 关于 `Field` 对象的定义详见后文 [消息描述字段](#%E6%B6%88%E6%81%AF%E6%8F%8F%E8%BF%B0%E5%AD%97%E6%AE%B5) 章节
 关于 `Field` 对象的定义详见后文 ["消息描述字段"](#%E6%B6%88%E6%81%AF%E6%8F%8F%E8%BF%B0%E5%AD%97%E6%AE%B5) 章节。
-### 消息元数据 (`metadata`)
+### 根级元数据
-`user` 字段之外的 `metadata` 字段为已定义 (well-defined) 字段, 其定义见下文
+`metadata` 描述根级 (消息级) 元数据, 其类型为 `MessageMetadata`
 ```typescript
 interface MessageMetadata {
@ -114,16 +115,17 @@ interface MessageMetadata {
 }
 ```
-#### 全局枚举 (`enums`)
+> [!NOTE]
 > `user` 字段之外的 `metadata` 字段为已定义 (well-defined) 字段; 用户应优先使用已定义字段, 若不能满足需求才可使用[用户自定义字段](#%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E5%AD%97%E6%AE%B5)
-可选。全局枚举定义表，用于在字段 `fields[*].metadata.data_type` 中以 `enum:<id>` 形式引用。
+#### 全局枚举
 ```typescript
 type InlineEnum = Record<string, number>
 type EnumDefinition = { id: string; value: InlineEnum };
 ```
-示例
+`metadata.enums` 字段类型为 `EnumDefinition[]`, 用于在字段 `fields[*].metadata.data_type` 中以 `enum:<id>` 形式引用, 如
 ```jsonc
 "metadata": {
@ -138,17 +140,17 @@ type EnumDefinition = { id: string; value: InlineEnum };
 等价于
-```cpp
+```typescript
-enum class AirQuality {
+enum AirQuality {
  GOOD = 1,
  MODERATE = 2,
  BAD = 3,
-};
+}
 ```
-#### 位置信息 (`location`)
+#### 位置信息
-可选。表示消息采集时的设备地理位置
+`metadata.location` 字段类型为 `Location`, 表示消息采集时的设备地理位置, 如
 ```typescript
 type Location = {
@ -170,17 +172,17 @@ type Location = {
 }
 ```
-#### 电量 (`battery`)
+#### 电量
-可选。数字，范围 0–100，对应设备剩余电量百分比。
+`metadata.battery` 字段类型为数字, 表示设备剩余电量百分比, 其范围为 0–100
-#### 序列号 (`seq`)
+#### 序列号
-可选。无符号整数。每上传一条消息递增 1，用于检测丢包或乱序。达到上限后循环计数（默认为 32 位无符号整数回绕）。
+`metadata.seq` 字段类型为无符号整数, 每上传一条消息递增 1, 用于检测丢包或乱序, 达到上限后循环计数（默认为 32 位无符号整数回绕）
-#### 用户自定义信息 (`user`)
+#### 根级用户自定义字段
-可选。任意键值对，为数据生产方保留的自定义信息区
+`metadata.user` 字段为任意键值对, 为数据生产方保留的自定义信息区, 其类型为 `UserData`
 ```typescript
 type UserData = Record<string, any>
@ -188,13 +190,13 @@ type UserData = Record<string, any>
 ## 消息描述字段
-### 标识符 (`id`)
+### 字段标识符
-必填。ASCII 字符串，仅允许字母、数字与下划线，且不得以数字开头。长度建议 1–64 字符。例如 `temperature_sensor`。
+`id` 描述字段标识符, 必填, 其类型为 `string`, ASCII 字符串，仅允许字母、数字与下划线，且不得以数字开头。长度建议 1–64 字符。例如 `temperature_sensor`。
-### 值 (`value`)
+### 字段值
-字段实际测量值，其类型必须与 `metadata.data_type` 完全对应, 详见 ["数据类型"](#%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B) 章节
+`value` 描述字段值, 其类型必须与 `metadata.data_type` 完全对应, 详见 ["数据类型"](#%E6%95%B0%E6%8D%AE%E7%B1%BB%E5%9E%8B) 章节
 1. **标量** (scalar)
@ -327,23 +329,23 @@ type PrimitiveType = string | number | boolean
 newtype Enum = number
 ```
-##### 标量类型 (`scalar`)
+##### 标量类型
-标量类型为 `string | number | boolean | Enum` 的统称, 其定义见上文
+标量类型 (scalar) 为 `string | number | boolean | Enum` 的统称, 其定义见上文
 ```haskell
 type ScalarType = PrimitiveType | Enum
 ```
-##### 等间隔数组类型 (`array`)
+##### 等间隔数组类型
-本协议中的数组类型在 `field` 中的含义为 **等采样率** 的数组, 其定义为:
+本协议中的数组类型在 `field` 中的含义为 **等采样率** 的数组 (array), 其定义为:
 ```haskell
 type ArrayType T = T[] -- array<T>
 ```
-##### 非等间隔数组类型 (`irregular`)
+##### 非等间隔数组类型
 本协议中的非等间隔数组类型在 `field` 中的含义为 **非等采样率** 或 **采样率未知** 的数组, 其定义为:
@ -359,19 +361,19 @@ type IrregularType T = { v: T[], t: Timestamp[] } -- irregular<T>
 type BatchType T = ArrayType T | IrregularType T
 ```
-#### field 时间戳 (`timestamp`)
+#### 字段时间戳
-可选。若不存在则取 `root.timestamp` 的值; 表示该字段 **采样时刻** 的时间戳, 其类型为 `Timestamp`
+`timestamp` 描述字段时间戳, 可选, 其类型为 `Timestamp`, 若不存在则取 `root.timestamp` 的值; 表示该字段 **采样时刻** 的时间戳
-#### 标签 (`label`)
+#### 标签
-可选。字段展示名，UTF-8 字符串，便于人机界面直观呈现。实际是否使用/如何使用由数据消费方决定。
+`label` 描述字段展示名, 可选, 其类型为 `string`, 便于人机界面直观呈现。实际是否使用/如何使用由数据消费方决定。
 示例：`"label": "温度"`
-#### 错误码 (`error_code`)
+#### 错误码
-可选。非零整数。0 表示无错误；其他值与以下错误码表对应，用于描述测量异常。
+`error_code` 描述错误码, 可选, 其类型为 `number`, 非零整数。0 表示无错误；其他值与以下错误码表对应，用于描述测量异常。
 | 代码       | 分类       | 名称                  | 描述                                       |
 | ---------- | ---------- | --------------------- | ------------------------------------------ |
@ -394,17 +396,17 @@ type BatchType T = ArrayType T | IrregularType T
 | 512–1023   | 应用       | —                     | 留给具体应用 / 产品线自定义                |
 | 1024–65535 | 厂商自定义 | —                     | 厂商或项目私有错误码区间                   |
-#### 错误信息 (`error_msg`)
+#### 错误信息
-可选。UTF-8 字符串，对 `error_code` 进行人类可读的补充说明。
+`error_msg` 描述错误信息, 可选, 其类型为 `string`, 对 `error_code` 进行人类可读的补充说明。
-#### 置信度 (`confidence`)
+#### 置信度
 ```typescript
 type Confidence = number | number[]
 ```
-置信度用于表征 value 数据的可靠性，其取值类型可为单个数值（`number`）或数值数组（`number[]`），具体规则如下：
+`confidence` 描述置信度, 可选, 其类型为 `Confidence`, 用于表征 value 数据的可靠性，其取值类型可为单个数值（`number`）或数值数组（`number[]`），具体规则如下：
 - 当 confidence 为单个数值时，表示该字段所有采样点共用相同的置信度。此形式适用于任意类型的 value（包括单点和批量数据）。
 - 当 confidence 为数值数组时，表示每个采样点各自的置信度。此形式仅适用于批量数据（即 value 为数组或不等间隔序列）；此时 confidence 数组长度必须与采样点数量严格一致。
@ -420,9 +422,9 @@ type Confidence = number | number[]
 > - 如未指定 confidence 字段，则默认所有采样点的置信度为 1
-#### 采样间隔 (`sample_interval`)
+#### 采样间隔
-可选。采样间隔, 用于描述 `value` 为等间隔数组时, 数组中每个元素的时间间隔 (建议所有等间隔数组都显式填写该字段)
+`sample_interval` 描述采样间隔, 可选, 其类型为 `SampleInterval`, 用于描述 `value` 为等间隔数组时, 数组中每个元素的时间间隔
 ```typescript
 type TimeDelta = { ms?: number, s?: number, m?: number, h?: number, d?: number, w?: number }
@ -439,27 +441,26 @@ type SampleInterval =
 示例：`"sample_interval": 0.5`（两次采样间隔 0.5 秒）
-#### 单位 (`unit`)
+> [!IMPORTANT]
 > 强烈建议所有等间隔数组都显式填写 `sample_interval` 字段
-可选。测量值单位。推荐使用 [UCUM](https://ucum.org/ucum) 码（如 `"Cel"` 代表摄氏度），也支持自由字符串。
+#### 单位
 `unit` 描述单位, 可选, 其类型为 `string`, 推荐使用 [UCUM](https://ucum.org/ucum) 码（如 `"Cel"` 代表摄氏度），也支持自由字符串。
 示例：`"unit": "Cel"`
-#### 内联枚举 (`enum`)
+#### 内联枚举
-可选。当 `data_type` 为 `enum:this` 及其衍生类型时, 用于定义内联枚举值
+`enum` 描述内联枚举, 可选, 其类型为 `InlineEnum`, 当 `data_type` 为 `enum:this` 及其衍生类型时, 用于定义内联枚举值
 ```typescript
 type InlineEnum = Record<string, number>
 ```
-#### 用户自定义信息 (`user`)
+#### 字段级用户自定义字段
-可选。任意键值对，为数据生产方保留的自定义信息区：
+`user` 描述字段级用户自定义字段, 可选, 类型定义同 [根级用户自定义字段](#%E6%A0%B9%E7%BA%A7%E7%94%A8%E6%88%B7%E8%87%AA%E5%AE%9A%E4%B9%89%E5%AD%97%E6%AE%B5)
 ```typescript
 type UserData = Record<string, any>
 ```
 ## 伪代码类型定义