Files
HF-MES-manual/planning_production/alert_center.md
sheng 425dea327e docs(数据中台): 新增电池曲线、正向追溯、反向追溯、设备履历报表、托盘追溯、鹰眼、电池详情报表、预警中心等模块文档
新增多个功能模块的详细文档,包括功能概述、术语说明、操作流程和截图等。完善数据中台相关功能文档,覆盖基础追溯、报表分析和监控预警等模块
2026-05-07 16:14:26 +08:00

345 lines
15 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 预警中心
## 1. 功能概述
预警中心属于 MES 系统数据中台的监控预警模块,用于实时监控生产设备的通道异常状态,帮助生产管理人员及时发现并处理设备点位问题。系统以设备类别(工作站)为组织维度,分别统计**连续异常**(同一通道连续 3 次及以上报错)和**累计异常**(同一通道累计 10 次及以上报错)两类预警数据,并提供详情查看和异常清除功能。
**核心功能:**
- 工作站总览:按设备类别(工作站)展示各工作站下的异常设备数量概览,包括连续异常设备数和累计异常设备数
- 设备异常明细:查看某个工作站下所有异常设备的详细数据,区分连续异常和累计异常两类
- 通道异常详情:查看每个异常通道的具体错误信息,包括错误代码、错误描述、发生时间
- 异常清除:支持设备级清除和单通道级清除,分为清零(重置计数)和标记已处理两种方式
- 条件筛选:按时间范围和具体设备进行筛选,支持导出异常数据
**功能对应截图**
![图片:预警中心功能截图](/public/image/alert_center/图片:预警中心功能截图.png)
## 2. 术语说明
| 术语 | 定义 | 说明 |
|------|------|------|
| 预警中心 | Alert Center设备点位异常监控与预警模块 | 实时展示生产设备通道异常状态,帮助快速定位问题设备 |
| 工作站 | Workstation即设备类别Device Category | 按设备类型分组如化成、分容、OCV、DCIR 等 |
| 连续异常 | Consecutive Error同一通道连续 3 次及以上报错 | 表示该通道近期持续处于异常状态,需重点关注 |
| 累计异常 | Cumulative Error同一通道累计 10 次及以上报错 | 表示该通道虽然可能不连续,但总体异常频率较高 |
| 通道 | Channel设备上的数据采集点位 | 一个设备通常有多个通道,每个通道独立统计异常次数 |
| 点位 NG | Pin NG设备通道上报的异常不良信息 | 设备通过 MES 接口上报,包含错误代码和错误描述 |
| 异常清除 | Clear Error对异常计数进行清零操作 | 支持整体清除和单通道清除,清除后计数器重新开始统计 |
| 通道异常记录 | Channel Exception Record工序中开启的通道异常监控配置 | 在工艺详情中为工序开启后,设备才会触发通道异常检测 |
**数据模型关系说明:**
```mermaid
flowchart TB
subgraph 筛选维度
DC[设备类别<br/>DeviceCategory]
DE[设备<br/>Device]
end
subgraph 异常统计
CES[设备通道异常统计<br/>DeviceChannerlExceptionStatistics]
end
subgraph 异常详情
PNR[点位NG记录<br/>PinNgRecord]
NI[不良信息<br/>NgInfo]
end
subgraph 触发来源
SPR[工序结果上报<br/>SetTrayProcessResult]
PCQ[点位检查队列<br/>hf_mes_queue_pincheck]
end
DC -->|1:N| DE
DE -->|1:1| CES
CES -->|关联查询| PNR
PNR -->|关联| NI
SPR -->|触发验证| PCQ
PCQ -->|异步更新| CES
```
**关系说明:**
| 关系类型 | 说明 |
|---------|------|
| 设备类别 → 设备 | **1 对 N**:一个设备类别下包含多台设备 |
| 设备 → 通道异常统计 | **1 对 1**:每台设备对应一条通道异常统计记录 |
| 通道异常统计 → 点位NG记录 | **1 对 N**:通过设备编码和通道号关联查询异常详情 |
| 点位NG记录 → 不良信息 | **N 对 1**每条NG记录关联一个不良代码获取不良描述 |
**简化关系图:**
```mermaid
flowchart LR
A[设备类别] -->|1:N| B[设备]
B -->|1:1| C[通道异常统计]
C -->|关联| D[点位NG记录]
D -->|关联| E[不良信息]
```
## 3. 预警中心交互流程
### 3.1 工作站总览
#### 3.1.1 工作站总览说明
工作站总览页面以卡片形式展示所有设备类别(工作站),每个卡片显示该工作站名称以及两类异常设备数量:
- **连续异常设备数**:存在至少一个通道连续异常次数 ≥ 3 次的设备数量
- **累计异常设备数**:存在至少一个通道累计异常次数 ≥ 10 次的设备数量
用户可通过筛选条件按时间范围和具体设备进行过滤。
**功能对应截图**
![图片:工作站总览截图](/public/image/alert_center/图片:工作站总览截图.png)
#### 3.1.2 查询条件
**查询条件:**
| 查询条件 | 说明 |
|---------|------|
| 时间范围 | 选择起始时间和结束时间,精确到秒 |
| 工作站 | 从下拉列表选择设备类别工作站如化成、分容、OCV等 |
| 设备 | 选择工作站后,进一步选择具体设备进行筛选(可选) |
**操作步骤:**
1. 进入【数据中台】→【预警中心】
2. 设置时间范围(必选)
3. 选择工作站(可选,默认展示全部工作站)
4. 如需查看特定设备,选择工作站后再选择设备
5. 点击【查询】按钮,系统展示符合条件的预警数据
**功能对应截图**
![图片:查询条件截图](/public/image/alert_center/图片:查询条件截图.png)
#### 3.1.3 工作站卡片信息
每个工作站卡片包含以下信息:
| 显示字段 | 说明 |
|---------|------|
| 工作站名称 | 设备类别的名称,如"化成"、"分容" |
| 连续异常设备数 | 该工作站下存在连续异常通道≥3次的设备总数以蓝色角标显示 |
| 累计异常设备数 | 该工作站下存在累计异常通道≥10次的设备总数以橙色角标显示 |
| 查看数据 | 当连续异常设备数或累计异常设备数大于 0 时,可点击查看详情 |
**功能对应截图**
![图片:工作站卡片截图](/public/image/alert_center/图片:工作站卡片截图.png)
### 3.2 设备异常明细
#### 3.2.1 设备异常明细说明
点击工作站卡片上的【查看数据】按钮,会打开全屏对话框,分为左右两栏:
- **左侧:连续异常列表** — 展示该工作站下存在连续异常的设备
- **右侧:累计异常列表** — 展示该工作站下存在累计异常的设备
**功能对应截图**
![图片:设备异常明细截图](/public/image/alert_center/图片:设备异常明细截图.png)
#### 3.2.2 连续异常列表
连续异常列表展示该工作站下所有存在通道连续异常次数 ≥ 3 次的设备。
**列表字段:**
| 字段 | 说明 |
|------|------|
| 设备名称 | 设备的显示名称 |
| 设备编码 | 设备的唯一标识代码 |
| 异常通道数 | 该设备中存在连续异常≥3次的通道总数 |
| 最后清零时间 | 最近一次清除连续异常计数的时间 |
| 更新时间 | 设备异常统计数据的最后更新时间 |
| 操作 | 包括【详情】和【清除】两个操作按钮 |
**展开行:** 点击行首展开按钮,可查看该设备每个通道的连续异常次数,每个通道以角标形式显示具体数值,支持点击单个通道进行单独清零。
#### 3.2.3 累计异常列表
累计异常列表展示该工作站下所有存在通道累计异常次数 ≥ 10 次的设备。
**列表字段:**
| 字段 | 说明 |
|------|------|
| 设备名称 | 设备的显示名称 |
| 设备编码 | 设备的唯一标识代码 |
| 异常通道数 | 该设备中存在累计异常≥10次的通道总数 |
| 最后清零时间 | 最近一次清除累计异常计数的时间 |
| 更新时间 | 设备异常统计数据的最后更新时间 |
| 操作 | 包括【详情】和【清除】两个操作按钮 |
**展开行:** 点击行首展开按钮,可查看该设备每个通道的累计异常次数,每个通道以角标形式显示具体数值,支持点击单个通道进行单独清零。
### 3.3 通道异常详情
#### 3.3.1 通道异常详情说明
在连续异常列表或累计异常列表中,点击某个设备行的【详情】按钮,弹出通道异常详情对话框,展示该设备所有异常通道的具体错误信息。
**功能对应截图**
![图片:通道异常详情截图](/public/image/alert_center/图片:通道异常详情截图.png)
#### 3.3.2 通道异常详情字段
**详情列表字段:**
| 字段 | 说明 |
|------|------|
| 设备名称 | 设备的显示名称 |
| 设备编码 | 设备的唯一标识代码 |
| 通道编号 | 发生异常的通道号 |
| 错误代码 | 异常的错误代码 |
| 错误描述 | 异常的具体描述信息 |
| 异常时间 | 异常发生的具体时间 |
**【注意】** 查看详情时,系统会根据连续异常或累计异常的类型,分别展示对应类型的异常记录。如果该设备在最近一次清零后有新的异常记录,详情中只会展示清零之后产生的异常。
### 3.4 异常清除
#### 3.4.1 异常清除说明
预警中心支持两种粒度的异常清除方式,用户可根据实际情况灵活选择。
**清除方式:**
| 清除方式 | 说明 | 适用场景 |
|---------|------|---------|
| 设备级清除 | 清除该设备的所有异常通道计数 | 设备整体已恢复正常,所有通道问题已解决 |
| 单通道清除 | 仅清除指定通道的异常计数 | 仅个别通道问题已解决,其他通道仍需关注 |
**清除效果:**
| 清除类型 | 效果 |
|---------|------|
| 连续异常清除 | 将设备的连续异常计数全部重置为零/清空,记录最后清零时间 |
| 累计异常清除 | 将设备的累计异常计数全部重置为零/清空,记录最后清零时间 |
#### 3.4.2 设备级清除
**操作步骤:**
1. 在设备异常明细页面,找到需要清除的设备行
2. 点击【清除】按钮
3. 系统弹出确认对话框,确认后执行清除操作
4. 清除成功后,页面数据自动刷新,工作站总览同步更新
**【注意】** 设备级清除会将该设备所有通道的异常计数一次性清零,请谨慎操作。
**【重要】** 清除后,相关的点位 NG 记录也会被标记为已处理,便于后续追溯。
**功能对应截图**
![图片:设备级清除确认截图](/public/image/alert_center/图片:设备级清除确认截图.png)
#### 3.4.3 单通道清除
**操作步骤:**
1. 在设备异常明细页面,点击设备行的展开按钮,显示各通道的异常次数
2. 点击需要清除的通道对应按钮
3. 系统弹出确认对话框,确认后执行单通道清除操作
4. 清除成功后,页面数据自动刷新
**【注意】** 单通道清除仅将该通道的异常计数置为零,不影响其他通道的异常计数。
**【注意】** 单通道清除不会标记点位 NG 记录为已处理,仅重置计数统计。
**功能对应截图**
![图片:单通道清除截图](/public/image/alert_center/图片:单通道清除截图.png)
### 3.5 数据导出
#### 3.5.1 数据导出说明
系统支持将预警数据通过异步任务导出为文件,适用于大批量数据分析和存档。
**操作步骤:**
1. 在预警中心页面,设置时间范围和筛选条件
2. 点击【导出】按钮
3. 系统弹出确认对话框,确认后创建导出任务
4. 系统自动跳转到"系统下载任务"页面,可在该页面查看导出进度并下载文件
**【注意】** 导出任务采用异步处理机制,大数据量导出可能需要一定时间,请耐心等待。
**【注意】** 导出前必须选择时间范围和工作站,否则无法导出。
**功能对应截图**
![图片:数据导出截图](/public/image/alert_center/图片:数据导出截图.png)
## 4. 预警触发机制
### 4.1 预警触发流程说明
预警中心的数据来源于生产执行过程中设备上报的工序结果数据。当设备调用 MES 接口上报工序结果时,系统会根据工序配置自动进行通道异常检测。
**触发流程:**
```mermaid
sequenceDiagram
participant 设备 as 设备
participant MES接口 as MES工序上报接口
participant 验证 as 通道异常验证
participant 队列 as 预警队列
participant 统计 as 异常统计表
设备->>MES接口: 1. 上报工序结果数据含pin_check、NG信息
MES接口->>MES接口: 2. 检查工序是否开启通道异常记录
MES接口->>验证: 3. 工序已开启通道异常记录,触发验证
验证->>验证: 4. 验证pin_check数组的有效性
验证->>队列: 5. 存在异常pin_check=1写入预警队列
队列->>统计: 6. 异步任务消费队列,更新异常统计数据
统计->>统计: 7. 累加通道的连续/累计异常计数
```
**流程说明:**
| 步骤 | 执行者 | 操作 | 说明 |
|------|--------|------|------|
| 1 | 设备 | 上报工序结果 | 设备调用 MES 接口提交工序完成数据,数据中包含 pin_check点位检查和 NG不良代码信息 |
| 2 | MES | 检查工序配置 | 判断该工序是否在工艺详情中开启了"通道异常记录"开关 |
| 3 | MES | 触发验证 | 工序已开启通道异常记录,触发点位检查验证逻辑 |
| 4 | MES | 验证数据 | 检查 pin_check 数组和 NG 数组的合法性(长度一致、值均为 0 或 1、pin_check=1 时 NG 必填) |
| 5 | MES | 写入队列 | 当 pin_check 数组中存在值为 1 的条目时,将异常数据写入预警缓存队列 |
| 6 | 后台任务 | 消费队列 | 异步任务读取预警队列中未处理的数据,按设备编码汇总异常计数 |
| 7 | 后台任务 | 更新统计 | 将通道异常次数累加到异常统计表,区分连续异常和累计异常 |
### 4.2 前置条件
预警功能需要以下前置配置:
| 前置条件 | 说明 | 配置位置 |
|---------|------|---------|
| 开启通道异常记录 | 在工艺详情中为工序开启"开启通道异常记录"开关 | 生产配置 → 工艺模型 → 工艺流程 → 设置工序 |
| 配置不良代码 | 在系统中维护不良代码及其描述 | 生产配置 → 产品管理 → 不良管理 |
| 设备品类配置 | 确保设备已绑定到正确的设备类别(工作站) | 设备模型 → 设备信息 |
**【重要】** 只有在工艺详情的工序配置中开启了"通道异常记录",设备上报工序结果时才会触发通道异常检测,预警中心才会展示该工序相关的预警数据。
## 5. 常见问题
### 5.1 预警中心没有数据?
**可能原因:**
1. 工序未开启"通道异常记录"开关,请在【工艺详情】中检查工序配置
2. 设备尚未上报包含 pin_check 信息的工序结果数据
3. 选择的查询时间范围内没有异常数据产生
4. 设备类别(工作站)未正确配置
### 5.2 清除数据后为何又会重新出现?
清除操作仅重置异常计数,不会阻止设备继续上报异常数据。如果设备通道问题未从根本解决,设备继续上报异常后,计数会重新累加并再次达到预警阈值。建议:
- 定位并解决设备通道的根本问题后,再执行清除操作
- 清除后观察设备状态,确认异常不再复现
### 5.3 连续异常和累计异常有什么区别?
- **连续异常**:同一通道连续 3 次及以上报错,表示通道近期持续异常,是当前重点关注对象
- **累计异常**:同一通道累计 10 次及以上报错,表示通道虽然可能不连续但总体异常频率高,反映设备长期健康状态
### 5.4 导出数据失败怎么办?
导出功能依赖异步任务机制,请检查:
1. 是否选择了时间范围和工作站
2. 系统下载任务服务是否正常运行
3. 可在【系统下载任务】页面查看任务状态和失败原因