345 lines
15 KiB
Markdown
345 lines
15 KiB
Markdown
# 预警中心
|
||
|
||
## 1. 功能概述
|
||
|
||
预警中心属于 MES 系统数据中台的监控预警模块,用于实时监控生产设备的通道异常状态,帮助生产管理人员及时发现并处理设备点位问题。系统以设备类别(工作站)为组织维度,分别统计**连续异常**(同一通道连续 3 次及以上报错)和**累计异常**(同一通道累计 10 次及以上报错)两类预警数据,并提供详情查看和异常清除功能。
|
||
|
||
**核心功能:**
|
||
|
||
- 工作站总览:按设备类别(工作站)展示各工作站下的异常设备数量概览,包括连续异常设备数和累计异常设备数
|
||
- 设备异常明细:查看某个工作站下所有异常设备的详细数据,区分连续异常和累计异常两类
|
||
- 通道异常详情:查看每个异常通道的具体错误信息,包括错误代码、错误描述、发生时间
|
||
- 异常清除:支持设备级清除和单通道级清除,分为清零(重置计数)和标记已处理两种方式
|
||
- 条件筛选:按时间范围和具体设备进行筛选,支持导出异常数据
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
## 2. 术语说明
|
||
|
||
| 术语 | 定义 | 说明 |
|
||
|------|------|------|
|
||
| 预警中心 | Alert Center,设备点位异常监控与预警模块 | 实时展示生产设备通道异常状态,帮助快速定位问题设备 |
|
||
| 工作站 | Workstation,即设备类别(Device Category) | 按设备类型分组,如化成、分容、OCV、DCIR 等 |
|
||
| 连续异常 | Consecutive Error,同一通道连续 3 次及以上报错 | 表示该通道近期持续处于异常状态,需重点关注 |
|
||
| 累计异常 | Cumulative Error,同一通道累计 10 次及以上报错 | 表示该通道虽然可能不连续,但总体异常频率较高 |
|
||
| 通道 | Channel,设备上的数据采集点位 | 一个设备通常有多个通道,每个通道独立统计异常次数 |
|
||
| 点位 NG | Pin NG,设备通道上报的异常(不良)信息 | 设备通过 MES 接口上报,包含错误代码和错误描述 |
|
||
| 异常清除 | Clear Error,对异常计数进行清零操作 | 支持整体清除和单通道清除,清除后计数器重新开始统计 |
|
||
| 通道异常记录 | Channel Exception Record,工序中开启的通道异常监控配置 | 在工艺详情中为工序开启后,设备才会触发通道异常检测 |
|
||
|
||
**数据模型关系说明:**
|
||
|
||
```mermaid
|
||
flowchart TB
|
||
subgraph 筛选维度
|
||
DC[设备类别<br/>DeviceCategory]
|
||
DE[设备<br/>Device]
|
||
end
|
||
|
||
subgraph 异常统计
|
||
CES[设备通道异常统计<br/>DeviceChannerlExceptionStatistics]
|
||
end
|
||
|
||
subgraph 异常详情
|
||
PNR[点位NG记录<br/>PinNgRecord]
|
||
NI[不良信息<br/>NgInfo]
|
||
end
|
||
|
||
subgraph 触发来源
|
||
SPR[工序结果上报<br/>SetTrayProcessResult]
|
||
PCQ[点位检查队列<br/>hf_mes_queue_pincheck]
|
||
end
|
||
|
||
DC -->|1:N| DE
|
||
DE -->|1:1| CES
|
||
CES -->|关联查询| PNR
|
||
PNR -->|关联| NI
|
||
SPR -->|触发验证| PCQ
|
||
PCQ -->|异步更新| CES
|
||
```
|
||
|
||
**关系说明:**
|
||
|
||
| 关系类型 | 说明 |
|
||
|---------|------|
|
||
| 设备类别 → 设备 | **1 对 N**:一个设备类别下包含多台设备 |
|
||
| 设备 → 通道异常统计 | **1 对 1**:每台设备对应一条通道异常统计记录 |
|
||
| 通道异常统计 → 点位NG记录 | **1 对 N**:通过设备编码和通道号关联查询异常详情 |
|
||
| 点位NG记录 → 不良信息 | **N 对 1**:每条NG记录关联一个不良代码,获取不良描述 |
|
||
|
||
**简化关系图:**
|
||
|
||
```mermaid
|
||
flowchart LR
|
||
A[设备类别] -->|1:N| B[设备]
|
||
B -->|1:1| C[通道异常统计]
|
||
C -->|关联| D[点位NG记录]
|
||
D -->|关联| E[不良信息]
|
||
```
|
||
|
||
## 3. 预警中心交互流程
|
||
|
||
### 3.1 工作站总览
|
||
|
||
#### 3.1.1 工作站总览说明
|
||
|
||
工作站总览页面以卡片形式展示所有设备类别(工作站),每个卡片显示该工作站名称以及两类异常设备数量:
|
||
- **连续异常设备数**:存在至少一个通道连续异常次数 ≥ 3 次的设备数量
|
||
- **累计异常设备数**:存在至少一个通道累计异常次数 ≥ 10 次的设备数量
|
||
|
||
用户可通过筛选条件按时间范围和具体设备进行过滤。
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
#### 3.1.2 查询条件
|
||
|
||
**查询条件:**
|
||
|
||
| 查询条件 | 说明 |
|
||
|---------|------|
|
||
| 时间范围 | 选择起始时间和结束时间,精确到秒 |
|
||
| 工作站 | 从下拉列表选择设备类别(工作站),如化成、分容、OCV等 |
|
||
| 设备 | 选择工作站后,进一步选择具体设备进行筛选(可选) |
|
||
|
||
**操作步骤:**
|
||
|
||
1. 进入【数据中台】→【预警中心】
|
||
2. 设置时间范围(必选)
|
||
3. 选择工作站(可选,默认展示全部工作站)
|
||
4. 如需查看特定设备,选择工作站后再选择设备
|
||
5. 点击【查询】按钮,系统展示符合条件的预警数据
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
#### 3.1.3 工作站卡片信息
|
||
|
||
每个工作站卡片包含以下信息:
|
||
|
||
| 显示字段 | 说明 |
|
||
|---------|------|
|
||
| 工作站名称 | 设备类别的名称,如"化成"、"分容" |
|
||
| 连续异常设备数 | 该工作站下存在连续异常通道(≥3次)的设备总数,以蓝色角标显示 |
|
||
| 累计异常设备数 | 该工作站下存在累计异常通道(≥10次)的设备总数,以橙色角标显示 |
|
||
| 查看数据 | 当连续异常设备数或累计异常设备数大于 0 时,可点击查看详情 |
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
### 3.2 设备异常明细
|
||
|
||
#### 3.2.1 设备异常明细说明
|
||
|
||
点击工作站卡片上的【查看数据】按钮,会打开全屏对话框,分为左右两栏:
|
||
- **左侧:连续异常列表** — 展示该工作站下存在连续异常的设备
|
||
- **右侧:累计异常列表** — 展示该工作站下存在累计异常的设备
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
#### 3.2.2 连续异常列表
|
||
|
||
连续异常列表展示该工作站下所有存在通道连续异常次数 ≥ 3 次的设备。
|
||
|
||
**列表字段:**
|
||
|
||
| 字段 | 说明 |
|
||
|------|------|
|
||
| 设备名称 | 设备的显示名称 |
|
||
| 设备编码 | 设备的唯一标识代码 |
|
||
| 异常通道数 | 该设备中存在连续异常(≥3次)的通道总数 |
|
||
| 最后清零时间 | 最近一次清除连续异常计数的时间 |
|
||
| 更新时间 | 设备异常统计数据的最后更新时间 |
|
||
| 操作 | 包括【详情】和【清除】两个操作按钮 |
|
||
|
||
**展开行:** 点击行首展开按钮,可查看该设备每个通道的连续异常次数,每个通道以角标形式显示具体数值,支持点击单个通道进行单独清零。
|
||
|
||
#### 3.2.3 累计异常列表
|
||
|
||
累计异常列表展示该工作站下所有存在通道累计异常次数 ≥ 10 次的设备。
|
||
|
||
**列表字段:**
|
||
|
||
| 字段 | 说明 |
|
||
|------|------|
|
||
| 设备名称 | 设备的显示名称 |
|
||
| 设备编码 | 设备的唯一标识代码 |
|
||
| 异常通道数 | 该设备中存在累计异常(≥10次)的通道总数 |
|
||
| 最后清零时间 | 最近一次清除累计异常计数的时间 |
|
||
| 更新时间 | 设备异常统计数据的最后更新时间 |
|
||
| 操作 | 包括【详情】和【清除】两个操作按钮 |
|
||
|
||
**展开行:** 点击行首展开按钮,可查看该设备每个通道的累计异常次数,每个通道以角标形式显示具体数值,支持点击单个通道进行单独清零。
|
||
|
||
### 3.3 通道异常详情
|
||
|
||
#### 3.3.1 通道异常详情说明
|
||
|
||
在连续异常列表或累计异常列表中,点击某个设备行的【详情】按钮,弹出通道异常详情对话框,展示该设备所有异常通道的具体错误信息。
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
#### 3.3.2 通道异常详情字段
|
||
|
||
**详情列表字段:**
|
||
|
||
| 字段 | 说明 |
|
||
|------|------|
|
||
| 设备名称 | 设备的显示名称 |
|
||
| 设备编码 | 设备的唯一标识代码 |
|
||
| 通道编号 | 发生异常的通道号 |
|
||
| 错误代码 | 异常的错误代码 |
|
||
| 错误描述 | 异常的具体描述信息 |
|
||
| 异常时间 | 异常发生的具体时间 |
|
||
|
||
**【注意】** 查看详情时,系统会根据连续异常或累计异常的类型,分别展示对应类型的异常记录。如果该设备在最近一次清零后有新的异常记录,详情中只会展示清零之后产生的异常。
|
||
|
||
### 3.4 异常清除
|
||
|
||
#### 3.4.1 异常清除说明
|
||
|
||
预警中心支持两种粒度的异常清除方式,用户可根据实际情况灵活选择。
|
||
|
||
**清除方式:**
|
||
|
||
| 清除方式 | 说明 | 适用场景 |
|
||
|---------|------|---------|
|
||
| 设备级清除 | 清除该设备的所有异常通道计数 | 设备整体已恢复正常,所有通道问题已解决 |
|
||
| 单通道清除 | 仅清除指定通道的异常计数 | 仅个别通道问题已解决,其他通道仍需关注 |
|
||
|
||
**清除效果:**
|
||
|
||
| 清除类型 | 效果 |
|
||
|---------|------|
|
||
| 连续异常清除 | 将设备的连续异常计数全部重置为零/清空,记录最后清零时间 |
|
||
| 累计异常清除 | 将设备的累计异常计数全部重置为零/清空,记录最后清零时间 |
|
||
|
||
#### 3.4.2 设备级清除
|
||
|
||
**操作步骤:**
|
||
|
||
1. 在设备异常明细页面,找到需要清除的设备行
|
||
2. 点击【清除】按钮
|
||
3. 系统弹出确认对话框,确认后执行清除操作
|
||
4. 清除成功后,页面数据自动刷新,工作站总览同步更新
|
||
|
||
**【注意】** 设备级清除会将该设备所有通道的异常计数一次性清零,请谨慎操作。
|
||
**【重要】** 清除后,相关的点位 NG 记录也会被标记为已处理,便于后续追溯。
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
#### 3.4.3 单通道清除
|
||
|
||
**操作步骤:**
|
||
|
||
1. 在设备异常明细页面,点击设备行的展开按钮,显示各通道的异常次数
|
||
2. 点击需要清除的通道对应按钮
|
||
3. 系统弹出确认对话框,确认后执行单通道清除操作
|
||
4. 清除成功后,页面数据自动刷新
|
||
|
||
**【注意】** 单通道清除仅将该通道的异常计数置为零,不影响其他通道的异常计数。
|
||
**【注意】** 单通道清除不会标记点位 NG 记录为已处理,仅重置计数统计。
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
### 3.5 数据导出
|
||
|
||
#### 3.5.1 数据导出说明
|
||
|
||
系统支持将预警数据通过异步任务导出为文件,适用于大批量数据分析和存档。
|
||
|
||
**操作步骤:**
|
||
|
||
1. 在预警中心页面,设置时间范围和筛选条件
|
||
2. 点击【导出】按钮
|
||
3. 系统弹出确认对话框,确认后创建导出任务
|
||
4. 系统自动跳转到"系统下载任务"页面,可在该页面查看导出进度并下载文件
|
||
|
||
**【注意】** 导出任务采用异步处理机制,大数据量导出可能需要一定时间,请耐心等待。
|
||
**【注意】** 导出前必须选择时间范围和工作站,否则无法导出。
|
||
|
||
**功能对应截图** :
|
||

|
||
|
||
## 4. 预警触发机制
|
||
|
||
### 4.1 预警触发流程说明
|
||
|
||
预警中心的数据来源于生产执行过程中设备上报的工序结果数据。当设备调用 MES 接口上报工序结果时,系统会根据工序配置自动进行通道异常检测。
|
||
|
||
**触发流程:**
|
||
|
||
```mermaid
|
||
sequenceDiagram
|
||
participant 设备 as 设备
|
||
participant MES接口 as MES工序上报接口
|
||
participant 验证 as 通道异常验证
|
||
participant 队列 as 预警队列
|
||
participant 统计 as 异常统计表
|
||
|
||
设备->>MES接口: 1. 上报工序结果数据(含pin_check、NG信息)
|
||
MES接口->>MES接口: 2. 检查工序是否开启通道异常记录
|
||
MES接口->>验证: 3. 工序已开启通道异常记录,触发验证
|
||
验证->>验证: 4. 验证pin_check数组的有效性
|
||
验证->>队列: 5. 存在异常(pin_check=1),写入预警队列
|
||
队列->>统计: 6. 异步任务消费队列,更新异常统计数据
|
||
统计->>统计: 7. 累加通道的连续/累计异常计数
|
||
```
|
||
|
||
**流程说明:**
|
||
|
||
| 步骤 | 执行者 | 操作 | 说明 |
|
||
|------|--------|------|------|
|
||
| 1 | 设备 | 上报工序结果 | 设备调用 MES 接口提交工序完成数据,数据中包含 pin_check(点位检查)和 NG(不良代码)信息 |
|
||
| 2 | MES | 检查工序配置 | 判断该工序是否在工艺详情中开启了"通道异常记录"开关 |
|
||
| 3 | MES | 触发验证 | 工序已开启通道异常记录,触发点位检查验证逻辑 |
|
||
| 4 | MES | 验证数据 | 检查 pin_check 数组和 NG 数组的合法性(长度一致、值均为 0 或 1、pin_check=1 时 NG 必填) |
|
||
| 5 | MES | 写入队列 | 当 pin_check 数组中存在值为 1 的条目时,将异常数据写入预警缓存队列 |
|
||
| 6 | 后台任务 | 消费队列 | 异步任务读取预警队列中未处理的数据,按设备编码汇总异常计数 |
|
||
| 7 | 后台任务 | 更新统计 | 将通道异常次数累加到异常统计表,区分连续异常和累计异常 |
|
||
|
||
### 4.2 前置条件
|
||
|
||
预警功能需要以下前置配置:
|
||
|
||
| 前置条件 | 说明 | 配置位置 |
|
||
|---------|------|---------|
|
||
| 开启通道异常记录 | 在工艺详情中为工序开启"开启通道异常记录"开关 | 生产配置 → 工艺模型 → 工艺流程 → 设置工序 |
|
||
| 配置不良代码 | 在系统中维护不良代码及其描述 | 生产配置 → 产品管理 → 不良管理 |
|
||
| 设备品类配置 | 确保设备已绑定到正确的设备类别(工作站) | 设备模型 → 设备信息 |
|
||
|
||
**【重要】** 只有在工艺详情的工序配置中开启了"通道异常记录",设备上报工序结果时才会触发通道异常检测,预警中心才会展示该工序相关的预警数据。
|
||
|
||
## 5. 常见问题
|
||
|
||
### 5.1 预警中心没有数据?
|
||
|
||
**可能原因:**
|
||
1. 工序未开启"通道异常记录"开关,请在【工艺详情】中检查工序配置
|
||
2. 设备尚未上报包含 pin_check 信息的工序结果数据
|
||
3. 选择的查询时间范围内没有异常数据产生
|
||
4. 设备类别(工作站)未正确配置
|
||
|
||
### 5.2 清除数据后为何又会重新出现?
|
||
|
||
清除操作仅重置异常计数,不会阻止设备继续上报异常数据。如果设备通道问题未从根本解决,设备继续上报异常后,计数会重新累加并再次达到预警阈值。建议:
|
||
- 定位并解决设备通道的根本问题后,再执行清除操作
|
||
- 清除后观察设备状态,确认异常不再复现
|
||
|
||
### 5.3 连续异常和累计异常有什么区别?
|
||
|
||
- **连续异常**:同一通道连续 3 次及以上报错,表示通道近期持续异常,是当前重点关注对象
|
||
- **累计异常**:同一通道累计 10 次及以上报错,表示通道虽然可能不连续但总体异常频率高,反映设备长期健康状态
|
||
|
||
### 5.4 导出数据失败怎么办?
|
||
|
||
导出功能依赖异步任务机制,请检查:
|
||
1. 是否选择了时间范围和工作站
|
||
2. 系统下载任务服务是否正常运行
|
||
3. 可在【系统下载任务】页面查看任务状态和失败原因
|