TCECS 20004-2020 城市供水监管中大数据应用技术指南.pdf
- 文档部分内容预览:
第三节数据挖掘方法选择
在供水大数据分析过程中,需要根据城市供水监管的应用场 景和应用目的选择合适的算法,不存在一个能够解决所有问题的 算法,一种算法也并不能总是优于另外一种。供水大数据的数据 挖掘方法选择需根据数据量大小、数据结构、数据特征、分析目的 来综合比选。
第一节水源和水厂大数据应用
对水质、水厂工艺等大数据进行采集、分析和信息挖掘,不仪 可解决传统手段难以解决的海量数据管理问题,还有利于对水质 风险来源、时空变化规律、危害程度等进行有效判定和识别,实现 对水源和水厂水质等风险的有效预警,并提出风险的最优处置方 案;同时电力标准规范范本,通过对水质与水厂工艺大数据的联合建模分析,有利于 水厂根据不同的水质特点和风险对水处理工艺进行调整和优化, 从而保障水厂安全运行并节约水厂运行成本。
城市供水单位应建立水质数据、设施设备数据、水厂工艺运行 参数数据和水文气象数据库,注重数据质量管理,确保数据准确、 有效。 一、水质数据 城市供水单位在日常运行中需按照现行行业标准《城镇供水 厂运行、维护及安全技术规程》CJ58的要求开展原水、出厂水以 及水厂各工艺段的水质检测,原水以及出厂水日检、月检、年检的 项目和频次,应符合现行国家标准《生活饮用水卫生标准》GB 5749和现行行业标准《城市供水水质标准》CJ/T206的规定。此 外,城市供水单位还需结合原水水质和净水工艺以及地方监管的 要求,确定是否需要增加相应的特征污染物检测指标和检测频次。 城市供水单位还应加强与相关单位对水源水质数据的信息共享。 城市供水单位应根据现行行业标准《城镇供水水质在线监测 技术标准》CJJ/T271对原水、工艺过程出水、出厂水及管网水安
装必要的在线监测仪表。对实验室和在线监测的水质数据应及时 记录并保存。 二、设施设备数据 城市供水单位需建立水厂内加药、沉淀、过滤、深度处理、消毒 等工艺环节主要设施设备的数据管理台账,包括:设施设备基础资 产信息,例如名称、品牌、型号、主要参数、使用/存放地点、数量、出 厂日期等;设备使用信息,例如投产日期、使用状况、能耗等;维护 检修信息,例如维护检修人员、操作措施、日期等。 城市供水单位还应加强与相关单位对取水、输水主要设施设 备的数据共享。 三、工艺数据 城市供水单位需按日建立水厂工艺运行参数台账,包括:水处 理工艺运行参数,例如处理水量、预处理药剂种类及其投加量、混 凝剂种类及其投加量、消毒剂种类及其投加量、沉淀池排泥周期、 滤池运行周期、反冲洗参数、深度处理系统运行参数、排泥水处理 系统运行参数等;各工艺段水质,例如,沉淀后出水的pH、浑浊 度、耗氧量(CODMn)、余氯等,过滤后出水的pH、浑浊度、余氯等。 城市供水单位还应加强与相关单位对取水、输水工艺运行数 据的信息共享。 四、水文及气象数据 城市供水单位需加强与水利、气象部门的信息共享,在必要时 按周期建立水源地的水文资料台账,包含:流量、流速、水位、潮汐、 水温等,掌握气象因素(气温、湿度、日照、降雨等)与原水水质的关 联关系以及由自然因素引起的水质突变
第三节水源和水厂大数据典型应用场景
一、水质风险分析预警 1.筛选水质风险预警指标的常见情形 城市供水主管部门及供水单位在水质日常监测风险预警和
精度,从而形成辅助决策模型。当面临水源地水质突变、水厂药耗 增加等相关参数变化问题时,可将以上情况信息作为输入参数,利 用辅助决策模型的数据识别和处理能力,输出相应的工艺运行结 果,也即原水或工艺参数发生改变后的出水情况,从而避免了人为 判断的主观性。此外,辅助决策模型也可预测出水水质达标条件 下对应的水源地水质预警值及工艺药耗最小值。 水厂运行工艺调整辅助决策应用案例可参考附录D。
第一节供水管网大数据应用目的
通过梳理和提炼供水管网运行风险、管网漏损的影响因素,采 用适宜的分析方法,对风险评估和漏损控制等场景进行模拟预测, 测结果可用于决策供水管网修复或更新改造计划、降低管网漏 损量等用途。
第二节供水管网大数据积累要求
城市供水单位宜优先建立供水管网地理信息系统(Geo graphicInformationSystem,地理GIS信息系统)、供水数据采集 和监控系统系统(SupervisoryControlAndDataAcquisition, SCADA)、独立计量区域(DistrictMeteredArea,DMA)系统、外 业系统、水力模型等信息管理系统,对供水管网进行信息化管理, 确保供水管网数据的准确性、全面性和时效性,并应实现供水管网 信息化系统与综合风险评估系统的数据共享。供水管网综合风险 评估系统应收集管网资产数据、环境数据、维护更新数据、水质数 据、运行数据、调蓄增压设施数据及其他重要相关数据。 一、资产基础数据 资产基础数据即用于描述管网实物资产属性的数据,该数据 宜从GIS系统中获取,包括管材、管径、管长、建设时间、埋深、防 情况、施工方式、接口方式等。 二、运行数据 城镇供水单位应收集供水管网运行状况的相关数据,包括水 压数据、流量数据、漏损数据等。 三、维护更新数据
城市供水单位应注意收集供水管网破损情况及维护更新相关 数据,包括管道编号、事故日期、位置、破损类型、破损原因、维修方 法,以及水量损失、影响用户情况等故障后果数据。 四、水质相关数据 水质相关数据包括在线水质监测和实验室检测数据,水质相 关数据积累要求参见本指南第四章第二节第一条。 五、环境数据 城市供水单位宜收集供水管网所处外部环境的数据,包括管 道位置、水环境、土壤环境、道路负荷、气象条件、阴极保护、铁路与 地铁的接近性等。
一、供水管网运行风险预警与更新改造辅助决策 通过开展供水管网运行风险评估,城市供水主管部门可掌握 供水管网破损风险、管网水质风险等预警情况,根据管道评估分析 结果制定管道修复/更新改造的优先级,明确供水管网修复/更新 改造的范围,并评估远期的供水服务水平及资产状况,对供水管网 运行维护与修复/更新改造工作进行经济技术优化,从而实现以供 水成本效益最优的方式,为供水用户提供满足或优于关键绩效目 标的服务。 供水管网运行风险预警与更新改造辅助决策的实施流程可概 括为五大步骤: 1.数据整理 获取供水管网数据,进行数据预处理。 2.事故概率预测 明确供水管网运行事故的具体评价对象,根据自身数据质量 和数据特征等情况,选择建模因子和适合自身供水管网特点的建 模技术,对供水管网的运行事故评价指标发生概率进行定量预测。 3.风险评估体系建立
水管网运行风险预警/更新改造辅助
二、供水管网漏损控制 城市供水单位在对供水管网现状运行大数据收集和整理的基 础之上,建立相关管理系统和管理机制,可为供水管网漏损控制的 评估和管理提供技术支撑。 分区计量是供水管网漏损控制的科学有效的手段,通过建立 分区计量管理体系,评估各区域供水管网漏损情况,可有效地识别 供水管网漏损的重点对象和范围,科学地指导开展供水管网漏损 控制工作,减少资源浪费。 分区计量管理的实施流程可概括为四大步骤: 1.现状调查及评估 首先借助GIS系统等信息管理系统,获取供水管网资产基础 数据,评估供水管网现状,收集所需管网信息。 2.分区划分 根据GIS系统基础地图中反映的管网拓扑关系,结合环境数 据等来开展分区的划分。 3.分区计量管理 基于供水管网水量、水压运行数据,以及SCADA系统数据 远程表务数据海量信息的支撑,建立分区计量体系并纳入管理。 4.分区计量监督与成效评估 漏损控制管理需建立一套监督报警的分区计量管理系统,对 漏损水量进行绩效核算,对水压和高漏耗进行监督和报警。 利用供水大数据开展供水管网漏损控制可参照《城镇供水管 网分区计量管理工作指南一一供水管网漏损管控体系构建(试 行)》(建办城【2017J64号)要求,建立基于DMA的分区计量管理 系统,利用供水管网大数据,用科学高效的方法和精细化的管理来 降低漏损,提升供水系统运行效率和安全保障能力。
第六章供水用户服务信息大数据应用
一、供水运行数据 城市供水单位应积累包括当地二次供水管网地理信息数据、厂 站供水区域图示,以及供水过程中厂站、二次供水的水量、水质、水 玉数据。对水质数据积累要求参见本指南第四章第二章第一条。 二、供水服务业务数据 城市供水单位应建立常规问题投诉回复模板,积累用户供水 服务问题工单的信息来源(来电、市民服务热线、官网、网络社交平 台等)、信息类别(咨询、问题、投诉、报装等)、产生时间、产生地点、 业务流转状态等业务数据。 城市供水单位需加强与气象部门的信息共享,在必要时建立 服务区域的气象数据台账,掌握气象因素(气温、降雨、降雪等)对 供水服务的影响。 三、营销业务数据 城市供水单位应积累相关营销业务数据,主要包括供水用户
户基本信息、给水号、水表信息、用水状态等
共水用户服务信息大数据典型应
众反馈供水问题热词和热图解析技
2 片区供水用户用水行为分析技术
水体富营养化预警指标筛
磷比较高,远远天于藻类生长所需的氮磷比,因此氨氮和磷元素成 为水中藻类增长最重要的限制因素。因此,初步筛选将pH、总磷 和氨氮指标纳入预测水源水体富营养化趋势的预警指标
盐指数浓度分别为2.75、2.53、2.43、2.55、2.67和2.77mg/L,预 测未来6个月高锰酸盐指数浓度暂不存在超标风险
采用人工神经网络法进行建模。模型的主要框架结构由输入 层神经元、输出层神经元和隐藏层神经元三个基本处理单元组成。 人工神经网络法最大的特点为具备自我学习能力,即每个函数都 有大量复杂参数,可以根据数据和已知结果,来进行参数的不断调 整,最大程度提高正确率。人工神经网络的训练过程主要分为两 大步骤:第一步骤为信号的前向传播,从输入层通过隐藏层,最终 通过输出层得到结果,第二步骤为误差的反向传播,通过计算代价
本模型的输入值主要包括进水条件(温度、pH)、水源地水质 (常规水质指标)、进水水量及药品投加量(PAC投加量、加氯量) 四方面内容,输出值为经净水工艺处理后的出厂水质(常规水质指 标)。 本模型采集1363个样本用来进行模型的训练,按4:1分为
训练集和验证集,验证集用来调整模型训练的参数。模型主要通 过对各个卷积层的神经元数量和分布进行调整、处理器的优化选 择、各其余层次的分布及参数调整,每次运算出误差值并取平均 直,对比并进一步优化。利用五年的实测数据,建立起对应的神经
水厂运行工艺调整辅助决策预测界
在具备拟合实际情况的模型基础上,通过改变不同的工况条 件,可准确快捷地预测得到对应的出水水质,并可同步计算所实现 的污染物去除率,同时可反推在出水水质达标要求下,进水条件或 各工况工艺参数的预警值。
某供水单位拟选择破损风险和水质风险作为供水管网运行风 险的评估指标,建立供水管网运行风险评估模型,在此基础上对其 服务范围内的供水管网运行风险进行评估,从而优化供水管网的 运行维护与修复计划,实现以供水成本效益最优的方式,为当前及 未来用户提供满足或优于关键绩效目标的服务。对供水管网运行 风险评估采用以下分析步骤: 1.数据整理 选择建模数据,进行数据预处理。 2.供水管网事故概率预测 选择合适的建模方法,构建供水管网破损概率预测模型,验证 模型准确性,预测供水管网破损概率,同时选择合适的建模方法, 构建供水管网水质风险预测模型,验证模型准确性,预测供水管网 水质概率。 3.供水管网风险评估体系建立 分别赋予供水管网破损风险和水质风险合适的权重系数,将 两部分风险按照加权求和,用于表示供水管网运行综合风险指数。 4.供水管网风险评估 计算各供水管网运行综合风险指数,根据指数大小评估供水 管网的运行风险等级。 5.供水管网运行风险应对 将供水管网运行风险评估结果作为重要参考依据,制定修复 和更新改造工作计划。 首先建立供水管网破损风险评估模型,选择参与建模的数据 包括:环境数据(道路负荷)、供水管网数据(管材、管龄和管径)和
参与建模的部分基础数据整理示意
风险预测模型相同。 供水单位利用建立的破损风险预测模型和水质风险预测模型 对更大范围的管道破损风险和水质风险进行了预测,按照各自 0.5的权重系数对破损风险预测模型与水质风险预测模型的结果 加权求和作为综合运行风险评估分数值,以该数值的大小来量化 评价供水管网运行综合风险,并作为制定供水管网更新改造计划 的重要数据参考。
将其中所有涉及龙头水有异味数据的发生地点进行数据抽 取,发现所涉及地点围绕JS路周边沿线分布。 由于JS路主管线水源来自YQ水厂环境标准,在排除沿线加压站与供 水管网可能污染水质的前提下,初步判定投诉问题与YQ水厂出
共水用户用水行为特征会
某市供水单位从2016年起陆续对供水区域内的小区二次供 水泵房进行了改造、接收,并统一进行管理,为更好地利用现有二 次供水设备优化供水管网末端的压力调度、改善客户服务质量,以 供水用户信息与2018年的二次供水生产数据作为基础,结合与之 相关的其他业务数据,分析不同小区之间的用水量变化特征。采 用以下分析步骤: 1.用户信息数据整理及分组 以数据流条目的形式收集、获取二次供水及供水用户信息数 据,并对现有数据流条目进行数据预处理,剔除无效数据,筛选出 包括供水用户信息、二次供水在线水质、水量、水压等数据元素,随 后以数据元素中二次供水泵房位置信息与供水用户信息为基础 结合供水区域图示等数据对二次供水泵房数据进行分组,此处以 相同供水水源、相同上级水厂与加压站作为前提对供水用户所在 小区二次供水泵房数据进行分组。 2.数据相关相异分析 对同组或不同组之间的小区二次供水泵房生产数据,运用时 间序列的思想,按照某一抽样维度,选取某一指标变量数据进行抽 样统计,此处选择按照通常作息时间划分为4组时段:0一5时(凌 晨)、6一11时(上午)、12一17时(下午)和18一23时(晚上)。对上 级加压站相同的两处不同建造年代小区二次供水泵房a、b的在线 实时流量(即每小时累计流量)数据分别进行抽样统计,此处的统 计方法是将每一时段内的最高与最低实时流量的所在时间进行抽 样,即将每日的实时流量变化抽象为由4组、每组2个时间数据组 成的一维数组,例如,2018年1月1日泵房a实时流量变化数组:
A0101 ={MAX,,MIN,,MAX2,MIN2,MAX3,MIN3,MAX4, MIN)=(0,48,6,17,16,22,19)。选取适当的相关相异分析模 型,此处选择采用t分析,分别对泵房a、b数组内的差异显著性逐 月分析,寻找出数组间的相似及相异规律。 3.溯源与应对 对分析结果进行判断,溯源形成的原因,给出供水调度的辅助 决策建议。 泵房a所在小区建成于2004年、泵房b所在小区建成于 2011年。泵房a、b设备运行状态良好,在线仪表经过校准,并且 上游供水水源地相同、水厂相同、上级加压站相同,在抽样过程中 只单一抽取了最高、最低实时流量出现的时间,排除了过多其他因 素对此次分析的影响。 通过对2018年泵房a、b抽样数组进行相似相异分析发现:泵 房a在2018年3、4、5、6、7、8、9、11、12月相似度明显,2018年1、 2、10月无明显相似相异倾向;泵房b在2018年2、7、8月的数组 相异度明显,2018年3、4、5、6、9、11、12月相似度明显,2018年1、 10月无明显相似相异倾向。对泵房a相似度高的数组数据做数 据累计排序,可观察到实时流量最高值在0,18,7,9,10,15,16时 数量多,最低值在5,23,2时数量多。对泵房b相似度高的数组数 据做数据累计排序,可观察到实时流量最高值在0,20,6时数量 多,最低值在3、22、1时数量多。对泵房b相异度高的数组数据做 数据累计排序,可观察到实时流量最高值在0,22,7时数量多,最 低值在6,23,3时数量多。 根据以上分析结果,结合小区业主用户平均年龄(泵房a所在 小区平均48.5岁,泵房b所在小区平均38.3岁),可以推断出泵 房b所在小区学前及义务教育阶段适龄人群较多,由于学生假期 导致晨间与晚间用水高峰时间的波动。而泵房a所在小区,成年 人尤其老年人较多,用水无明显高峰。 借此推断结论,可以对其他如供水用户信息准确度不高的新
建小区、租住用户多的小区等进行以上分析,从而对小区用户用水 特征进行画像,为诸如用水调度、生产预案等生产业务,应急供水、 营业网点设立等服务业务提供数据辅助决策支撑。
石油化工标准规范范本《地表水环境质量标准》GB3838 《生活饮用水卫生标准》GB5749 《信息技术软件生存周期过程》GB/T8566 《城镇供水服务》GB/T32063 《信息技术大数据术语》GB/T35295 《信息技术大数据技术参考模型》GB/T35589 《信息技术大数据分析系统功能要求》GB/T37721 《城市供水水质标准》CJ/T206 《城镇供水厂运行、维护及安全技术规程》CJJ58 《城市地下管线探测技术规程》CJJ61 《城市测量规范》CJJ/T8 《城镇供水水质在线监测技术标准》CJJ/T271 《面向大数据处理的物联网技术需求》YD/T3517 《城镇供水管网分区计量管理工作指南一供水管网漏损管 系构建(试行)》(建办城【2017J64号)
....- 数据标准
- 相关专题: 供水