DB32/T 4144-2021 公共信用信息平台运行维护管理规范.pdf
- 文档部分内容预览:
DB32/T 4144-2021 公共信用信息平台运行维护管理规范
4.4.1信用平台的变更内容包括但不限于:
a)业务功能变更:业务需求变化引发的变更; b)实现方式变更:数据库结构、软件实现方法的优化; C)运行环境变更:软件、硬件更新和升级
4.4.2重要事项变更前应根据需求制定变更方案,经过运维小组讨论、审核、批准后实施,实施过程 主要包括:
a)实施前:评估变更影响范围,做好相关应急预案,明确变更时间和实施人员,在业务服务相 对空闲情况下进行,提前发布变更公告; 实施中:做好数据和平台备份石油化工标准规范范本,密切监督变更方案执行,变更后应进行测试,如未变更成功 应及时回退以保证系统正常运行; C)实施后:应及时更新相关文档并提交变更报告。
5.1计算机硬件设备运维
硬件设备应部署在不低于GB50174划定的A级标准的机房内 服务器应安装满足业务需求的最新版本操作系统和驱动,更新操作系统漏洞补丁,配置防火墙策略 账户密码策略,配置IP地址并测试网络连通性。 存储设备应按照厂家操作手册进行安装,根据信用平台的数据规模和需求,配置RAID模式、LUN分 区,并将LUN分区映射到HOST节点,在HOST节点测试存储连通性
5. 1. 2日常巡检
每日应对硬件设备进行巡检,查看设备面板灯、 硬盘灯、接口灯、运行状态灯、电源、风扇是否止 常,定期检查磁盘存储池状态、LUN划分状态、主机映射状态以及整体磁盘空间,并做好巡检记录
应及时分析硬件设备性能对信用平台业务的影响,优化硬件及其配置参数。 应定期检查平台业务对存储的需求并设计存储优化方案。按照经运维小组充分论证的存储优化方案 存储设备进行优化,优化的内容包括但不限 慈盘碎片整理、磁盘备份系统的升级、存储参数优化等。
变更前应将旧设备存储的数据按需求进行归档或同步到新设备,数据迁移结束后验证数据完整性和 有效性。 应针对硬件故障及损坏情况预留一定量的备件,并定期对备件进行清点、检测和补充。更换下的设 备或部件应交由运行单位按要求统一处理
遇有故障发生时,应立即查看故障日志,排查故障原因,及时通知供应商和相关业务方 在做好系统、配置和业务数据备份后,停机或待机更换备件。待系统正常运行后测试验证应用系统, 检查业务数据存储空间并做好故障处理记录。
5.2网络和安全设备运维
5. 2. 1安装部署
网络设备安装部署应符合政府信息系统网络安全要求,并在确保网络设备和安全设备运转正常后进 行信用平台安装部署。 网络和安全设备应配置登录失败处理功能和会话超时自动退出功能,安全设备应配置基于源IP地址 通信协议、目的IP地址、源端口、目的端口的细粒化访问控制策略
5. 2. 2日常巡检
每日应查看设备运转状态,在日常巡检基础上,按照下列要求定期进行例行检,并做好巡检记录。 a)网络安全设备应接入设备口检测设备连通性,查看设备日志、系统运行时间、软件版本、系统 服务启动、配置保存命令、HA启用、系统时间等是否正常。 b)其他安全设备应登录管理界面查看CPU负载、连接数、系统运行时间、WEBUI管理超时设置 系统服务启动、配置保存命令、HA启用、系统时间、业务访问状况等是否正常,查看病毒库、 特征库等软件版本是否及时更新。
应定期检查信用平台的网络通信情况,分析网络通信数据,并根据信用平台网络访问情况对网络 置参数、网络设备等进行优化
更换网络和安全设备时,应提前归档旧设备配置文件,并将连接在该设备上的网线打上标签,记 好对应的接口。变更后应立即对配置备份。 新设备上架后,应将旧设备导出的配置文件恢复到新设备上并测试相关业务网络连通性。
5. 2. 5 故障处理
遇有故障发生时,应立即查看故障日志, 及时通知供应商和相关业务方,做好 份。待备件更换或固件升级后,应现场测试设备与应用系统的连通性,并做好故障处理记录
5. 3. 1安装部署
云平台安装部署应配置高可用性功能,如几余、多副本等。应根据信用平台业务和数据需要损 规划,分配云计算资源和云存储资源,以支撑平台稳定高效运行
应对云平台进行日常巡检,查看有无告警日志,按序检查云平台计算节点服务器状态、计算和 源使用率、云主机状态、业务网卡和管理段网卡状态,并做好巡检记录。 应定期备份与查看云平台上的关键云主机,定期测试并保证云主机迁移功能正常
应定期对云平台各种资源占用情况等进行分析,并按照实际使用情况优化相关设置,实现负载均衡, 以确保云主机稳定性
在集群增加物理节点后应将其他物理节点的部分云主机迁移至新增节点,以确保各物理节点负载均 衡。 在集群减少物理节点前应将其承载的云主机迁移至其他物理节点,做好数据备份,并在确认业务正 常、数据完整后变更
5. 3. 5 故障处理
遇有故障发生时,应立即查看故障日志并排查故障原因。必要时及时切换至备份平台以保证业务募 统正常运行,并做好故障处理记录。
5.4.1操作系统及中间件运维
5. 4. 1. 1 安装部署
应依据操作规程和信用平台软件及系统要求,安装操作系统、中间件补丁并配置和调试。
5. 4. 1. 2 日常巡检
5.4.1.2日常巡检
5. 4. 1. 3 优化
应及时清理操作系统中的临时文件, 并根据操作系统申信用平台软件运行状况及时调优配置参数 定期更新操作系统和中间件补工
5. 4. 1. 4 变更
变更前应备份操作系统和信用平台涉及的中间件,并通知相关人员;如遇变更失败,应及时恢复至 变更前软件环境。
5.4.1.5故障处理
遇有故障发生时,应立即查看操作系统和中间件故障日志,排查故障原因,并及时通知相关业务方, 立刻开展故障修复,做好故障处理记录,
5. 4. 2. 1 安装部署
5. 4. 2. 2 日常巡检
每日应对数据库运行状况进行巡检,监视数据库系统运行情况,并做好巡检记录 , 检查点包括但不限于: a)数据库运行状态:查看当前用户及进程信息、数据库中断或异常、错误或警告等情况; b)数据库性能:查看目标占用空间、CPU、I/0、内存利用情况,判断是否存在性能隐患
5. 4. 2. 3 优化
应依据数据库运行状况优化性能,并及时备份相关参数。数据库调优包括但不限于: a 根据数据增长情况调整数据库存储空间容量: b) 配置数据库负载均衡; 数据库磁盘碎片整理。
数据库变更前应做好数据库备份工作,并根据数据库系统版本、结构等制定变更方案。变更过程中 如遇异常情况,应记录分析异常日志,并立即恢复原有数据库。 数据库变更后应对数据的正确性、完整性进行比对验证
5.4.2.5 故障处理
遇有故障发生时,应立即查看数据库访问日志,分析原因,排除故障。 遇主机系统发生故障导致数据库系统瘫痪时,应排除主机故障。必要时,恢复相同版本的数据库系 统和最近备份点的数据,并验证确认
应用软件上线前应通过功能测试、性能测试和安全测试。系统介质及相关文档应提交运行单位并按 照软件部署手册进行安装、升级、配置和测试。
6.2.1应制定软件例行排查点并确定系统所需资源阅值或临界点。根据软件排查点
应制定软件例行排查点并确定系统所需资源阈值或临界点。根据软件排查点,对应用软件进行
检查,并做好巡检记录,检查点包括但不限于: a 程序运行所需的各项服务是否启动成功; b 系统各模块性能是否超过预警线: c) 系统各项任务计划是否执行成功: d 数据库服务是否正常; e) 数据文件增长及硬件资源是否超过资源阈值: f 用户操作日志、数据库日志是否异常; g 用户权限控制是否合规; h 是否遭遇异常攻击。 6.2.2应对日常巡检情况进行例行报告并按周、月、年提交巡检报告。应及时追查巡检过程中发现的
应定期对软件运行故障、运行效率、占用计算资源等内容进行分析,并按照实际使用情况对和 进行优化。
6.4.2功能需求发生变更时,应分析所影响的数据结构和业务模块,评估该变更对软件系统影响,设 计对应的修改方案,完善软件系统并进行回归测试,以确保系统正常运行。 6.4.3软件变更应做好版本管理,应从运行单位借出相关应用软件源代码,并在此基础上进行变更。 司时,记录软件名称、版本、用途、相关参数、上线日期、变更记录、开发商等信息,待变更完成后提 交最新源代码及软件安装介质,
6.4.4应用软件变更实施前应做好备份,升级过程中如发生故障,应及时回退到原
a)普通用户:负责信用平台运行环境的维护、故障上报等: b 管理用户:负责信用平台的运行维护,汇总处理各用户上报故障等:管理用户可根据软件使用 范围分为县、市、省不同层级。 6.5.2应建立故障报告机制:普通用户遇到故障应及时上报管理用户,管理用户依职责处理和上报 3.5.3应制定故障处理流程,遇故障发生时应按照以下流程进行处理: a)普通用户应先检查信用平台本地运行环境,检查点包括但不限于:网络环境异常、硬件设备异 常、基础软件异常、病毒攻击等; b)普通用户检查运行环境无异常后报管理用户;管理用户检查软件是否存在故障,检查点包括但 不限于:权限分配,数据异常、接口访问异常等; c)管理用户确认故障无法修复后,应上报运行单位;运行单位在收到故障处理请求后应立即排查 问题,检查点包括但不限于:业务平台异常、数据库异常、平台运行软硬件环境异常等。
复流程。故障等级主要包括!
a)一级故障:业务系统瘫痪或造成业务系统中断:
b)二级故障:系统部分核心功能故障或无法满足核心业务运转,但未造成全部业务中断 c)三级故障:系统非核心功能故障,系统仍可支撑主体业务正常运转; d)四级故障:辅助性功能失效,系统无法通过用户交互页面正常使用,需通过技术支持在后台手 动完成。
定义出故障级别,并按照故障级别处置方法采取相应措施: a)一级故障处置:启动应急预案,立即启用备份平台保证系统运行,开始故障修复,直接上报运 行单位; b)二级故障处置:记录故障影响业务范围和故障数据,立刻开始故障修复,直接上报运行单位 c)三级故障处置:定位故障点,形成故障申报单工程计价标准规范范本,明确故障修复计划,逐级上报平台问题 d)四级故障处置:联系技术支持人员提供技术支持,定期汇总逐级上报平台间题
应按照GB/T22239确定的安全等级保护三级相关要求开展网络安全等级保护和测评。
依据《关键信息基础设施安全保护条例》的规定,运维小组必须加强基础设施安全管理,包括但不 限于网络安全、操作系统安全、数据库安全。 a)网络安全:通过访问控制技术、防病毒系统、漏洞扫描系统、安全审计系统等进行网络安全管 理,定期对信用平台运行所在网络进行安全检测、流量控制、策略配置,定期提交网络安全审 计报告,对报告中存在的隐患及时排除。 b)操作系统安全:通过关闭不需要的服务或端口,定期升级版本、安装补丁、修复漏洞、查杀病 毒、系统备份等措施保障操作系统安全,具体内容可参考GB/T20272。 c)数据库安全:通过设置数据库最小粒度访问权限,设置数据库访问审计功能,定期备份数据等 措施保证数据库安全,具体内容可参考GB/T20273
运维小组应加强应用软件安全管理,通过安全程序编程、设置复杂口令、双机热备、防篡改、 设置白名单、漏洞扫描、安全测试等措施保障应用软件安全。
4.1应根据不同权限管理要求,依用户所属部门、工作职责等赋予相应功能模块、数据查询范 据操作权限
.5.1应对数据采取数据备份、数据同步、双活等可靠性策略。数据备份可按照每日增量、每周全量 备份策略进行备份,备份文件至少保留14天。在具备条件的情况下,可建立数据异地灾备 .5.2应定期查看并妥善保管数据备份文件,定期对已备份的数据进行验证。应在测试环境中恢复备 分数据,与生产数据进行比较,以确保备份数据的完整性和可用性。 .5.3应制定数据恢复演练方案,并定期进行数据恢复测试演练。 .5.4应对信用平台加强反爬虫策略,包括但不限于:爬虫访问的自动识别、爬虫访问的自动屏蔽等
8.1运行单位应针对信用平台基础设施、软件系统和网络安全建立应急响应机制,并根据系统故障等 级编制应急预案。 8.2应建立应急演练测试环境,由运行单位牵头每半年至少开展一次应急演练,熟悉操作规程,完善 应急预案。
教育标准8.3应急响应具体内容和措施可参考GB/T288
....- 相关专题: