Q/GDW 12118.2-2021 人工智能平台架构及技术要求 第2部分:算法模型共享应用要求.pdf

  • Q/GDW 12118.2-2021  人工智能平台架构及技术要求 第2部分:算法模型共享应用要求.pdf为pdf格式
  • 文件大小:4.8 M
  • 下载速度:极速
  • 文件评级
  • 更新时间:2022-03-31
  • 发 布 人: 13648167612
  • 原始文件下载:
  • 立即下载

  • 文档部分内容预览:
  • Q/GDW 12118.2-2021  人工智能平台架构及技术要求 第2部分:算法模型共享应用要求

    算法模型应支持以容器方式共享,容器应包括算法模型和算法模型运行所需的基础环境,可利用容 器直接部署应用,容器中算法模型文件应包括但不限于以下文件: a)算法模型二进制文件; b)算法模型配置文件; C)算法模型运行脚本文件

    算法模型源文件应包括由训练框架和数据集经过模型训练后得到的所有参数存储文件。所涉及的 练框架包括但不限于Caffe、PyTorch、TensorF1ow、MXNet、飞、MindSpore等深度学习框架。根据不 同描述语言和开发框架,算法模型源文件对应要求如下: a)Caffe框架。算法模型源文件宜包括caffemodel文件和prototxt文件,caffemodel存储模型 参数,prototxt存储模型网络结构; b PyTorch框架。算法模型源文件宜包括pth文件,用于存储模型的网络结构和参数; C TensorF1ow框架。模型源文件宜包括meta文件、data文件和index文件,meta文件存储模 型的网络结构,data文件存储模型的网络参数,index文件为张量描述列表或网络结构和参数 整合后的h5/pb文件; MxNet框架。算法模型源文件宜包括params文件和json文件,params文件存储模型参数,jsor 文件存储模型网络结构; e) 其他框架。算法模型源文件可采用通用PMML预言模型标记语言描述,文件格式为xml,可用 于描述和存储算法模型

    设备安装技术、工艺6.2算法模型配置文件

    模型配置文件描述所有可配置的变量,针对不同框架的配置文件格式要求如下: a)Caffe框架。算法模型配置文件应为prototxt格式: b)PyTorch框架。算法模型配置文件应为py格式; c)TensorF1ow框架。算法模型配置文件应为config格式: )MXNet框架。算法模型配置文件应为params格式: e)其他框架。算法模型配置文件可采用xml格式。 各类配置文件中可调参数应包含但不限于以下字段

    Q/GDW 12118. 22021

    表 1 可调参数说明

    6.3算法模型运行脚本文件

    提供算法模型训练所采用的数据集相关描述,应包括但不限于训练数据集、验证数据集和测试数据 集。数据描述字段包括但不限于以下字段

    7.2模型服务类型描述文档

    应对算法模型训练所属模型服务进行描述。模型服务分类应为语音识别、OCR识别、人脸识别 检测、自然语言处理、知识图谱。

    c)作者信息,算法模型的生成作者,可为个人或单位; 模型大小,算法模型源文件大小; 开发语言,算法模型核心部分的开发语言以及相应版本信息,如Python3.6、Javal.8等,可 为多个; 训练框架,训练框架宜包括但不限于TensorFlow、PyTorch、Caffe、MXNet、飞桨、MindSpore 以及相应框架的版本信息,如TensorF1ow2.0.0; g 最小配置,最小配置为能使模型运行的最小配置,最小配置描述应包括但不限于CPU、GPU、 内存、存储空间等配置信息; h 推荐配置,推荐配置为能发挥模型性能的最优配置,推荐配置描述应包括但不限于CPU、GPU、 内存、存储空间等配置信息; 1 芯片类型,应指明模型在边缘端运行所需要的芯片类型、型号,如GPU,NvidiaTeslaP4; 运行环境,运行环境为模型的实际使用环境配置,运行环境描述应包括但不限于如下配置CPU、 GPU、内存、存储空间

    性能描述文档应对算法模型的性能参数进行描述,根据不同类型模型,性能参数要求包含,但不限 于如下: a)语音识别类模型。语音识别模型的性能描述宜包括但不限于如下参数: 1)词错误率wER(WordErrorRate)。wER计算方式为:为了使识别出来的词序列和标准的 词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入(Insertion)、 替换(Substitution)、删除(Deletion)的词的总个数,与标准的词序列中词个数的百 分比,即为WER。其计算公式如式(1)所示:

    Insertions+Substitutions+Deletions WER=100x Total Word s in Correct Transcript

    式中: WER一一词错误率; TotalWordsinCorrectTranscript单词总数; Insertion一插入单词总数; Substitution替换单词总数; Deletion一删除单词总数。 2)句子识别错误率SER。SER计算方式为:为了使识别出来的词序列和标准的词序列之间保 持一致,需要进行替换、删除,句子中如果有一个词识别错误,那么这个句子被认为识别 错误,句子识别错误的个数,除以总的句子个数即为SER。其计算公式如式(2)所示:

    SER=100x SentencewithErro Total of Sentences

    Q/GDW 12118.22021

    1)拒识率FRR,是指在标准数据库上测试OCR识别算法时,相同OCR的匹配分数低于给定 值,从而被认为是不同ORC的比例; 2 误识率FAR,是指在标准数据库上测试OCR识别算法时,不同OCR的匹配分数大于给定崴 值,从而被认为是相同OCR的比例。 人脸识别类模型。人脸识别模型的性能描述宜包括但不限于如下参数: 1)精确率Precision,预测为正例的样本中,真正为正例的比率,如式(3)

    TP ecision: TP + FP

    ecal1),预测为正例的TP占所有真实正例的比

    TF TPR: TP + EN

    角率Accuracy,在所有样本里面预测对了的比率

    ccuracy TP + TN + FP + FN

    2TP+ FP + FN

    5)曲线ROC。接受者操作特征曲线,是反映敏感性和特异性连续变量的综合指标,ROC曲线 上每个点反映着对同一信号刺激的感受性。ROC曲线的横坐标和纵坐标分别是伪正类率 FPR和真正类率TPR。 6)伪正类率FPR。预测为正但实际为负的样本占所有负样本的比例,如式(7)

    FPR = FP FP + TN

    率TPR。预测为正且实际为正的样本占所有正样

    TPR=Recall TP TP + FN

    TPR=Recall TP (8) TP + FN

    式中: DR——检测结果; GT——标准答案。

    IOU= DRIGT DRUGT

    DRIGT IOU= DRUGT

    [Q/GDW 12118 22021

    章法模型应支持以部署方式进行应用 特容器部著, ,宜支持模型文件部署。

    算法模型宜支持以二次训练方式应用。根据算法模型的开发语言、深度学习训练框架、数 述文档等内容,宜支持对算法模型进行相应参数调优。

    Q/GDW 12118.22021

    人工智能平台架构及技术要求

    Q/GDW 12118.22021

    编制背景。 编制主要原则 与其他标准文件的关系.. 主要工作过程. 11 标准结构和内容. 条文说明.

    本部分根据国家电网有限公司下达的《2020年第一批技术标准制修订计划》(国家电网科(2020。 21号)的要求编写。 本部分编制背景是人工智能技术成为推动能源互联网创新发展的关键核心技术,为公司电网调度、 运维检修及分析决策等提供智能分析支持,在电网生产、经营管理和优质服务三大领域日益广泛应用。 为统一支持公司人工智能平台建设,开展人工智能算法模型共享应用标准规范研究抽样标准,为公司各类业务应 用提供电力人工智能算法模型的支撑服务。 本部分标准编制的主要目的是指导公司人工智能算法模型的共享与应用

    本部分主要根据以下原则编制: a)坚持先进性与实用性相结合、统一性与灵活性相结合、可靠性与经济性相结合的原则,以标准 化为引领,服务公司科学发展; b)认真研究国内外现行相关的ISO/IEC标准、行业标准,体现信息技术特性和功能拓展的最新发 展; c)充分调研国内外主流厂商人工智能平台建设成果,研究其在平台方面已经完成的工作和思路 借鉴其在平台服务内容和能力方面成果和经验: d)严格按照实际的电力业务需求及其发展趋势,制定出切实可行的技术规范。 本标准项目计划名称为“人工智能基础支撑能力架构及技术要求”,因用平台表达更准确,分为三 部分更清晰,更符合标准内容和业务现状,经编写组与专家商定,更名为“《人工智能平台架构及技术 要求第1部分:总体架构与技术要求》、《人工智能平台架构及技术要求第2部分:算法模型共享应 用要求》、《人工智能平台架构及技术要求第3部分:样本库格式要求》”

    3与其他标准文件的关系

    本部分与相关技术领域的国家现行法律、 法规和政策保持一致。 本部分不涉及专利、软件著作权等知识产权问题

    2020年1月,项目启动,并成立编写小组,对人工智能平台相关技术标准进行资料收集和分析。 2020年3月,完成标准大纲编写,组织召开大纲研讨会,明确编写思路。 2020年7月,完成标准征求意见稿编写,采用发函的方式广泛、多次在公司范围内征求意见。 2020年10月,修改形成标准送审稿。 2020年11月,国家电网公司互联网技术标准专业工作组组织召开了标准审查会,经过专家审查 查结论为:审查组协商一致,同意修改后以技术标准形式报批

    《人工智能平台架构及技术要求》分为下列3个部分:

    Q/GDW12118.2—2021一第1部分:总体架构与技术要求;一第2部分:算法模型共享应用要求;一第3部分:样本库格式要求《人工智能平台架构及技术要求》第1部分规定了人工智能平台建设的架构要求和技术要求;第2部分规定了电力人工智能算法模型在共享应用中所涉及的文件、描述文档和使用方式的基本要求;第3部分规定了人工智能平台建设的样本分类、样本参数要求、样本库接口和样本应用要求。第1部分侧重于人工智能平台总体要求,第2部分是模型库建设的支撑,第3部分是样本库建设的支撑。这3部分标准可分别独立使用。本部分是《人工智能平台架构及技术要求》的第2部分。本部分按照《国家电网公司技术标准管理办法》(国家电网企管(2018)222号文)的要求编写。本部分的主要结构和内容如下:本部分主题章分为4章,由算法模型共享方式、算法模型文件、算法模型描述文档和算法模型应用方式组成。本部分兼顾了人工智能平台的算法模型要求,本着先进性和实用性、可操作性和可扩展性等原则,给出了公司人工智能算法模型共享应用标准规范园林工艺、表格,将算法模型的应用按照属性描述、算法结构和使用方式三个维度,按照部署应用和二次训练两种应用目的进行分类;在明确分类的情况下,给出算法模型共享应用需满足的基础信息,为人工智能平台的算法模型服务提供支撑。6条文说明无。12

    ....
  • 技术标准
  • 相关专题:

相关下载

常用软件