GY/T 349-2021 感知音频质量的客观测量方法.pdf
- 文档部分内容预览:
其中,归一化因数Norm的计算过程为:把一个1019.5Hz、0dB的满刻度正弦波作为输入信号, 以上的频谱系数最大绝对值。 如果声压级未知,建议Lp设置为92dBsPL
其申,归一化因数Norm的计算过程为:扎 10顿以上的频谱系数最大绝对值。 如果声压级未知,建议Lp设置为92dBspL
10.2.1.4外耳和中耳
表示在k行的频率表现。 FFT输出见公式(11)
车库设计规范和图纸kfl为“外耳加权FFT输
10. 2. 1. 5 分组到临界频带
听觉音高标度可通过Schroeder等人提出的近似法进行计算,见公式(12)
f[k] = 23.4375k
Fe[kg,n] = |F[kp,n]l × 10 20
2 = 7arsinh()
..........
音高z的单位是巴克(Bark)。 滤波器的频率边界范围为80Hz~18000Hz。对于基础版本而言,滤波器频带的宽度和间距对应的分 辨率为0.25Bark,对于高级版本而言,对应的分辨率为0.5Bark。 可推断出基础版本的频带数量为109,应与表2相符合;高级版本的频带数量为55,应与表3相符合
GY/T 3492021
表2用于基础版本的FFT 耳朵模型的频带
GY/T 3492021
GY/T 3492021
GY/T 3492021
表3用于高级版本的FTT耳朵模型的频带
GY/T 3492021
频率到音高的映射可采用后续介绍的算法完成,其中Fsp[kf,可以是“外耳加权FFT输出 表示,见公式(13)
频率到音高的映射可采用后续介绍的算法完成,其中Fsp[kf,可以是“外耳加权FFT输出 表示,见公式(13)
误差信号的计算见10.3.5。 该处理阶段的输出为频率组的能量Pe[k,n] 伪码: /* inputs */
sp[k,n] = Fe[k,n]
Fsp[]:输入能量 /*outputs*/ Pe[]:映射到音高的能量 /*intermediatevalues I:频率组索引 k:fft行的索引 Z:频率组的数目 基础版本是109 高级版本是55 f1:频率组的低频 fu[]:频率组的高频 Fres:频率分辨率的常数
GY/T 3492021
GY/I349202
10.2.1.8时域分布
为了模拟前向掩蔽,每个频率组的能量随时间用一阶低通滤波器进行分布处理。时间常数取决于每 个频率组的中心频率(见公式(12)以及表2),并按照公式(24)进行计算。
其中a可利用上述时间常数,通过公式(27)进行计算。
n表示实际的顿,k表示频率组,Ef[k,O]=0 在该处理阶段,模式E[k,nl对应激励模式。
n表示实际的顿,k表示频率组,Ef[k,0]=0
在该处理阶段,模式E[k,n]对应激励模式。
10.2.1.9掩蔽阈值
掩蔽是一种效应,指的是当一个虽然微弱但明显可感知的信号在相对较强的信号出现时,会感 该信号的一种现象。该阈值可采用加权函数m[k]对激励模式进行加权计算得到,见公式(28)和 29)。
在该处理阶段,模式M[k.nl代表掩蔽模式。
10.2.2滤波器组耳朵模型
10. 2. 2. 1概述
耳朵周边模型和模型中基于滤波器组部分的激励模式的预处理应与图6相
k·res k·res > 12
m[k] = lo.25k×res 3.0 M[k,n] E[k,n] +...
kres≤12 k·res>12
M[k, n] = E[k 10ml
GY/T 3492021
10. 2.2. 4 去直流滤波器
由于滤波器组对输入信号中的次声波非常敏感,因此需对输入信号应用一个去直流滤波器。本文 了截止频率为2OHz的四阶Butterworth高通滤波器,该滤波器由两个二阶IIR滤波器串联实现,见
10.2.2.5滤波器组
对被测信号和参考信号的每个声道,滤波器组均由40个滤波器对组成。这些滤波器在听觉音高标 度上均匀分布且具有恒定的绝对带宽。每对滤波器由两个滤波器组成,这两个滤波器具有相同的频率响 ,但在相位响应上差90°。因此,第二个滤波器的输出代表第一个滤波器输出的i1bert变形(若修 设第一个滤波器代表的复数信号的实部,则第二个滤波器的输出可代表其虚部)。他们的脉冲响应包络 是一个cos2形状。滤波器定义见公式(29),滤波器的中心频率、脉冲响应长度和额外延时应与表4 相符合(其中,k表示滤波器,n表示时间采样,T表示两个采样间的间隔:T=1/48000)。把hre(k,n) 和him(k,n)值当作因数,可以把它们看作FIR滤波器。当输入信号受时间限制时,滤波器输出仍可以 通过非常快的递归算法计算得到,见公式(32)
4 n N[k] ,n) sin cosl 2元·f.[k]· N[k] N[k], 0≤n
hre (k, n)= him(k, n) = 0
表4滤波器的中心频率、脉冲响应长度和额外延时
GY/T 3492021
GY/T 3492021
中心频率范围为50Hz18000Hz。听域音高标度依据Schroeder等人提出的近似算法进行计算得至 式(33)
为了使所有的滤波器具有相等的延时,对每个滤波器的输入延迟D个采样。其中,D表示信 冲响应长度与具有最长脉冲响应的滤波器的脉冲响应的长度之差的一半,见公式(34);在实 应增加样本的额外延时,但用于符合性测试的参考实现方案应包含该额外延时。
对滤波器的输出进行下采样因子为32的二次采样,也就是说,每个输出值需要对每一个滤波器的 入样本进行计算得到3
10.2.2.6外耳和中耳滤波
外耳和中耳的频率响应通过频率加权函数进行模拟得到。该函数用于滤波器输出,见公式(35)
实上,较高频率频带中的滤波器的包络并 虽然混叠现象仅在非常特殊的情况下发生(如 部分被高于1.5kHz的频率调制时), 且与该现象相关的问题也没有出现在已知的数据库中,但必须强调的是, 问题是有可能出现的,特别是测试信号为人工合成信号时。
out im[k|*= Wt
10. 2. 2. 7频域分布
GY/T 3492021
10. 2. 2. 8修正
滤波器输出处的能量等于滤波器信号实部和信号虚部的平方和,见公式(37) Eo[k,n] = Are[k,n] + Aim[k,n]? 10.2.2.9~10.2.2.11中的计算都是基于这些能量进行的。
为了模拟后向掩蔽,滤波器输出处的能量随时间采用FIR滤波器进行分布处理。该FIR滤波器具有12 抽头的c0s2形脉冲响应(相当于滤波器组输入采样速率下的384个样本的滤波器响应)。在时间分布处 理后,对输出进行6倍的下采样。所得结果乘以校正系数ca11=0.9761,得到相对给定回放电平的适合输 出电平,见式(38)
GY/T 3492021
10.2.2.10添加内部噪声
10.2.2.10添加内部噪
EThres[k] = 100.4x0.364(00)
IThres[k]l = 1004x0.364(10)
该处理阶段的模式E2[k,n]见公式(40),将用于调制模式的计算,并被称为“未被抹除的激励
10.2.2.11时域分布前向掩蔽
E2[k,n] = E,[k,n] + EThres[k, n
为了模拟前向掩蔽,每个滤波器声道中的能量随时间用一阶低通滤波器进行处理抹除。时间常数 每个滤波器的中心频率(见表4)并按照公式(41)计算。
式中 min 取值为0.004s。 一阶低通滤波器按照公式(42)进行计算
式中: T100 取值为0.020s; Tmin 取值为0.004s。 一阶低通滤波器按照公
该处理阶段的模式E[k,n]被称为激励模式。
10.3激励模式的预处理
10.3激励模式的预处理
10.3.1激励模式的预处理概述
本条中的大多数算法均适用 模型。由于这两种耳朵模型的二次米样 因子和频带数量不同,与该因子相关的常数可采用与耳朵模型相关的变量步长(StepSize)和z进行推 述。对于FFT耳朵模型,步长值取1024,z的值可以取55(高级模式)或者109(基础模式)。对于滤波 器组耳朵模型,步长值取192,z的值取40。若无其他说明,所有变量和递归滤波器的初始值均为0。
10.3.2电平和模式调整
10. 3. 2. 1电平调整和模式调整概述
为了补偿测试信号和参考信号之间的电平差异和线性失真,测试信号和参考信号的电平均调整到两 个信号的平均电平。 第一步,每个滤波器声道中的能量采用一阶低通滤波器进行平滑处理。时间常数取决于滤波器组的 中心频率,计算见公式(44)
烟草标准式中: T100——取值为0.050s; min 一取值为0.008s。 一阶低通滤波器的计算见公式(45)和公式(46)
式中: Tmin 取值为0.008s。
GY/T 3492021
GY/I349202
ETest和ERef是相互调整后的激励模式机械标准,而时间常数a可根据公式(47)进行计算得到
10. 3. 2. 2电平调整
....- 质量标准
- 相关专题: