上海景帝智能科技有限公司

扫一扫，手机逛起来

个人商铺

主营：物联网智慧平台解决方案包括智慧校园监控系统、企业智能制造与运营管理系统、政务系统政务公开平台系统、司法与监狱**监控系统、虚拟演播室、直播会务及赛事策划与直播、流媒体直播、及物联网IoT及虚拟现实AR硬件等解决方案产品与服务

02151857769

您现在的位置：

首页 > 技术文章

店铺信息

第11年

入驻时间：2012-04-11
联系人：王雅淇
电话��02151857769
联系时，请说明仪表网看到的
Email：saturnbest@163.com

在线询价

产品目录

技术文章

测量标准的演进

发布时间：2012-06-14

测量标准的演进

　　要了解标准，先让我们简单了解一下标准出台的背景。长期以来，人们对声音响度这一主观感知量的测量一直是以纯音为基础的基本定义，分别通过对不同声压级和不同频率的对比测量而得到。传统的响度单位(非国际单位)“Sone”和“Phon”就是根据人对稳态1kHz纯音声压级的主观感知来定义的。而大家熟知的等响曲线（见图1）也是对稳态的纯音利用对比试听的心理声学的研究方式获得的。等响曲线表明了主观感知的响度与声压级以及频率之间的关系。但现实生活中的声音大多数时候是由复合音构成的，是瞬态的。同时，影响声音的响度感知的其它因素，如持续时间则无法从这张图上直接读到。

　　虽然基于声压级和频率的测量，能够反映出客观量和主观之间的关系，但对音频节目的制作帮助有限。由于音频节目是以电信号的方式存在和传输的，制作人员只能通过对电信号的测量来预测节目的响度。与声信号的声压级，频率和持续时间相对应的电信号参数分别是：电平，频率和积分时间（启动时间）。

　　VU（Volume Unit）表，由于其指针的上升时间（当馈入一个0dB信号时，VU表读数从负无穷到0dB所需的时间）为300ms，大于人耳感知响度所需的积分时间（100-200ms），于是，VU表能够比较好的帮助制作人员判断节目响度变化，至今仍然有非常广泛的应用。但VU表本身的设计中并没有采用任何与主观响度感知相关的频率加权技术。

　　PPM（Peak Program Meter）峰值表是另一种电平测量工具，与VU不同，它的启动时间很短（10ms），也称为近峰值表（QPPM）。进入数字音频时代后，由于量化精度的限制（0dBFS），需要更**地指示数字样值信号峰值，进而出现了采样峰值表（SPPM）。峰值表帮助制作人员更好地判断信号的*大值，保护信号不被削波。但由于积分时间太短，不足以达到人感知响度所需时长，依靠峰值表基本无法判断节目的响度。使用峰值电平作为节目信号的标准化依据，也在一定程度上导致了今天我们所热议的“响度竞争（Loudness War）”。

　　为了能在数字音频时代更准确地指示节目的响度和峰值，在全球范围内形成统一的节目交换标准，一个基于数字音频信号的响度和峰值测量的国际标准，势在必行，

　　ITU-R BS.1770

　　ITU在2006年颁布了ITU-R BS.1770标准，全名是“音频节目响度和真实峰值的测量算法”。请各位读者注意，标准出台伊始，便明确指出了该标准为测量算法，非处理算法（关于这方面的误区，由于字数所限，将另文阐释）。这一版本也为后续确立了响度测量的框架。标准的另一部分，是关于真实峰值的测量，本文暂不做介绍。

　　这个算法以非常简洁的方式，兼容了从单声道到5.0在内不同格式伴音的响度测量，由两级滤波器（模拟人头效应的pre-filter以及响度主观感受的计权的RLB filter），积分以及声道加权（环绕声道的权重比前方声道多1.5dB）组成整个计权网络。

　　测量算法的核心，便是RLB滤波器，也称RLB计权曲线（见图3）。这是将客观可测量的电平值与人主观感知的响度之间实施对应的关键一环。

　　据ITU委托加拿大通讯研究中心（CRC）的实验结果，在单声道测试条件下，Leq(RLB)，即基于RLB曲线计权的平均化计算的结果与人的主观响度判断（基于实际的节目，而非纯音）达到了98.2%的吻合率。有趣的是，CRC同时发现，如果仅是测试单声道节目伴音，单纯的能量平均化（Leq）也能达到和带计权的Leq（RLB）几乎相同的准确率。在对一组由单声道，立体声和环绕声的混合素材的测试过程中，CRC发现Leq（RLB）响度测量结果与主观判断的吻合度达到98%。

　　ITU-R BS.1770-1

　　2007年，ITU发布了BS.1770的**个修改版BS.1770-1。虽然这一修改版并未对算法进行改动，但定义了经由BS.1770算法测量得出的满刻度响度单位LKFS，取代了上一版中的dB。明确了响度和电平在单位上的差异。标准还给出了在1kHz时，数字电平与响度的对应关系：即向左，中，右中任意一个声道输入0dBFS的千周信号时，输出的响度值为-3.10LKFS。这个单位沿用了与dBFS相同的计量方式，响度上1LKFS的变化和信号电平1dB的变化是等效的。

　　ITU-R BS.1770-2

　　2010年春天，ITU将EBU提出的”Gating”方案加入响度算法。那什么是“Gating”呢？

　　简而言之，在BS.1770-2中，Gating就是要将节目中不需要纳入响度计算的部分排除出去。那为什么需要排除这些部分呢？我们知道，电视节目的伴音并不是仅仅由单一的声音要素构成，比如纪录片，伴音里就有解说，环境声和背景音乐，甚至是无声的片段。我们的大脑在判断声音的响度时，并不是将这些不同的声音元素或内容“一锅端”，而是先要取舍。由于了两级“Gating”，计权网络也相应作出了调整：

　　Gating分为两级，分别使用**门限和相对门限。

　　**级：**门限(Absolute Threshold)

　　在先前的算法中，BS.1770的积分模式是从节目的开始到结尾的时间全长范围内所有采集和计算的样点实行积分和平均化运算。这其中，不可避免地也纳入了静音或响度极弱的部分。举例来说，在播音员播音的过程中，字与字，句与句之间有中断。虽然，中断并不影响我们播音员语声响度的主观判断，但如果这个中断部分被纳入BS.1770的响度（积分平均化）计算，将使*终得出的响度值低于语声的响度值，实际上降低了响度测量的准确性。所以，这一版标准中规定，节目中所有低于-70LKFS的部分将不纳入*终的响度计算。

　　Gating发生在整个响度处理的*末级，也就是积分之后。那么Gating所排除或舍弃的部分自然也是经过积分的，那么应该如何来实现呢？EBU的工程师提出了“块”的概念。以400ms为一个单位积分时间，也就是整个节目将被切成若干个以400ms为长度的“块”，为了让测量的准确性更高，相邻的“块”间有75%的时间重叠。在**门限的Gating计算中，所有响度低于-70LKFS的块将被舍弃。

　　**级：相对门限（Relative Threshold）

　　科研人员很早就发现，人对响度的判断，与其注意力有关。心理声学中的“鸡尾酒会效应”也是一种例证。杜比公司在其研究中发现，由于电视节目伴音的主要内容为语言，或称对白，观众对节目整体响度的判断也主要基于对白的响度，这也是前文中提到的对声音元素“取舍”。杜比公司提出了对白智能（Dialog Intelligence）的技术，分离节目中的对白成分，并对其单独实施响度测量，以此作为对节目响度实行归一化的依据。这一做法得到了ATSC的支持，ATSC在其A/85文档中将节目伴音中可作为响度归一化依据的元素称之为锚元素（Anchor Element），并多次提到，对白是*重要的一种锚元素。

　　而EBU的专家在R128中则提出了另一种分离“锚元素”的方式，即利用前景声（吸引观众注意力的部分）和背景声（对观众响度判断没有影响的部分）之间的响度差对二者实行分离。其计算方法是，**阶段，经过**级**门限的排除之后，对剩余的块实施平均计算，得出一个平均响度值。**阶段，对经过**阶段排除后剩余的块进行筛选，再舍弃响度低于该平均响度值-8dB的块。然后再对*终剩余的块的响度实行平均计算，得到输出的响度值。

　　在ITU对BS.1770-2的讨论中，采纳了EBU提出的以相对门限的方式分离“锚元素”的算法，但将相对门限由-8dB修改为-10dB。

　　结语

　　BS.1770-2算法甫一推出，争议不断。虽然离颁布时间已过去一年，美国尚未采纳BS.1770-2，A/85中依然沿用BS.1770-1。而日本ARIB在去年颁布的TR-B32标准中，采纳了BS.1770-2。

　　由于篇幅所限，无法对本文中所提及的概念进行深入探讨。纵观整个响度测量标准，目前对环绕声响度的主观验证性测试结果尚未十分成熟，LFE对响度的影响也在讨论中，真峰值测量的算法尚存争议，这些都决定了ITU-R BS.1770还将继续前行，让我们拭目以待。

(责任编辑：景帝www.ijingdi.com)

上一篇：H.323的体系结构
下一篇：电影院工艺设计的技术要求

备案号：粤ICP备11010883号| 公安机关备案号：44040202000312| 版权问题及信息删除： 0756-2183556 QQ：

以上信息由企业自行提供，信息内容的真实性、准确性和合法性由相关企业负责，易展仪表展览网对此不承担任何保证责任。