什么是音频质量

什么是音频质量

1.响度

响度就是俗称的音量,常见的计数方式是dB,也就是分贝。生活中常见的分贝都为正数,比如60分贝是正常说话的声音。但dB作为一个对数单位他是不能直接拿来描述一个物理量的大小或多少的。在描述音频的音量时一般使用电平这个词,音频电平就是输入信号的电压大小,和人耳听见的分贝数是不同的。这部分比较晦涩难懂就不解释了,只要记住正常说话的电平要保持在-9dB~-6dB这个区间,在训练前用软件做下响度统一。听着感觉差距不大对吧。但因为db是一个对数单位。相差了3db那么就意味着相差f03f00a17634aab4baaba9a007801da1.svg.svg_xml倍,大约2倍,如果相差10db就是10倍。越到后面差值越大,所以不要觉得大了几dB差距不大没关系。如果在正常电平下你觉得听起来声音小,那么是你的音响问题,请调整你的音响,不要乱动电平。

6a77902b4ab9e0557295c20e24132005.svg.svg_xml

1708283041162-2a323e09-f6e1-4c22-9bd2-d9e16733f4e2

这是同样一段音频不同响度在AU中的样子

1708280606834-91b3de79-3383-44da-9801-7a9d08646f7c

2.混响

混响是后期反射声,你可以简单的理解为回声。你可能觉得正常录的声音能有什么回声,但实际上无论什么情况都会有混响,只是有大小和多少的区分罢了。最基础的看混响的方法是看频谱图,很明显第一张图就非常干净不拖沓。第二张图就是混响严重的。直接听下面的音频就是最好的对比。有混响的话就要用UVR5去混响,后面的教程里有讲。

1708290313346-eebb5420-bb4e-4a57-b3ea-8213598ab1981708284222228-2684368d-3679-4f63-8fd3-acf86a9ab3e7

3.音质

这里的音质是对音频准确性、保真度或清晰度的评估,不是hifi那种玄学的东西。一般情况下采样率,位深和码率都不会太低的。现在的麦克风都44.1k,16bit以上了。但清晰度这种东西就不好说了,你拿个几百块的耳机自带的麦克风那清晰度肯定差的不行,如果要自己录音的话最好买个单独的麦克风。再贵的耳机麦克风都不如一个独立麦克风。下面可以听一下清晰度的对比。当然清晰度也可以通过频谱图看出一点点。图一是音质好的,图二是音质差的。至于采样率,位深和码率不用太高的,会进行重采样的,Ai可不玩HiFi……

1708290317250-eb02bd59-10b6-4c9c-b78f-682e50b5041d

1708285927773-d9e62f79-7414-4e28-aa9f-c5581a4d86d4

4.口齿清晰

就是人话:“口齿清晰”。不要求像播音员一样,但不要让人听着就感觉口水要喷出来了。中文的话比较难举例,我用一个英文举例。比如:fucking读成f——king。还有丁真那种像抽了20年烟一样的嗓子,恶心的要死的气泡音和塔菲那种夹子。正常说话就行了,别给Ai倒垃圾。

5.噪音

还是人话:“噪音”。录音的时候让家里的狗别叫了,音响别放音乐了,爸妈别吵架了,风扇空调关掉,门窗关好。AI无法分辨这些噪音和你说话的声音,别给Ai倒垃圾。

6.说话完整

还是人话:“说话完整”。每个字读完,中文还好但英文经常读一半,比如:fucking读成f——king。可能你说话会有口音那也不行,对于AI来说你说的话就是对牛弹琴。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun283380.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2024年2月22日 下午9:07
下一篇 2024年2月22日 下午9:17

相关推荐