2016-11-20 09:03 | 原作者: 梒小婵
大多数时候,我们面临的声音是非常复杂的。在游戏里,每个独立声音的存在都是整体输出响度里的一份子。我们不可能像影视制作那样,随时根据需要来调整任何一个小片段的动态、频响等状态。所以这是个非常复杂的问题,想了很久都没想出来怎样一个思路可以把这事情说清楚。权且供各位争议一下吧。在这个问题上,每个有经验的设计师都会有自己的一套方法,其中有些手法是个人独特的,而有些是行业制定的一些基本标准。对于游戏来说,或许处理10个、100个样本还是很容易的,但是要平衡成千上万个样本的频响和响度,那就完全是另一件事情了。这就是艺术创作和量产的本质区别。
样本频响的控制,无论是何种类型的样本,即使是音乐和语音,都要为整体服务。所以,首先考虑的是让他们让出足够响度和频响給其他声音,这是响度控制的第一原则。 就拿音乐来说,原作一定是出版级别的全动态频响,而在游戏里,和电影一样,必须要让出足够空间,多数时候它不应该是全频段的。
目前单机领域普遍采用的样本RMS响度参考量如下:
(以上所有峰值都不超过-3dB,每种声音的RMS大约有上下2dB的允许差距空间)
通常的样本音量与FMOD音量设定如下:
在这个体系下,对应的常见流程是:
这种处理响度和平衡的的思路,首先是把单个样本控制在一个相对稳定的量级上,随后通过逻辑来控制和平衡整体输出的响度。这种“传统”的平衡手法是有相当充足的道理的,也是基于商业影视和音乐领域多年来积累的混音经验。这种平衡的方式是以静态混音为主,辅助以一定程度的动态混音。原则上,动态混音平衡也并不是作为主要的和根本的手法,尤其在项目中前期阶段。这种做法的直接好处就是:任何阶段,无论样本还是Event Volume体系里,都会有明确的音量标准让你很容易去判断。当然,这种思路也存在一个比较大的问题:入门的门槛比较高,需要设计师有非常好的混音训练基础和听力基础。
应该说,这也是目前单机领域的主流做法,并且由于近几年更多影视职业背景的专业人士转入游戏领域,这种思路得到了更深的发展。目前的引擎也越来越需要设计师具备这样的思路。天刀就是个很有意思的例子。当我接手的时候,我做的第一件事情是:
简而言之:我要在样本RMS值、FMOD Event Volume和游戏内听到的音量,这三者之间获得一些明确的规律,这个规律会直接影响我下一步的平衡和优化手法。
我当时得到的结论是:
因为给我的时间很短,所以第一波动作是优先考虑如何批处理,目标是两个:
而天刀里的情况比较复杂,在版本压力下,兜底查了之后理顺显然是不明智的。最现实的办法是充分理解现有机制和它表现出来的音量处理规律,从而得到一个比较快速又安全的解决方案。最终制定的基本音量配置方案如下:
在这份表格里,我列出了当前样本和FMOD的基本音量,也列出了目标音量,以此作为对比。而这份对比,无论对于早期的工作还是后续新增版本的设定,都是具有非常重要的指导意义的。
注:
在这套音量参照系里,我没有采用单机里比较普遍的做法,而是偷懒了的。这套办法并不完美,但是对于天刀这个项目的情况来说,这样的做法无异更实际一些。从不同行的色彩标注里,你也可以看到音量层次设定,简单说,基本上是要样本族群本身的色彩、动态和频响在游戏里形成层次上的差异。
在进行第一波样本优化之前,我做了两件事情:
所有的第一阶段处理分两步来解决:整体逐类型的先批处理,随后挑出其中比较特殊的一个个单独加工。基本动作都在Soundforge里进行批处理:
BGM(游戏内非战斗部分的音乐)批处理插件链基本设置:
这些批处理和局部处理的特点:
3D自然环境声的其中一类样本批处理设置:
以上步骤并不要求这个阶段就让每个声音100%达到最终效果;也不要求这一步100%解决掉所有问题。这一步骤的目标只有一个:确保90-95%的样本能够达到计划的响度和频响平衡就可以。结果是:在游戏里它们可能听起来没有特别的起伏。这也是对的!因为只有这样,你才能明确知道所谓的游戏核心体验与声音之间的感受关系。如果说这一步要做的一个面的工作,那么下一阶段的体验性调整就是点的工作了,只不过“点”很多。而我的步骤是,先解决大的点,随后逐步细化。所谓“大”的点首先是游戏体验、尤其是剧情相关、传送点这样的节点。
批处理框架步骤:
1. 在Soundforge里做好所有需要的插件链: 2. 分批处理完之后,保存这些最终使用过的插件链(后缀.bj的文件)
另外还有一些常用的批处理,例如:
*** 这些批处理预设就可以保存在天刀的工作文档内和团队其他成员协作共享,也可以作为重要数据存档,这对于后续内容的添加和处理是至关重要的。
*** 习惯在单个插件里保存项目需要的预设也是个非常好的习惯。 于此同时,所有sound event的音量差异也以0、-3dB、-6dB、-9dB等以3dB为阶梯单位调整(如上图所列)。这个动作的原因来自己心理声学。和预期的结果一样:第二天的版本里,整体音量、响度和动态变化变得就像白开水一样平淡无味,有些地方甚至像是失控了一样。原因在于,之前的Event音量配比做得很细致,已经呈现出凹凸有致的局面了,但是现在的整体平衡显得太有规律。“规律”是非常重要的,因为不同层次的音量差异如果有规律,给予游戏玩家的体验就会更加明确和统一。这一点,可以仔细观察那些美剧,即使做了10季,不同层次的音量比例、频响比例依然如一。对于一个需要迭代的网游或者手游来说,这一点和美剧是完全相同的!现在新的阶梯状音量体系,把这些不同类型声音的层次规律显现了出来,这就是我希望的。而我们第二步要做的就是逐类查找细节,确保某些声音不是太大或者太小,或者在游戏里它需要一些特殊的频段。基本手法也是:先小面积的抽取测试,同时找到两者折衷值,随后批量处理进游戏。这一步也是进一步处理整体平衡和层次。这样做的另一个好处是:让同事也可以轻易听出问题或者看到真正的渲染点。直到这一整体平衡过程结束,我才会开始挑出某些样本进行特别处理。事实上,正如前文提到的,最终绝大部分声音在FMOD里都没有机会设置到-9dB,甚至-6dB的几率都很低,原因在于这个FMOD版本和对于音量的衰减处理存在一些我们完全不知道的算法,我们能够确认的只是-6dB开始,音量衰减速度呈现濒死的体验,这是极其不正常的,但也是短时间内很难花时间去查清楚的。
在以上每一种类型的声音批处理之前,我对每种类型的声音样本作了足够大数量的随机抽取测试,以此找到插件链和渲染参数的折衷配比。并且能够确保后续的任何一批新增内容都能够适用于这些插件链。这步工作绝对是需要经验的,也是非常烧脑的工作。其中最重要的是验证复查工作:RMS响度测试、肉耳听力判断结合。这里需要强调的是:做这个工作,即使对于一个好莱坞高手来说,也是需要每天工作前做一些热身工作的。所谓热身工作就是每天一早去听一下自己最熟悉的音乐或者soundtrack,甚至要听一下前一天处理完的东西,从而确保自己的听力判断体系每天都是一样的。对于有些部分的响度和频响处理工作,我甚至会苛求自己当天必须结束,因为那些声音还会涉及到更多的色彩性问题。稳定的听力判断包括对频响、景深、立体声宽度、色彩,这些判断都不能因为自己的情绪和身体状况而受到影响。稳定的听力判断,的确是需要长期训练的。举个简单的例子,随便找一个高质量的素材库,无论它有多少样本,它们听起来响度、景深、声场宽度等等基本要素都是非常统一的,甚至色彩也是明确统一的。所以,好的监听习惯、稳定明确的口味、足够好的硬件,甚至对插件的理解和运用,都会直接影响到你的判断和结果。这也是为什么行业里都比较推崇拿着录音机出去录素材的做法,不仅仅是为了更好的创作体验等因素,样本的后期清理和优化工作更是一种非常有效的训练。
在处理语音响度和景深的时候,其实遇到过一个非常棘手的问题,也是一个非常典型的问题。我们原计划设想让不同场合出现的对白呈现出不同的景深,需要对样本进行不同的预渲染。例如主线任务B类剧情会比较偏向于融入场景,甚至需要做一些混响预渲染,它们不会出现全频段的样本。而旁白等特殊语音状态则强调贴贴脸特写式的全频段处理。点击语音则显得略微现场感一些,会偏薄,很多频段会被削弱,景深不低于2米。以此就可以呈现出电影化的层次特点,更戏剧性,线条也更清晰。然而,现有的文件命名和角色语音的归类方式,基本上无法让我们可以快速提取出那种分类方式所需要的样本。尤其是语音,因为数量又非常庞大而只能作罢,转而采取简单粗暴的统一渲染办法,最终只能照顾折衷。这个问题也广泛出现在动作和技能方面。如果有机会的看单机的数据,你会发现单机的语音样本名称其实非常长,有些项目里的样本名称甚至会留下录音批次的编号。因为单机还涉及到多语种的问题,所以会更复杂一些。因此可以看出,游戏的平衡和响度控制,往往是一个需要仔细规划的系统工程,从文件结构和文件名称、功能与实施方案等等每个环节都要综合考虑的。
简单介绍一下我在Soundforge里使用的主要插件:
关于样本响度的主要控制环节:
尾声
关于响度的问题,我多年前访问Skywalker的时候也请教过那里的制作人和设计师。除了以上提到的那些流程控制外,其实他们对于同一个IP的不同媒介版本,会有截然不同的处理和控制。比方说Star Wars的剧场版在美国主要支持THX,而家庭版则主要有THX、DTS、Dolby AC-3、Doldby Stereo。而宣传片内容,除了以上那些格式外,还有各种数字媒体版本,例如Vimeo、Youtube和 Quicktime,甚至还要考虑iPhone、iTunes之类的。对于不同的播放媒介,他们通常是要重新校准响度和动态的,甚至有时候是终混就要左不同版本,而不是混音完了之后再调整出不同版本。其目的是为了在不同媒介上都能表现出最佳的听感。这个工作目前在EA、UBI之类传统巨头体系里已经很接近影视领域的作法,很多时候宣传片、CG的制作是由专门的团队来完成。如何确保多部门的协作在响度和动态频响上保持一致,确实是一件非常复杂的事情。其中,除了人员的专业训练和工作流程、以及技术标准的普及化认识以外,工具的统一、硬件软件设施的统一也是非常重要的环节。
另外,从项目的一开始就设定一套涉及所有基本声音类型的技术文档,从样本容量、精度到播放方式、载入方式、整合方式都要包含在内。对应的,每种类型的样本频响与动态指标、录音流程、后期流程、批处理流程、命名规则等等,都要有明确的文字和数据记录保存。我们和项目组、CP之间不仅仅存在意识形态和需求上的沟通,更多的还需要足够多的技术沟通,尤其是项目前期阶段。
以上内容供探讨和参考。若有错漏,请斧正,不胜感激!
文章出处:http://www.midifan.com/ 转载文章出自 midifan.com |
|雷鸾编曲(原编曲186) ( 蜀ICP备2021031672号-1 )|川公网安备 51202202511082-1号 增值电信业务经营许可证:川B2-20221165
GMT+8, 2024-11-21 19:35
Powered by Discuz! X3.4