Звукочистка, или Цифровой ремастеринг и реставрация
фонограмм
ДЕНИС ЖАЛНИН
soundlab@studio707.msk.ru
За время существования аналоговой технологии записи и воспроизведения звука накоплены огромные архивы с поистине бесценными фономатериалами. Однако теперь уже мало кто предпочтет старые виниловые грампластинки и компакт-кассеты новым цифровым носителям звукозаписи. Новые требования к качеству звука, которые ныне предъявляются слушателями, не позволяют просто взять и перенести старые фонограммы на новый цифровой носитель. Кроме того, современная технология позволяет существенно улучшить исходный материал современных записей, исправить многие ошибки звукорежиссера и недостатки акустики самих студий. В этой статье мы рассмотрим арсенал средств современной студии звукозаписи, постараемся выявить плюсы и минусы, которые привнесла в работу со звуком современная цифровая технология, и немного поговорим о проблемах восприятия звука, записанного на цифровом носителе.
Что у вас в руках?
Многие читатели, наверное, уже подумали о тех средствах работы со звуком, которые имеются у них в распоряжении. Давайте сразу внесем ясность.
Большинство современных компьютеров располагают мультимедийными средствами, позволяя работать со звуком. Но я, увы, должен многих из вас огорчить. Как правило, звуковые адаптеры для компьютеров не удовлетворяют профессиональным стандартам студийного оборудования. Например, нельзя считать пригодными для профессионального ремастеринга и реставрации аудиоплаты, не оснащенные цифровыми интерфейсами ввода/вывода звука типа AES/EBU или, в крайнем случае, S/PDIF. А возможность работы через аналоговые входы/выходы отвергнем сразу - из-за неудовлетворительного качества ЦАП (цифро-аналоговый преобразователь) и АЦП (аналогово-цифровой преобразователь), встроенных в аудиоадаптеры. Таким образом, системы, рассчитанные на работу в составе обычных мультимедийных компьютеров, не подходят для профессионального ремастеринга и реставрации фонограмм, однако позволяют музыканту или звукорежиссеру поэкспериментировать со звуком в домашних условиях. Я имею в виду такие программы, как Sound Forge, Samplitude Studio, DART, и некоторые другие. Те, кто уже знаком с этими системами, наверняка согласятся, что в производственных условиях они вряд ли пригодны по причине весьма медленной работы. Кроме того, оставляет желать лучшего и качество обработки звука этими системами. То же относится и к цифровым фильтрам, и к более сложным алгоритмам - интерполяции, шумопонижения и подавления импульсных помех. Возникают трудности и при обычном монтаже. Подчас в трудной ситуации почти невозможно добиться незаметного на слух монтажа.
Еще одна важная отличительная особенность профессиональных систем обработки звука - использование дополнительных плат ускорителей цифровой обработки сигналов (ЦОС) на специальных процессорах. Как правило, это процессоры фирм Texas Instruments, Motorola и Analog Devices. Причем наиболее качественными системами являются те, которые используют процессоры с плавающей точкой, позволяющие существенно расширить функциональные возможности систем, улучшить качество их работы и производительность.
Не навреди!
Для того чтобы правильно использовать ремастеринговые системы, звукорежиссер должен обладать безупречным вкусом и богатым опытом. Эта банальная истина приведена здесь лишь потому, что большинство возможностей, которые рассматриваются в этой статье, могут быть использованы не только на благо, но и во вред. Так, погнавшись за максимальным подавлением шума или просто не вполне верно воспользовавшись цифровой фильтрацией, которая дает поистине неограниченные возможности коррекции амплитудно-частотной характеристики (АЧХ) сигнала, можно серьезно испортить исходный сигнал и ухудшить его восприятие слушателем. Тем не менее авторы ремастеринговых программ стараются дать звукорежиссеру максимум возможностей, что позволяет ему находить в сложных ситуациях самые неожиданные решения и добиваться максимально благоприятного результата.
Поклонники аналоговой звукозаписи убеждены в том, что цифровой способ воспроизведения вносит специфические искажения в звук. Однако трудно предположить, что "невооруженным" ухом можно отличить оцифрованный звук от аналогового. Но не будем иронизировать по сему поводу, а попробуем разобраться, так ли уж не правы приверженцы винила.
Качество конечной фонограммы сильно зависит от выбора АЦП на этапе записи исходного материала. Как вы знаете, стандартной частотой дискретизации для компакт-дисков была выбрана частота 44,1 кГц. Хотя, исходя из известной теоремы Котельникова, эту величина можно признать вполне достаточной, на практике этого явно мало. Представьте, например, что в таком цифровом тракте нужно воспроизвести синусоидальный звук с частотой 20 кГц. Получится, что каждая выборка значения напряжения будет происходить всякий раз в разной ("плывущей") фазе периода сигнала, и в результате мы получим низкую огибающую, которой в исходном сигнале не было. Чтобы избежать этого эффекта, в хороших ЦАП и АЦП применяются схемы оверсэмплинга, а в новый стандарт DVD для звука заложена другая частота дискретизации - 96 кГц. В качестве философского замечания можно добавить, что сам звук (как и восприятие звука) по природе своей носит непрерывный характер, а цифровая технология вносит в него дискретность. Поэтому и прослеживается тенденция увеличения разрядности оцифровки звука и увеличения частоты дискретизации.
До сих пор идет негласное соревнование между старыми добрыми аналоговыми приборами обработки звука и современной цифровой техникой. Так, многие профессионалы по-прежнему предпочитают пользоваться современными аналоговыми фильтрами, избегая применять цифровые фильтры. Это напоминает о еще не утихших спорах по поводу преимуществ ламповой техники перед транзисторной. До сих пор некоторые звукорежиссеры на этапе мастеринга готового диска пропускают звук через ламповые приборы.
По моему мнению, цифровая техника действительно позволяет творить со звуком чудеса, которые не были доступны аналоговой техники. Дело лишь в качестве применяемых алгоритмов и мастерстве звукорежиссеров. Преимущества цифровой технологии обработки сигнала распространяются далеко за рамки представления о том, что это лишь замечательный способ избавиться от шумов, присущих всем видам аналоговых носителей звука.
В настоящее время существует несколько систем цифрового ремастеринга и реставрации фонограмм, отвечающих самым высоким профессиональным требованиям. К ним можно отнести систему Sonic Solutions с пакетом программ No Noise, модули цифровой обработки звука CEDAR, а так же более доступные по цене системы SADIE на платформе IBM PC и некоторые другие. Постепенно завоевывают рынок и отечественные разработки. Это цифровые станции фирм Digiton и "Тракт" из Санкт-Петербурга, а так же новая система цифрового ремастеринга фонограмм "Канонъ", созданная творческим коллективом программистов и звукорежиссеров при участии автора этой статьи, - под руководством видного петербургского математика Александра Маримонта. На примере последней мы и рассмотрим основные алгоритмы.
Аппаратные средства системы цифрового ремастеринга "Канонъ"
Система "Канонъ" реализована на IBM PC с применением ускорителя ЦОС фирмы MicroLAB Systems, основанного на 60-мегагерцовом процессоре TMS320C3x компании Texas Instruments. Для связи с цифровым оборудованием применяются интерфейсы AES/EBU И S/PDIF. Программное обеспечение, с целью достижения высокой надежности и производительности, функционирует под управлением операционной системы OS/2. Все основные функции выполняет плата ускорителя, которая работает почти как отдельный независимый компьютер со своей собственной памятью и периферией. IBM используется лишь для отображения графической информации, а так же для организации и хранения звуковых данных в файлах. Кроме того, возможен экспорт файлов в других форматах для использования в программах, функционирующих под управлением операционных систем Windows 95/NT, которые при желании могут быть установлены на том же компьютере. Организация файлов позволяет осуществлять монтажные операции мгновенно, не тратя время на перезапись фонограммы на диск после каждого действия.
Как поймать черную кошку в темной комнате?
Сложность этой задачи вполне сравнима с проблемой избавления фонограммы от широкополосного шума аналогового тракта. Любой человек, обладающий музыкальным слухом, способен мысленно отделить шум от музыки. Но как этому научить компьютер? Как выбрать критерии, позволяющие безошибочно отличать шум от полезного сигнала, не искажая последнего? Стоит подчеркнуть, что задача эта не только технологическая, но и психологическая. Именно поэтому есть немало людей, которые критически относятся к цифровому шумоподавлению, считая, что шумоподавители "срезают" высокие частоты, искажают тембр звука и тем самым губят оригинал фонограммы. В действительности же восприятие звука, лишенного равномерного широкополосного шума, приводит к ложному ощущению обеднения тембра в области высоких частот, так как именно в этой зоне спектра ухо особенно чувствительно к шуму по причине плохой его маскировки полезным сигналом. В результате существенное снижение уровня шума в верхнем диапазоне частот воспринимается как общее обеднение спектра. Однако искажения тембра, возможные после применения шумоподавления, свидетельствуют, скорее, о неправильном подборе параметров процесса, которых в системе "Канонъ" используется по пять на каждую спектральную составляющую (плюс три параметра, воздействующих на весь диапазон частот).
Как и в большинстве подобных систем, работа начинается с поиска шумовой паузы, в которой заведомо не содержится полезного сигнала. Этот образец анализируется шумоподавителем с помощью статистического анализа поведения каждой составляющей спектра шума, а результаты анализа используются затем в процессе отделения полезного сигнал от шума. Здесь нас подстерегают некоторые трудности. Все хорошо, если шум одинаков на всем протяжении фонограммы, но так бывает относительно редко. Чаще всего статистика, собранная на шумовом отрезке, не вполне отражает поведение шума на фонограмме в целом, и там, где проявляется несоответствие, возможна деградация тембра или неполное подавление шума. На слух это воспринимается как синтетические призвуки, изменение динамических свойств сигнала или другие побочные эффекты. Уйти от этих неприятностей помогают параметры, корректирующие статистические данные и влияющие на передаточную функцию шумоподавителя на каждой спектральной составляющей, а так же задающие длину фрейма и размерность быстрого преобразования Фурье (БПФ), которое применяется для разложения сигнала на спектральные составляющие.
Качество подавления шума в огромной степени зависит от двух вещей. Первая - это форма функции зависимости выходного уровня сигнала по каждой спектральной составляющей от входного, которая строится с учетом статистических данных и может иметь гистерезис даже на нескольких участках. Вторая - это качество ресинтеза сигнала. Дело в том, что при обработке весь сигнал разбивается на фреймы ("окна"). Это небольшие по протяженности перекрывающиеся фрагменты сигнала, каждый из которых обрабатывается отдельно. Длительность их составляет обычно от 1024 до 16384 отсчетов. Трудности могут возникнуть, если соседние фреймы были обработаны слишком по-разному и плохо стыкуются. Высокое качество "склеивания" обработанных фреймов определяет расширенные возможности применения этого алгоритма, позволяя вести достаточно глубокую обработку, необходимую для наиболее шумных фонограмм.
Другим недостатком, хотя и менее заметным на слух, но все же серьезным может стать значительное подавление слабого полезного сигнала, который почти "тонет" в шуме. При этом может ухудшиться восприятие акустических свойств (реверберации) помещения, в котором была записана музыка, и потеряться слабые высокие обертоны музыкальных инструментов и голоса. Для их восстановления служит процесс, который сводится к отслеживанию огибающей уровня каждой составляющей спектра, и если происходит резкое угасание уровня, то включается алгоритм регенерации сигнала, при котором форма огибающей в фазе спада приводится к максимально естественной.
Замечательным критерием качества обработки может служить прослушивание сигнала, который был удален из фонограммы. Если в шуме не прослушивается никакого намека на музыкальный сигнал, вы можете быть уверены, что "с водой не выплеснули и ребенка", то есть оригинальный тембр искажен не был.
Помимо описанного выше процесса, для подавления шума можно воспользоваться многополосным цифровым экспандером/компрессором, которым многие из вас имели возможность пользоваться в аналоговом виде для решения аналогичных задач.
Большое значение имеет еще и последовательность обработки сигнала. Из тех сложностей, которые возникают перед нами в процессе шумопонижения, можно сделать вывод о том, что, если исходный сигнал содержит импульсные помехи (щелчки), от них необходимо избавиться прежде, чем начинать процесс подавления шума.
Раны на живом звуке
Любой носитель подвержен вредным влияниям внешней среды. Если это грампластинка, то все царапины и деформации действительно "режут по живому", существенно затрудняя восприятие. Кроме того, мы слышим и шум пластмассы, и шум магнитной ленты, на которой был записан оригинал. Изменение структуры пластмассы ведет к появлению эффекта, называемого по-простому "песком". Аналоговая лента - тоже не лучший носитель звука. Со временем магнитный слой разрушается. Явление саморазмагничивания ведет к появлению новых искажений. К сожалению, и цифровой способ хранения звука тоже не избавляет нас от тревог по поводу сохранности часто бесценного материала. Некоторые участки цифровых лент могут перестать читаться, от чего возникают "выпадения" в звуке. Если таких участков слишком много - лента вообще может оказаться непригодной к восстановлению, и можно лишь пожалеть о том, что звук не был записан аналоговым способом. Пусть с некоторыми шумами, но оригинал был бы сохранен!.. Таким образом, большинство импульсных помех, таких как щелчки, царапины, трески и выпадения, вызваны несовершенным хранением звукового материала.
Конечно, импульсные помехи могут возникнуть и на этапе записи, и часто из-за невозможности повторного проведения записи приходится исправлять эти недостатки. Помимо электрических тресков, возникших по вине плохой фильтрации питающего напряжения, возможны и акустические "тики", "слюни", скрип паркета и другие неприятности, избежать которых звукорежиссер пытается словами: "тишина в студии!"
Прибор, устраняющий щелчки и другие импульсные помехи, называется декликером (declicker). Процесс обычно делится на две фазы. На первой происходит обнаружение помех (детектирование), на второй - восстановление поврежденных участков сигнала (интерполяция). Понятно, что, поскольку вторая часть процесса непосредственно воздействует на звук, от качества ее работы результат зависит в большей степени. Интерполяция - это восстановление утерянных (поврежденных) участков сигнала путем анализа окрестностей вокруг помехи и ресинтеза сигнала, который будет помещен на поврежденное место. Влияние надежности детектора на конечный результат очевидно. В системе "Канонъ" сознательно установлено большое количество параметров, влияющих на работу детектора, что выводит функциональные возможности декликера за рамки простого подавителя щелчков. С его помощью можно обнаруживать и исправлять не только импульсные помехи, но и некоторые виды нелинейных искажений. К тому же имеется огромное количество разнообразных по природе импульсных помех, на которые невозможно настроить параметры универсально. Поэтому приходится к одной и той же фонограмме применять этот прибор несколько раз, настраивая его на различные типы помех.
Важно, чтобы детектор не фиксировал ложные повреждения, что случается, когда форма полезного сигнала имеет большое число острых пиков. Волна такой формы, с острыми пиками в каждом полупериоде, характерна для ударных или даже некоторых медных духовых инструментов, а также для многих синтезированных звуков. Поэтому в схему детектора включены алгоритмы, имеющие регулируемые параметры и препятствующие ложным обнаружениям.
Если импульсных помех немного, лучше производить обнаружение вручную, чтобы избежать ложных срабатываний детектора и бесполезного применения интерполятора.
Интерполяторы существуют и в виде отдельных приборов, позволяя найти оптимальный вариант исправления каждой конкретной помехи. Чаще всего от этих приборов нельзя отказаться в пользу простой операции "вырезания" щелчка, так как это может повлечь сбои в ритме, темпе. Конечно, если вы имеете дело с простым речевым сигналом, это может быть несущественным.
Экология тембра
Почему мы говорим об экологии тембра? Посмотрите на регуляторы тембра вашего усилителя. Они находятся в нейтральном положении? Тогда - хорошо. Но чаще каждый подстраивает тембр под свои вкусы. Одни - просто компенсируют нелинейность АЧХ собственного слуха или акустических систем, другие - идут на поводу у дурного вкуса, задирая до предела высокие и нижние частоты, напрочь перечеркивая труд звукорежиссера. Для такого слушателя звук естественного тембра, который он услышал бы в зале, намного "хуже" того, который раздается из динамиков в его квартире. Отсюда мы можем сделать вывод, что объективных критериев оценки тембра звука практически нет. Есть только субъективное восприятие слушателя. Однако способность объективно оценивать тембр звука может быть выработана звукорежиссером в концертных залах и в конечном итоге - в студии звукозаписи. Опытный профессионал способен уловить и скорректировать малейшие искажения тембра, даже если они находятся в пределах 1,5-2 дБ.
Сохранение естественности звучания, тембра в его первозданном виде - важная задача звукорежиссера. Тембр звука теряет свою естественность под влиянием многих причин. Главная из них - нелинейность АЧХ аналогового тракта передачи звука. Наиболее ярко проявление этого фактора мы чувствуем, если имеем дело с далеко не первой аналоговой копией оригинала. Есть и другие причины, ухудшающие тембр звука. Это неправильная расстановка микрофонов, недостатки студийного помещения (наличие резонанса), искажения контрольных акустических систем, заставляющие звукорежиссера выбирать неправильную частотную коррекцию при записи, и многое другое. Когда звукорежиссер оказывается в спокойной обстановке и прослушивает фонограмму через хорошие акустические системы, могут выявиться недостатки, требующие применения цифровых (или аналоговых) фильтров.
Цифровые фильтры, без сомнения, позволяют корректировать АЧХ более точно и глубоко. Кроме того, цифровые графические эквалайзеры, использующие метод БПФ, не дают искажения фазы сигнала, что присуще практически всем аналоговым корректорам АЧХ. Перепад уровня коррекции между соседними частотными полосами (которых может быть по 512 на канал) в графическом эквалайзере может достигать 90 дБ без внесения в звук дополнительных искажений.
О качестве работы этих приборов можно судить по двум экспериментам. Первый заключается в том, чтобы попробовать максимально подавить одну из частот и оценить, насколько заметна разница между исходным и обработанным сигналом. Хороший цифровой графический эквалайзер должен работать так, чтобы вы практически не могли уловить никаких изменений в звуке. В реальной ситуации, когда нужно будет подавить узкую помеху на сигнале, такой фильтр должен сработать наилучшим образом, позволяя действительно убирать из фонограммы только то, что мешает ее восприятию, не затронув ничего лишнего.
Другой эксперимент можно провести, подав на вход эквалайзера белый шум и подавив уровень на всех частотах, кроме одной. Если сигнал на выходе близок к синусоидальному и не содержит шумов на границе фреймов и других искажений - можете быть уверены, что вы имеете дело с отличным прибором.
Еще один тип цифровых фильтров - это параметрический эквалайзер. По управлению он похож на своего аналогового собрата, однако имеет более широкие границы задания параметров добротности и амплитуды. К примеру, вполне возможно вырезать полосу частот шириной 2,5 Гц, не внося изменений в соседние участки спектра. От цифрового графического эквалайзера он отличается тем, что в алгоритме не применяется БПФ. А это значит, что центральную частоту каждого фильтра можно настроить произвольно (она не обязательно должна совпадать с частотами из ряда Фурье) и что отсутствует обработка фреймами. Поэтому в ряде случаев оказывается предпочтительнее обрабатывать сигнал цифровыми корректорами АЧХ именно этого типа.
Как заточены ножницы?
Как страшный сон, вспоминаем мы теперь старую "технологию" аналогового монтажа с помощью ножниц и специального пластыря. На какие ухищрения приходилось идти, делая склейки: обычные, вертикальные, "косые", в виде хвоста ласточки… При этом нужно было следить, чтобы ножницы не намагнитились, не потерялись вырезанные кусочки ленты. Ведь, "не видя" звука, можно и промахнуться!
Теперь все по-другому. Фонограммы монтируются легко и быстро. Без затрат времени на перемотку, без разрушения исходного материала и, главное, без побочных эффектов. Благодаря тончайшей подстройке параметров каждой склейки, получаются удивительные монтажные трюки, ранее казавшиеся невозможными. Старый анекдот про звукорежиссера и скрипача-неудачника, суть которого заключена в одной фразе: "сыграйте мне гамму, остальное я сделаю сам!", теперь вполне может оказаться былью.
Применение монтажа не ограничено только составлением целой фонограммы из многих дублей. С помощью компьютерных "ножниц" можно вручную исправлять изъяны фонограммы, вырезая щелчки; делать своеобразные "пластические операции", вклеивая звук из одних мест фонограммы в другие - вместо поврежденных участков.
У каждой склейки имеется несколько атрибутов. Это форма фейдеров, длительность склейки, длина перекрытия фрагментов и расположение точки пересечения фейдеров. Обычно используется косинусоидальная форма фейдеров, позволяющая делать монтаж практически в любом месте фонограммы незаметным на слух. Существуют еще линейная, экспоненциальная и вертикальная (нулевой длины) формы фейдеров. Кроме того, если вы не совсем точно указали место склейки, можно без труда двигать эту точку влево и вправо, добиваясь наилучшего результата. Обычно сделав несколько вариантов склейки и сравнив их между собой, мы можем выбрать наилучший вариант и сохранить его в нашей фонограмме.
Заключение
Мы ограничились рассмотрением только самых необходимых средств, без которых работа с архивными фонограммами практически невозможна. Другие приборы, разнообразные "улучшайзеры", позволяющие привносить в звук новые качества, - тема для отдельной статьи.
Может показаться спорным сам вопрос: а надо ли вообще очищать фонограммы от шума, щелчков и помех? Мне кажется, что если обработка позволила сделать фонограмму более приятной для слушателя, то основная цель достигнута. И не имеет смысла спорить, насколько мы отошли от оригинала. Ведь понять, как должен был бы звучать оригинал, если бы во время записи применялась совершенная техника, неимоверно сложно. Для этого надо проводить целые исследования. Главным образом, исследовать шум. Он, как губка, впитывает в себя все изменения, которые происходили с фонограммой в результате ее переноса на различные носители. По "горбам" и "провалам" на шумовом спектре всегда можно судить, через какие фильтры был пропущен звук, увидеть погрешности АЧХ-тракта, через который проходила фонограмма.
Если вы собираетесь заняться реставрацией звука - приготовьтесь отражать многочисленные нападки и серьезные обвинения в ваш адрес, вызванные тем, что далеко не все услышат в вашей фонограмме то, к чему привыкли за много лет или что хотят услышать. Уже, наверное, не осталось людей, которые слышали Федора Шаляпина живьем, но есть много людей, которые заявляют, что знают, как должен звучать его голос. Хотя никто не думает о том, что привык слышать искаженный голос со старых пластинок. Позиция "не трогайте оригинал руками", мне кажется, не совсем верна. Напротив, нужно не стремиться к полному соответствию оригиналу, а выявлять его недостатки и искажения, исправляя их. Конечно, при таком подходе вы можете получить отреставрированный вариант, сильно отличающийся от оригинала. И "знатоки" замашут на вас руками, обругают. А слушатели - поблагодарят и с удовольствием послушают любимых музыкантов и актеров, не заставляя себя абстрагироваться от шумов и помех. И если их число возрастет благодаря вашей работе - это и будет означать, что потрудились вы не зря.
Ваши предложения и замечания ждем по адресу: mailto:tails@computerra.ru
ДЕНИС
ЖАЛНИН soundlab@studio707.msk.ru Денис Никитич Жалнин, 28 лет, родился в Москве. В 1993 году окончил Российскую академию музыки им. Гнесиных по специальности "звукорежиссер". Работал во Всесоюзном фонде телевизионных и радиовещательных программ. Делал цифровой ремастеринг многих архивных фонограмм, в том числе Ф. Шаляпина, Г. Нейгауза, Г. Гинзбурга. |
Copyright © 1998
Компьютерра
E-mail: site@computerra.ru