Cyfrowa obróbka dźwięku

 

Programy wzbogacające doznania akustyczne

Edytory audio są programami komputerowymi, dzięki którym możemy ingerować w istotę zapisanego w formie cyfrowej dźwięku. Tyle z ogólnej teorii, gdyż w dalszych rozważaniach wiadomości teoretyczne nie będą nam aż tak bardzo potrzebne. Praktyczne zastosowanie edytorów audio może być bardzo szerokie - począwszy od dokonywania drobnych poprawek czy modyfikacji sygnału w próbkach (np. w celu użycia ich w słuchowisku czy dostosowania do własnych potrzeb), poprzez użycie edytorów do przenoszenia nagrań z kaset magnetofonowych i płyt winylowych na nośniki cyfrowe, aż do realizacji mniejszych lub większych projektów muzycznych.

Do najpopularniejszych edytorów audio na platformę PC i system operacyjny Windows bez wątpienia należą Cool Edit 2000, Cool Edit Pro, WaveLab, SoundForge oraz GoldWave. Wszystkie te programy opierają swoje działanie na tych samych zasadach i obsługuje się je w podobny sposób. Dlatego też nie ma sensu opisywać działania każdego z nich po kolei, lecz skoncentrować się na jednym mając w pamięci, iż analogicznie działać będą również pozostałe aplikacje. Ja w tym mini-przewodniku obsługi edytorów audio opierać się będę na programie Cool Edit Pro.

Opisywane edytory audio obsługują szereg formatów plików dźwiękowych, z pośród których chyba najpopularniejszym będzie format WAV oraz jego pochodne (np. kompresja MP3 czy MS ADPCM). Edytory audio nie obsługują formatu MIDI, gdyż jest on "z innej bajki".

Gdy już zdecydowaliśmy się z jakiego edytora audio chcemy korzystać, należy go pobrać (np. ze strony producenta; linki wyżej) i zainstalować. Gdy instalator będzie się pytać o naszą zgodę na powiązanie popularnych formatów plików dźwiękowych (np. WAV) z edytorem audio należy pamiętać, że w razie naszej akceptacji wszystkie pliki tego typu będą domyślnie otwierane przez edytor (a nie np. przez odtwarzacz multimedialny). Jeżeli instalator będzie pytać o folder dla plików tymczasowych, należy wskazać folder na dysku, na którym jest dużo wolnego miejsca. Gdy mamy wątpliwości co do pytania stawianego przez instalator, najlepiej jest wybrać opcję zalecaną albo domyślną (o ile to możliwe).

Kiedy uruchomimy aplikację do obróbki dźwięku, naszym oczom ukaże się okno edytora. Najlepiej jest je zmaksymalizować. Okno każdego edytora podzielone jest na kilka części, które występują praktycznie we wszystkich tego typu aplikacjach. Idąc od góry okna są to: pasek menu, pasek przycisków, część z graficznym rozkładem sygnału, pasek z przyciskami sterowania.

Okno edytora audio Cool Edit Pro


Pasek menu zawiera oprócz standardowych pozycji takich jak File, Edit, View, Help, także te specyficzne dla edytorów, np. menu Effects w Cool Edit Pro. Dla przykładu, poprzez menu File możemy otworzyć, zamknąć lub zapisać plik.

Pasek menu edytora audio Cool Edit Pro


Następny pasek zawiera przyciski, które w większości odpowiadają funkcjom zawartym w poszczególnych menu, np. otwieranie i zapisywanie plików, kopiowanie fragmentów, nakładanie efektów itp. Jeżeli nie widzisz wszystkich przycisków, kliknij na istniejących przyciskach prawym klawiszem myszy i zaznacz wyświetlanie pozostałych sekcji przycisków.

Pasek przycisków w Cool Edit Pro


Największą część okna edytora (około połowy) zajmuje miejsce na przedstawienie sygnału dźwiękowego z pliku w formie odpowiednio wyskalowanej sinusoidy (po jednej dla każdego kanału).

Tutaj po otwarciu pliku będzie wyświetlone widmo sygnału


Na samym dole okna znajdują się przyciski sterowania dźwiękiem podobne do tych z odtwarzaczy, licznik czasu odtwarzania, przyciski sterowania powiększeniem obrazu sinusoidy oraz miernik poziomu sygnału.

Od lewej: przyciski odtwarzania, przyciski sterowania widokiem, licznik czasu odtwarzania, informacja o pozycjach czasowych widoku i zaznaczenia


Przed przystąpieniem do pracy należy najpierw skonfigurować edytor. W jednym z menu z górnego paska powinna być pozycja Options, Settings albo Preferences. Po jej wybraniu (w Cool Edit Pro menu Options | Settings) otrzymamy dostęp do ustawień edytora. Warto jest na początku określić folder przechowywania dla plików tymczasowych. Pliki te będą miały rozmiar kilkudziesięciu lub kilkuset megabajtów, dlatego dobrze jest umieścić je na dysku, na którym jest dużo wolnego miejsca. Poza tym ustawieniem możemy mieć wpływ m.in. na rozmiar bufora odtwarzania i nagrywania oraz wygląd i funkcjonowanie edytora. Początkującym polecam zostawienie tych funkcji na razie w spokoju; na ich zmianę przyjdzie czas, gdy lepiej poznacie edytor i będziecie wiedzieli jak dostosować go do swoich potrzeb.

Warunkiem skutecznej pracy z edytorem audio jest oczywiście posiadanie w komputerze karty dźwiękowej i właściwe jej skonfigurowanie. W Panelu sterowania, w aplecie Multimedia albo Dźwięki i urządzenia audio wybieramy domyślne urządzenie dla odtwarzania i nagrywania dźwięku (w przypadku, gdy zainstalowana jest więcej niż jedna karta dźwiękowa) oraz w mikserze (przycisk Zaawansowane) ustawiamy przy pomocy suwaków odpowiedni poziom głośności dla dźwięków Wave i ogólny poziom głośności. Gdy będziemy chcieli nagrywać dźwięk, uaktywniamy wejście mikrofonowe lub line-in poprzez odznaczenie pozycji Wycisz oraz odpowiednie ustawienie suwakiem poziomu. Wejście mikrofonowe różni się od line-in tym, że posiada wzmacniacz sygnału. Z reguły jest on jednak słabej jakości i wprowadza wiele szumów.

Przed przystąpieniem do pracy z edytorem audio powinniśmy odpowiednio ustawić misker dźwięku w systemie Windows


Czasami konieczne jest również odpowiednie skonfigurowanie edytora audio do właściwej współpracy z kartą dźwiękową (w Cool Edit Pro menu Options | Device properties). Ma to miejsce zwłaszcza wtedy, gdy w systemie zainstalowana jest więcej niż jedna karta dźwiękowa i jedna z nich ma służyć do nagrywania, a druga do odtwarzania dźwięku. Z reguły jednak, jeżeli tylko karta dźwiękowa jest poprawnie zainstalowana w systemie i aplikacje multimedialne odtwarzają bez problemów dźwięki, edytor także nie powinien robić trudności.

 

Mając już zainstalowany i skonfigurowany edytor audio, możemy przystąpić do otwarcia przy jego pomocy pliku dźwiękowego. Do otwarcia najlepiej jest wybrać plik w formacie WAV. Gotowe próbki powinniśmy znaleźć w katalogu \Windows\Media\. Możemy także posłużyć się plikiem w formacie MP3 (jeżeli edytor ich nie obsługuje, trzeba je przedtem zdekompresować do formatu WAV) lub zgrać ścieżkę z płyty CD za pomocą rippera audio (np. EAC). Dla dalszych poczynań warto jest wybrać taki plik, który ma przynajmniej 5 sekund długości.

Gdy otworzymy plik dźwiękowy (menu File | Open), edytor odczyta a następnie wyświetli nam jego obraz - widmo sygnału dźwiękowego. Zakładając, że będziemy otwierać plik z dźwiękiem stereo (a tak prawdopodobnie będzie), wyświetlone zostaną nam tak właściwie dwa widma - dla prawego i lewego kanału. Widmo dla lewego kanału znajduje się z reguły na górze, a dla prawego - na dole.

Obraz sygnału w pliku dźwiękowym. Widmo dla lewego kanału znajduje się u góry, dla prawego kanału znajduje się na dole


Skupmy się teraz na obrazie widma jednego z kanałów (dowolnego). Czym jest ten obraz? Jest to nic innego, jak funkcja o przebiegu sinusoidalnym przedstawiona w bardzo dużym pomniejszeniu. Żeby się o tym przekonać, należy powiększyć (zazwyczaj przy pomocy przycisku z lupą) obraz do takiej skali, aż wyraźnie widoczny będzie łagodny przebieg fali.

Fala sinusoidalna będąca obrazem dźwięku


Osią poziomą tej funkcji jest czas podany w sekundach. Osią pionową są wartości wyrażające natężenie głośności dźwięku. Wartości te mogą być wyrażone w różnych skalach: wartościach sampli, procentach czy decybelach (skala dBFS). Na przykład sygnał zapisany w rozdzielczości 16-bit (bardzo często spotykanej, np. płyta CD) może przyjąć w jednym momencie jedną z 32768 wartości dodatnich i tyle samo ujemnych, czyli razem jedną z 65536 wartości (a więc 216). Wartości najbliższe 0 znajdują się pośrodku widma sygnału (w okolicach czerwonej linii na zdjęciu), wartości najwyższe (zarówno dodatnie jak i ujemne) umiejscowione są najdalej od linii środkowej (na zdjęciu żółte linie), symetrycznie względem najniższej wartości.




Fragmenty dźwięku, w których występuje przewaga sygnału o niskich wartościach (amplituda fali jest mała), są ciche. Te fragmenty, w których amplituda fali jest duża, oznaczają głośny dźwięk. Informacje te można łatwo zweryfikować, gdy zaczniemy odtwarzać dźwięk i będziemy obserwować przesuwającą się pionową linię, wskazującą miejsce w pliku, które jest aktualnie odtwarzane.

Teraz trochę nudnej teorii, która jest jednak bardzo ważna dla dalszego rozumienia istoty działania edytorów audio. Poziom głośności najczęściej jest wyrażany w decybelach lub procentach. Skala w decybelach jest nieco inna, niż ta znana np. z lekcji fizyki (według której np. głośność spadającego liścia to 6 dB, a startującego odrzutowca to 120 dB). W edytorach audio używana jest skala dBFS. W skali tej mieszczą się wartości od minus nieskończoności dBFS (najniższy poziom głośności sygnału) do 0 dBFS (najwyższy poziom głośności sygnału), czyli praktycznie same wartości ujemne. Dolna granica jest ruchoma i zależy od formatu dźwięku: dla sygnału 16-bitowego (płyta CD) najniższym poziomem sygnału jest -96 dBFS, a dla dźwięku DVD wynosi -144 dBFS. Człowiek przestaje słyszeć dźwięki mniej więcej od poziomu -60 dBFS w dół. Głośność dźwięku można wyrażać również w procentach. Wtedy najmniejszy poziom sygnału przybiera wartość 0%, a poziom 0 dBFS przybiera wartość 100%.

Nasuwa się pytanie: co z wartościami dodatnimi dla skali dBFS? Wartości dodatnie mogą wystąpić, ale są bardzo niepożądane. Gdy występują, sygnał przybiera wartości wykraczające poza format dźwięku (dla dźwięku 16-bitowego wykraczają poza granice przedziału od -32768 do +32768), a najwyższy poziom głośności sygnału przybiera wartości dodatnie w skali dBFS, np. +1.5 dBFS, lub wartości wyższe niż 100% w skali procentowej. Do takiego zjawiska nie można dopuścić, a nazywa się je przesterowaniem. Praktycznie przesterowanie objawia się zniekształceniem dźwięku, "krztuszeniem się" głośników (niektórzy nazywają to "pierdzeniem") i może doprowadzić do ich uszkodzenia.

W trakcie odsłuchiwania dźwięku przydatne informacje pokazywać będzie nam również miernik poziomu sygnału. W Cool Edit Pro umieszczony jest on poziomo, na samym dole okna. Aby zobaczyć jak on działa, musimy zacząć odtwarzać dźwięk. Zobaczymy wtedy dwa poruszające się słupki w kolorze zielonym przechodzącym w pomarańczowy, po jednym dla każdego z kanałów stereo. Miernik pokazuje w skali dBFS wartości poziomu sygnału - jego wskazania są ściśle powiązane z tym, co obrazuje widmo sygnału. Wartości szczytowe w danej chwili oznaczane są kreseczkami. Gdy dojdzie do przesterowania na którymś z kanałów lub gdy sygnał osiągnie wartość 0 dBFS, zapali się czerwone pole na prawo od wartości 0 dBFS na skali. Aby je wyczyścić, należy kliknąć czerwone pole. Miernik poziomu sygnału może działać zarówno podczas odtwarzania, jak i nagrywania. W obu przypadkach jego głównymi funkcjami jest wskazanie poziomu głośności oraz informowanie o wystąpieniu przesterowań.

Miernik poziomu sygnału


Teraz pora na praktyczne wykorzystanie zdobytej już wiedzy. Otwórzmy jakiś plik dźwiękowy trwający powyżej minuty i zacznijmy go odtwarzać w edytorze. Patrząc jednocześnie na widmo sygnału i śledząc przesuwającą się pionową linię, starajmy się połączyć to, co słychać w głośnikach z tym, co przedstawia widmo. Jako, że widmo przedstawia zmieniający się w czasie poziom natężenia głośności, uwaga w słuchaniu powinna zostać skupiona na wyławianiu cichych i głośniejszych partii utworu. Po kilku próbach z różnymi fragmentami dźwiękowymi powinniśmy nabrać wprawy we właściwym interpretowaniu widma sygnału.

 

Gdy już wiadomo jak należy rozumieć widmo sygnału dźwiękowego, pora przejść do kolejnego etapu pracy z edytorem audio. Partie sygnału dźwiękowego możemy, podobnie jak tekst, wycinać, kopiować i wklejać. Operacje te są bardzo proste do wykonania i wykonuje się je podobnie jak w przypadku tekstu.

Aby skopiować lub wyciąć jakiś fragment, musimy go przedtem zaznaczyć. Zaznaczanie odbywa się tak samo jak w edytorach tekstu - należy wcisnąć lewy klawisz myszy w momencie, gdy kursor jest nad widmem lewego lub prawego kanału, i przeciągnąć myszą trzymając wciśnięty klawisz. W żądanym momencie należy klawisz zwolnić. Zaznaczony fragment zostanie podświetlony. Aby dokładnie zaznaczyć pożądany fragment, można powiększyć obraz widma (przyciski z lupą).

Zaznaczony fragment sygnału


Istnieje możliwość zaznaczenia sygnału tylko z lewego lub tylko z prawego kanału. W Cool Edit Pro należy w tym celu dla lewego kanału umieścić kursor "na górze" górnego widma i zaznaczyć albo dla kanału prawego - "na dole" dolnego widma i zaznaczyć.

Teraz możemy zaznaczony fragment np. wyciąć lub skopiować i wkleić. Aby go wyciąć, należy wybrać z menu Edit polecenie Cut albo wcisnąć przycisk przedstawiający nożyczki. Zaznaczony fragment zostanie usunięty, a część sygnału znajdująca się za wycinanym fragmentem zostanie automatycznie przesunięta na jego miejsce. Jeżeli zdecydujemy się na skopiowanie fragmentu, powinniśmy z menu Edit wybrać polecenie Copy. Teraz, kiedy fragment został skopiowany do schowka, możemy go wkleić w inne miejsce tego samego pliku lub wkleić do innego pliku. Aby wkleić go w inne miejsce w tym samym pliku, ustawiamy w żądanym miejscu kursor (klikamy raz lewym klawiszem myszy w dowolne miejsce na widmie fali) i z menu Edit wybieramy pozycję Paste. Możemy też wstawić fragment do nowego pliku wybierając polecenie Paste to New. Jeżeli mamy otwartych kilka plików istnieje również możliwość kopiowania fragmentów między plikami (zmieniamy wtedy okno z menu Window). Jeżeli chcemy usunąć zaznaczony fragment, wciskamy klawisz Delete na klawiaturze.


Pora teraz na zapoznanie się z pierwszymi efektami oferowanymi przez edytor, przy pomocy których będziemy mogli modyfikować sygnał dźwiękowy. Przed stosowaniem na próbę omawianych efektów dobrze jest zaznaczyć kilkusekundowy fragment pliku i na nim dokonywać zmian. Nie ma sensu na razie poddawać obróbce cały plik, gdyż będzie to czasochłonne i nie pozwoli uchwycić różnicy między sygnałem oryginalnym a zmodyfikowanym.

Zaznaczmy dowolny fragment pliku i użyjmy polecenia Reverse z menu Effects w Cool Edit Pro. Zaznaczony fragment zostanie "odwrócony" w taki sposób, że uzyskamy efekt odtwarzania od tyłu. Jakie jest tego praktyczne zastosowanie? Wbrew pozorom całkiem spore. Jeżeli dysponujemy próbką talerza hit-hat (pojedyncze uderzenie) i ją w taki sposób odwrócimy, to otrzymamy próbkę, która w zapętleniu jest bardzo często używana w muzyce klubowej. Innym przykładem zastosowania tego efektu jest maskowanie inwektyw występujących w śpiewanym tekście poprzez "odwracanie" obraźliwych słów lub ich końcowych sylab.

Jeżeli wybierzemy polecenie Silence, zaznaczony fragment zostanie zamieniony w ciszę. Nie jest to to samo co wycinanie, gdyż w tym przypadku długość pliku się nie zmienia.

Zmiany poziomu głośności sygnału możemy dokonać poprzez wywołanie okna z menu Effects | Amplitude | Amplify... . Przy pomocy suwaka decydujemy o zmianie dotychczasowego poziomu głośności wyrażonej w decybelach (skala dBFS) lub procentach. Zmiany można wprowadzać niezależnie dla prawego i lewego kanału albo równolegle dla obu na raz (Lock Left/Right). Przy okazji możemy również poprawić zniekształcenie fali polegające na jej przesunięciu w górę lub w dół względem osi 0 dB (DC Bias Adjust). Jeżeli zwiększamy głośność, łatwo jest doprowadzić do niepożądanego efektu zwanego przesterowaniem. Aby jemu zapobiec i jednocześnie zwiększyć głośność do maksymalnego możliwego poziomu, w pole Peak level wpisujemy wartość 0 dB i wciskamy przycisk Calculate Now. Wzmocnienie zostanie automatycznie ustawione na maksymalną dopuszczalną wartość.

Okno Cool Edit Pro, w którym możemy zmieniać wzmocnienie dźwięku


W tym momencie pora na małe, ale przydatne objaśnienia. Warto je zapamiętać, gdyż będą one użyteczne we wszystkich oknach edytora Cool Edit Pro. Przyjrzyjmy się oknu Amplify na obrazku powyżej. Zawiera ono okienko z predefiniowanymi ustawieniami (Presets), dzięki którym wiele czynności można wykonać bez żmudnego ustawiania parametrów efektu. Wciśnięcie przycisku OK powoduje zamknięcie okna i wykonanie nałożenia efektu zgodnie z podanymi parametrami. Wybranie przycisku Close zapisuje wprowadzone w oknie efektu zmiany, ale nie powoduje modyfikacji pliku. Aby anulować wprowadzone w oknie zmiany i nie modyfikować pliku, należy wybrać przycisk Cancel. Zawsze możemy przesłuchać jak będzie brzmieć fragment po modyfikacjach, wciskając przycisk Preview. Aby szybko przełączać się między sygnałem oryginalnym i zmodyfikowanym w trakcie odtwarzania z użyciem przycisku Preview, należy zaznaczyć i odznaczyć pole Bypass.

To samo okno (Amplify) posłuży nam do nałożenia efektu płynnego zwiększenia (fade-in) lub zmniejszenia (fade-out) głośności. Efektów tych używa się najczęściej na początku lub na końcu próbki. Zamykamy okno i zaznaczamy ten fragment początku lub końca widma sygnału, który chcemy poddać takiej obróbce. Następnie ponownie wywołujemy okno Amplify, ale wybieramy w nim zakładkę Fade i ręcznie ustawiamy wartości początkowego i końcowego wzmocnienia albo korzystamy z wbudowanego ustawienia (Presets).

Początek próbki z efektem fade-in

 

 

Poznaliśmy już pierwsze efekty dotyczące zmiany wzmocnienia dźwięku, czyli po prostu głośności. Teraz omówię kolejne efekty, które mieszczą się w menu Effects | Amplitude w edytorze Cool Edit Pro.

Dosyć podobnym do opisanego wcześniej efektu Amplify jest powszechnie znana normalizacja (Effects | Amplitude | Normalize). Narzędzie to podnosi poziom najgłośniejszego sampla w sygnale do zadanej w procentach czy decybelach wartości. Oczywiście wraz z najgłośniejszym samplem, który jest tutaj tylko punktem odniesienia, podnoszona jest również głośność reszty sygnału z zachowaniem proporcji w samym sygnale. Gdy ustawimy poziom normalizacji na 100% lub 0 dB, dźwięk zostanie wzmocniony do najgłośniejszego poziomu bez przesterowania. Zaznaczenie pozycji Normalize L/R Equally spowoduje, że poszukiwanie najgłośniejszego sampla będzie się odbywało w obu kanałach stereo na raz, a nie osobno. Dzięki temu zostanie zachowana proporcja głośności między kanałami. Możemy również skorzystać z opcji korekcji fali sygnału przesuniętej względem osi 0 dB. Warto jest wykorzystywać normalizację na samym końcu łańcucha efektów, aby znormalizować zmodyfikowany sygnał do poziomu 100%.

Okno normalizacji sygnału


Narzędzie, które z kolei przypomina efekt fade-in/fade-out, możemy wywołać z menu Effects | Amplitude | Envelope. Służy ono do zmiany poziomu wzmocnienia sygnału w czasie, jednak jest bardziej elastyczne niż zwykły efekt fade-in/fade-out. Przy pomocy wykresu możemy nakreślić przebieg obwiedni sygnału określając jego zmieniające się w czasie wzmocnienie. Aby wyczyścić wykres, należy wcisnąć przycisk Flat. Zaznaczenie pola Spline curves spowoduje, że obwiednia będzie miała łagodniejszy przebieg.




Gdy wybierzemy z menu Effects | Amplitude polecenie Channel Mixer..., wywołamy efekt, za pomocą którego będziemy mogli wymieszać między sobą sygnał z obu kanałów stereo. Może to być przydatne np. przy wyrównywaniu różnic w sygnale obu kanałów wynikających z zapisu stereofonicznego czy przeniesieniu sygnału z prawego kanału na lewy i odwrotnie. W tym poleceniu znajdziemy również popularne ustawienie próbujące usunąć z nagrania ludzki głos (preset Vocal Cut).

Channel Mixer


Bardzo ważnym zagadnieniem w edycji dźwięku jest obróbka dynamiki sygnału. Dokonuje się jej przy pomocy kompresorów, limiterów, expanderów i bramek. Dotychczas mieliśmy możliwość zmiany wzmocnienia sygnału (głośności) w stosunku do np. określonego poziomu (0 dB lub 100% albo innej wartości). Proporcje w obrębie samego sygnału pozostawały takie same (np. stosunek najgłośniejszego sampla do pozostałych). Można tę sytuację przyrównać do możliwości zmiany wielkości obrazka o rozmiarach 300 x 200 pikseli do wielkości 600 x 400 - podczas zmiany zachowane zostały proporcje długości i szerokości obrazka. Jak jednak przeprowadzić taką modyfikację sygnału, aby zmienić proporcje fragmentów głośnych i cichych względem siebie? Czyli, odwołując się do przykładu z obrazkiem, jak zmienić wielkość naszego obrazka z wymiarów 300 x 200 pikseli na np. 600 x 600? Przeanalizujmy takie oto widmo sygnału.

Sygnał o sporej rozpiętości dynamiki


Jak na pierwszy rzut oka widać, sygnał charakteryzuje się znaczną różnicą między fragmentami głośnymi, a cichymi. Co więcej, znakomita większość sygnału jest stosunkowo cicha (poniżej -15 dB), a sygnał głośniejszy od -9 dB występuje jedynie w 2-3 miejscach. Taka sytuacja czasami jest naturalna i pożądana, ale w niektórych przypadkach trzeba jej zaradzić. Tak duża rozpiętość dynamiki sygnału powoduje, że ok. 90% dźwięku jest słabo słyszalna. Nie możemy sygnału tak poprostu wzmocnić, gdyż zaraz doprowadziłoby to do przesterowania tych 2 czy 3 głośniejszych fragmentów. W takim wypadku pomoże nam kompresor.

Wybierzmy narzędzie z menu Effects | Amplitude | Dynamics processing.... Na początek skorzystamy z wbudowanych ustawień: na przykład 3:1, -18, +3dB, Drums.

Wybieramy ustawienie kompresora


Pod okienkiem z "presetami" pojawi się opis działania wybranego ustawienia: wybrane przez nas kompresuje sygnał powyżej progu -18 dB w stosunku 3:1, natomiast sygnał poniżej -18 dB pozostawia nietknięty. Dzięki temu te dwa, wyraźnie głośniejsze miejsca na naszym widmie (u góry) zostaną niejako "przycięte". Zauważmy, że kompresor posiada tzw. próg (ang. threshold) który determinuje działanie kompresora. Gdy sygnał przekroczy określony próg, kompresor zaczyna działanie. W naszym przypadku sygnał jest kompresowany w stosunku 3:1. Teraz widmo sygnału wygląda tak.

Sygnał po zastosowaniu kompresora


Gdy sygnał znormalizujemy do poziomu 0 dB, to będzie on wyglądać w ten sposób. Widać wyraźnie, że widmo jest bardziej wyrównane; nie ma tak dużych różnic między nagłośniejszymi fragmentami i resztą sygnału.

Skompresowany sygnał po normalizacji


Kompresory wykorzystuje się w wielu sytuacjach: przy nagrywaniu głosu i instrumentów, w późniejszej obróbce poszczególnych śladów w nagraniu oraz całego nagrania. Jest to jedno z najczęściej wykorzystywanych narzędzi. W kolejnych zakładkach okna Dynamic Range Processing możemy doprecyzować ustawienia kompresora. W zakładce Traditional możemy ustawić kompresor wpisując ustawienia, a nie przy pomocy wykresu. Kolejna zakładka, Attack/Release, zawiera ważne ustawienia dotyczące "szybkości" działania kompresora. W części "Gain Processor" tej zakładki definiujemy wartości "Attack Time" oraz "Release Time". Określają one jak szybko po przekroczeniu zdefiniowanego progu kompresor ma zacząć działać oraz jak szybko ma się wyłączyć, gdy sygnał spadnie poniżej progu. Na przykład, gdy zdefiniujemy "Attack Time" na 30 ms, kompresor w ciągu 30 ms po przekroczeniu przez sygnał określonego wcześniej progu zacznie stopniowo działać. Podobnie będzie w przypadku "Release Time" - w ciągu zdefiniowanego czasu kompresor wyłączy się stopniowo, gdy sygnał spadnie poniżej progu. Odpowiednie ustawienie tych czasów zależy od wielu czynników i jest ważne, gdyż złe ustawienia mogą spowodować, że działanie kompresora będzie wyraźnie słyszalne.

 

Poznaliśmy już podstawowe narzędzie do obróbki dynamiki sygnału - kompresor. Po krótce przypomnijmy zasadę jego działania: definiujemy próg działania kompresora, stopień kompresji sygnału, czasy ataku (attack) i zwolnienia (release). Gdy sygnał przekroczy zadany próg, kompresor się włączy i skompresuje sygnał znajdujący się powyżej progu w stopniu, który wcześniej określiliśmy. Na przykład, jeżeli ustawimy próg działania kompresora na -9 dB, skompresowany zostanie sygnał znajdujący się w czerwonym polu na obrazku poniżej. Reszta sygnału nie zostanie zmodyfikowana.

Skompresowany zostanie sygnał znajdujący się w czerwonym polu


Szczególnym rodzajem kompresora są de-essery. Używa się ich przeważnie do przyciszania zgłosek syczących w wokalu ("ś", "ć", "sz", "cz"). Technicznie rzecz biorąc, de-esser jest kompresorem, którego działanie zostało ograniczone do specyficznego pasma sygnału, w którym najczęściej występują "syczące" składowe. Wybierzmy ustawienie np. De-Esser Medium i przejdźmy do zakładki Band Limiting. Widać tutaj, że kompresor będzie działał tylko w podanym paśmie sygnału (4000-12000 Hz). Tradycyjne kompresory operują na pełnym paśmie (w Cool Edit Pro 0-24000 Hz).

Narzędziem wywodzącym się z kompresora jest również limiter. Jest to kompresor z bardzo dużym stopniem kompresji (przyjmuje się zazwyczaj, że powyżej 50:1). Jego zadaniem jest maksymalizacja głośności sygnału bez doprowadzania do przesterowania. Dzięki bardzo dużemu współczynnikowi kompresji limiter potrafi praktycznie zawsze ograniczyć sygnał, który przy tradycyjnym wzmocnieniu byłby przesterowany. Wybierzmy ustawienie limit hard -6dB i w zakładce Traditional w polu Output Compensation (gain) wpiszmy wartość 10 dB. Po wciśnięciu OK sygnał zostanie poddany obróbce. Gdy następnie odtworzymy dźwięk, będzie on wyraźnie głośniejszy, chociaż nie będzie przesterowany. Limiterów używa się przeważnie w odniesieniu do gotowego już miksu, a nie do pojedynczych ścieżek. Ich zadaniem jest nadanie utworowi "soczystego", głośnego brzmienia poprzez zmniejszenie rozpiętości dynamicznej sygnału.

Kolejnymi narzędziami służącymi do obróbki dynamiki sygnału są bramki. Z kolei podtypem bramek są bramki szumów. Bramki służą do "wycinania" sygnałów, które nie przekroczyły pewnego progu. Na przykład, gdy ustalimy próg na -40dB, to bramka przepuści część sygnału powyżej tej wartości, natomiast część sygnału poniżej -40 dB zostanie wyciszona. Bramek można używać do usuwania szumów z sygnału szczególnie wtedy, kiedy szum jest na stałym poziomie, a sygnał, który chcemy pozostawić jest wyraźnie głośniejszy. Przy pomocy tej metody nie usuniemy szumu znajdującego się w tle sygnału, który chcemy pozostawić. Dla pewnych celów (bynajmniej nie redukcji szumów) bramek używa się również przy obróbce sygnału poszczególnych instrumentów, np. werbli, talerzy itd. W Cool Edit Pro mamy do wyboru dwie bramki szumów (Noise Gate) oraz kilka bramek dla instrumentów.


Następną grupą efektów, którą omówię, będą efekty opóźnienia sygnału (menu Effects | Delay Effects). Efekt Chorus powoduje, że dźwięk sprawia wrażenie jakby był emitowany przez kilka instrumentów lub kilku wokalistów, chociaż w rzeczywistości tak nie jest. Kolejne "głosy" nakładane na oryginalny sygnał są m.in. lekko opóźniane i modulowane, przez co osiąga się efekt większej ilości wokalistów niż ich faktycznie zostało nagranych. Opisywanie poszczególnych ustawień tego efektu nie ma sensu, bo w różnych edytorach jest ich różna ilość i mają często inne nazwy - warto jest się tutaj zdać na "presety". Wyjątek stanowić mogą tutaj ustawienia Wet Out i Dry Out. Jest to ustawienie określające stosunek sygnału zmodyfikowanego przez chorus (Wet) do sygnału oryginalnego (Dry) w sygnale wynikowym.

Efekt chorus


Efekt Delay do sygnału oryginalnego wprowadza jego kopię opóźnioną o określony czas względem oryginału oraz ewentualnie opóźnioną również między kanałami. Definiujemy tutaj opóźnienie sygnału w prawym i lewym kanale względem sygnału oryginalnego i jednocześnie możemy określić opóźnienie sygnału w obu kanałach względem siebie (ustawiając np. opóźnienie 30 ms na lewym i 50 ms na prawym kanale). Różnice opóźnienia między kanałami mniej więcej do 30 ms sprawią, że dźwięk stanie się bardziej przestrzenny. Większe opóźnienia spowodują, że ucho zacznie wychwytywać wyraźne opóźnienie między prawym i lewym kanałem. Możemy też określić w jakim stopniu sygnał opóźniony zostanie domiksowany do oryginalnego.

Efekt delay


Dosyć podobnym do opóźnienia efektem jest Echo. Jednak w przeciwieństwie do opóźnienia nie wprowadza pojedynczej, opóźnionej kopii oryginalnego sygnału, lecz kilka kopii opóźnionych, różniących się m.in. siłą wzmocnienia. Również i tutaj można definiować opóźnienie kolejnych kopii sygnału oryginalnego, stopień tłumienia kolejnych fal echa (o ile mają być przyciszone w stosunku do poprzedniej fali), a w Cool Edit Pro można także określić jakie częstotliwości mają występować w echu.

Efekt echo


Kolejnym efektem, podobnych do poprzednich dwu, jest Reverb. Efekt ten dodaje do dźwięku odpowiednie składowe, dzięki czemu brzmi on jakby źródło dźwięku (np. instrument czy wokalista) było zlokalizowane w konkretnym pomieszczeniu czy przestrzeni. Dzięki specyficznej kombinacji echa o zmiennym opóźnieniu i odbić Reverb symuluje przestrzeń o zróżnicowanej kubaturze: od łazienki (krótkie i metaliczne odbicia) do wielkiej sali koncertowej (długie echo, rozproszone odbicia). W Cool Edit Pro podobne funkcje spełnia jeszcze efekt Full Reverb - jest bardziej rozbudowaną wersją zwykłego Reverb.

 

Teraz przyszła kolej na zaznajomienie się z filtrami częstotliwości dostępnymi w edytorach audio. Zagadnienie to jest jednym z kluczowych podczas omawiania procesu obróbki dźwięku, dlatego należy poświęcić mu szczególną uwagę i "ćwiczenia praktyczne" poprzedzić odpowiednim wstępem teoretycznym.

Każdy dźwięk w naturze ma określoną częstotliwość. Wszystko co słyszymy składa się z dźwięków o wielu różnych częstotliwościach. Częstotliwości te wyrażane są w Herzach (Hz). Człowiek w zasadzie słyszy częstotliwości w przedziale od 20 do 20000 Hz. Niektórzy ludzie twierdzą, że słyszą częstotliwości wyższe niż 20000 Hz, ale jest to sprawa indywidualna i dyskusyjna i sprowadza się zapewne bardziej do "wyczuwania" tak wysokich dźwięków niż faktycznie ich fizycznej percepcji.

Podział pasma odbieranego przez ludzi można przedstawić następująco. Najniższe częstotliwości to tzw. basy. Ich pasmo kształtuje się w granicach 20-150 Hz. Gdy słyszymy dudnienie, rytm w utworach - to są właśnie te częstotliwości. Z racji tego, że fale dźwięków o tych częstotliwościach są najdłuższe (z fizyki pamiętam, że najniższe częstotliwości mają okres fali o długości ok. 20 metrów), dobrze przenikają przez przeszkody, np. ściany. Dlatego jak słyszymy, że sąsiad słucha muzyki, to słyszymy zazwyczaj samo rytmiczne dudnienie, a nie głos wokalisty, gdyż ten operuje na wyższych pasmach częstotliwości. Częstotliwości średnie (oczywiście w nich też wyróżnia się dół i górę tego pasma) mieszczą się w przedziale od mniej więcej 250 do 6000 Hz. To tutaj najwięcej swych częstotliwości ma większość instrumentów oraz głos ludzki. W przedziale 6000-20000 Hz dzieje się już niewiele, ale nie znaczy to, że jest ono mało istotne. Znajdziemy w nim głównie głoski syczące, talerze i szumy. Pasmo to odpowiada również za tzw. klarowność dźwięku.

Teraz będziemy już wiedzieć jak rozumieć trzeci z podstawowych parametrów dźwięku - jego pasmo częstotliwości. Zazwyczaj do opisu parametrów dźwięku używa się trzech kryteriów: ilości kanałów (mono, stereo, 5.1 itd.), rozdzielczości bitowej (8, 16, 24, 32-bit itd.; patrz fragment o analizie widma fali) oraz pasma częstotliwości. Prawdopodobnie najczęściej będziemy mieli do czynienia z dźwiękiem, którego pasmo będzie miało 44100 Hz (np. płyta CD). Musimy tę wartość podzielić przez dwa (dwa kanały stereo), aby otrzymać wartość szerokości pasma częstotliwości dla pojedynczego kanału (22050 Hz). Jak widzimy, szerokość ta w zupełności wystarczy by zawrzeć w niej wszystkie częstotliwości odbierane przez człowieka.

Dlaczego zagadnienie pasm częstotliwości jest takie ważne? Z wielu względów. Dzięki odpowiedniej korekcji możemy wydzielić dla każdego instrumentu pasmo, w którym dany instrument będzie dominującym. Jest to potrzebne dla przejrzystości całego miksu, gdyż zapobiegnie "zlewaniu" się np. perkusji, basu i jakichś efektów. Właściwie operując korekcją wytniemy tę część pasma jakiegoś instrumentu, które nie jest dla niego aż tak istotne, a powoduje złe współbrzmienie z resztą miksu. Ponadto, nagrane instrumenty oryginalnie nie zawsze brzmią tak jak byśmy chcieli - za sprawą korekcji możemy ukierunkować to brzmienie wedle naszych upodobań.

Na początku zapoznajmy się z korektorem graficznym. W Cool Edit Pro znajduje się on w menu Effects | Filters | Graphic Equalizer. W oknie korektora za pomocą suwaków możemy podbijać lub ucinać poszczególne częstotliwości. Korektor ten wyglądem przypomina nieco korektory stosowane w wieżach stereo. Korektor w Cool Edit Pro może być 10-, 20- lub 30-pasmowy. Ilość "presetów" jest imponująca. Warto jest użyć kilku z nich, np. podbijających lub ucinających bas czy tony wysokie (ang. treble), aby zobaczyć w praktyce jakie częstotliwości są zmieniane.

Dwie uwagi praktyczne. Stara zasada mówi, że lepiej jest ucinać częstotliwości niż je podbijać. W praktyce wygląda to tak, że gdy np. źle słychać gitarę na tle innych instrumentów w miksie, to lepiej jest obciąć pasmo "niegitarowe" czyli górę i bas, aniżeli podbijać pasmo gitary. Druga uwaga: zauważmy, że każda częstotliwość jest podbijana o pewną ilość decybeli. Gdy nie zachowamy umiaru, może dojść do przesterowania, nawet z powodu podbicia wąskiego pasma częstotliwości. Dlatego przy drastycznych korekcjach warto jest obniżyć poziom całego sygnału z poziomu korektora (pole Master Gain) lub poprzez uprzednią normalizację (np. do poziomu 70%).

Korektor graficzny


Korekcji pasm częstotliwości można także dokonać za pomocą filtra FFT (menu Effects | Filters | FFT Filter). Pasma częstotliwości podbijamy lub obcinamy odpowiednio kształtując linię w oknie filtra. Oś pozioma reprezentuje skalę częstotliwości, oś pionowa - wzmocnienie wyrażone w procentach (tryb Passive) lub decybelach (tryb Logarithmic). Ważną jest w tym filtrze wartość FFT Size. Wpływa ona na precyzję przebiegu operacji, a więc powinna być zawsze jak najwyższa. Zdefiniowane ustawienia zawierają ciekawe efekty, np. efekt dźwięku ze słuchawki telefonicznej. W tym miejscu warto wytłumaczyć działanie często spotykanych ustawień filtrów. Filtry typu Notch wycinają bardzo wąskie pasmo częstotliwości i są przydatne, gdy zależy nam na chirurgicznej ingerencji w jakąś częstotliwość. Filtry typu Low Pass (dolnoprzepustowe) wycinają pasmo powyżej określonej częstotliwości. Na przykład filtr Low Pass 11025 Hz pozostawia te poniżej 11025 Hz, a resztę wycina. Filtry typu High Pass (górnoprzepustowe) działają odwrotnie - przepuszczają jedynie częstotliwości powyżej zdefiniowane progu.

Okno filtra FFT

 

Ciekawym zagadnieniem dotyczącym korektorów pasm częstotliwości są korektory dynamiczne. Ich działanie polega na tym, że działanie korektora i modyfikowane pasma zmieniają się w czasie. Na przykład, na początku sygnał może mieć nałożony filtr dolnoprzepustowy, a na końcu może nie być żadnego filtra. Ustawienia filtra będą się cały czas zmieniać i w rezultacie otrzymamy płynne przejście od filtra dolnoprzepustowego na początku do przepuszczenia całego pasma na końcu utworu. W Cool Edit Pro powinniśmy wywołać okno z menu Effects | Filters | Dynamic EQ. Wybierzmy np. ustawienie LowMid-->Hi (slowsweep). Spowoduje ono takie ustawienie filtra jak opisałem przed chwilą. Zakładka Frequency pozwala sterować filtrem częstotliwości w czasie. Gdy wybierzemy filtr Low Pass przepuszczone zostanie pasmo poniżej linii na wykresie, przy filtrze High Pass przepuszczone zostanie pasmo powyżej linii. W zakładce Gain sterujemy wzmocnieniem w czasie. W zakładce Q (bandwidth) precyzujemy szerokość pozostawionego pasma (działa tylko w trybie Band Pass filtra).

Filtr dynamiczny



Jednym z podstawowych celów, do których wykorzystywane są komputerowe edytory audio, jest redukcja szumów i zniekształceń w materiale dźwiękowym. Najczęściej zostaje on uprzednio zgrany z nośników analogowych np. kasety magnetofonowej czy płyty winylowej. Przedstawię teraz zasady obsługi filtrów redukujących szumy i zniekształcenia dźwięku.

Jakie są typowe rodzaje szumów i zniekształceń dźwięku? Wyróżniamy szum charakterystyczny dla np. kasety magnetofonowej (ang. Hiss). Charakteryzuje się on m.in. mniej więcej stałym poziomem, podobnymi składowymi częstotliwościowymi i występuje w ciągu całego czasu trwania materiału. Clicks & Pops to niepożądane "cyknięcia" i "pyknięcia" wstępujące przeważnie w dźwięku zgrywanym z płyt winylowych.

Przystępując do redukcji szumów musimy sobie zdać z jednego sprawę: cudów nie będzie. Jeżeli dźwięk jest znacznie zaszumiony, to nagranie z kasety sprzed dwudziestu lat nie będzie po naszym zabiegu brzmieć tak klarownie jak z płyty CD. Jest to tylko redukcja szumów i zupełne ich wyeliminowanie może być niemożliwe. Jako, że drastyczna redukcja może doprowadzić do zniekształcenia oryginalnego dźwięku (możliwe są efekty np. "przytłumienia", "bulgotania" czy "mechanicznego" dźwięku), podczas tego procesu będziemy postawieni przed wyborem między pozostawieniem niewielkiego szumu czy prawie zupełnym jego usunięciem, ale za cenę nienaturalnego brzmienia dźwięku. Generalnie lepiej jest zawsze pozostawić trochę szumu, niż doprowadzić do nienaturalnego brzmienia.

Proces redukcji szumów możemy podzielić na dwa etapy: zbieranie charakterystyki szumu i redukcję szumów według tej charakterystyki. Aby pobrać charakterystykę szumu, musimy zaznaczyć ten fragment dźwięku, gdzie występuje sam szum np. przerwa między utworami, cisza na początku lub końcu utworu. Nie musi to być długi kawałek - wystarczy kilka sekund. Po zaznaczeniu tego miejsca, wywołujemy okna narzędzia do odszumiania - w Cool Edit Pro z menu Effects | Noise Reduction | Hiss Reduction. Następnie w tym oknie wciskamy przycisk Get Noise Floor. Edytor zrobi "zdjęcie" czystego szumu. Teraz będzie wiedział co traktować jako szum i co próbować usunąć z sygnału. Przed pobraniem charakterystyki szumu warto jest ustawić poziom "drag points" na ok. 25. Dzięki temu charakterystyka częstotliwościowa szumu będzie dokładniejsza.

Pobieramy charakterystykę szumu


Mamy już charakterystykę szumu, a więc możemy przystąpić do redukcji szumów w dźwięku. W tym celu zamykamy okno Hiss Reduction przy pomocy przycisku Close (ważne!). Następnie zaznaczamy ten fragment dźwięku, który chcemy poddać operacji redukcji szumów. Ponownie wywołujemy okno Hiss Reduction - powinno nas przywitać zapamiętanym wykresem charakterystyki szumu. Możemy, dostosowując poszczególne parametry dostępne dla tego narzędzia, sterować intensywnością redukcji szumów. Praktycznie wszystkie parametry wpływają z jednej strony na stopień redukcji szumów, a z drugiej - na deformację oryginalnego sygnału. Dlatego nie ma sensu opisywać tutaj proponowanych ustawień, gdyż zależą one od stopnia zaszumienia dźwięku i pożądanego rezultatu. Pomoc edytora zawiera opis wszystkich parametrów wraz z wyjaśnieniem na co wpływają. Na koniec mała uwaga praktyczna: lepsze efekty osiągnie się poprzez użycie małej redukcji szumów, ale powtórzonej wielokrotnie (pobranie charakterystyki, redukcja, pobranie charakterystyki, redukcja itd.), niż w przypadku pojedynczej, silnej redukcji.

Zasady postępowania z efektem do redukcji trzasków są nieco inne niż w przypadku narzędzia do redukcji szumów. Nie pobieramy tutaj żadnej charakterystyki. Narzędzie to "wygładza" nagłe skoki amplitudy w sygnale, które objawiają się jako trzaski. Co się tyczy redukcji trzasków, polecam używanie tego efektu chirurgicznie - jedynie w krótkich fragmentach, w których trzaski są słyszalne, a nie "hurtowo" na całe kilkuminutowe fragmenty dźwięku.

W Cool Edit Pro wybieramy narzędzie z menu Effects | Noise Reduction | Click/Pop Eliminator. Gdy mamy zaznaczony fragment z trzaskiem (możliwie jak najmniejszy fragment), wciskamy przycisk Auto Find All Levels. Filtr sam zdefiniuje parametry na podstawie danego fragmentu sygnału. Potem pozostaje nam tylko wcisnąć OK i sprawdzić rezultaty.

Efekt do redukcji trzasków


Cool Edit Pro, oprócz narzędzi do redukcji szumów i trzasków, zawiera również narzędzie do ratowania przesterowanego sygnału (Effects | Noise Reduction | Clip Restoration). Zaznaczamy całą porcję sygnału, który jest przesterowany (najczęściej całą zawartość pliku), wybieramy odpowiednie ustawienie, zależnie od stopnia przesterowania i wciskamy przycisk Gather Statistics Now. Narzędzie pobierze informacje o ilości procentowej przesterowanych sampli. Po wciśnięciu OK skutki przesterowania zostaną złagodzone.

Narzędzie do usuwania przesterowania z sygnału

Kolejną grupą efektów, którą omówię, będą te dotyczące zmiany tempa i wysokości dźwięku. Cool Edit Pro oferuje trzy takie narzędzia, które znajdują się w menu Effects | Time/Pitch.

Na początek przyjrzyjmy się efektowi Stretch. Przy jego pomocy możemy zmienić tempo dźwięku zachowując jego wysokość (tryb Time Stretch), zmienić wysokość zachowując tempo (tryb Pitch Stretch) oraz zmienić wysokość i szybkość jednocześnie (tryb Resample). Ustawmy od razu precyzję na High Precision i zaznaczmy pole Choose appropriate defaults - później ewentualnie będzie można zmienić te ustawienia. Gdy wybierzemy odpowiedni tryb działania dla tego efektu (zmiana tempa, wysokości czy jednego i drugiego), możemy suwakiem regulować stopień zmiany oryginalnego dźwięku. Wartość 100 w polu Ratio oznacza, że dźwięk nie będzie zmieniony. Wartości niższe będą obniżać tempo, podnosić wysokość lub "ściskać" sygnał (w trybie Resample). Wartości wyższe od 100 spowodują podwyższenie tempa, obniżenie wysokości lub "rozciągnięcie" sygnału. Wraz z manipulacją suwakiem w trybach Time Stretch oraz Resample zmieniać się będzie również czas trwania próbki (pole Lenght). Wpisując w to pole odpowiednią wartość możemy dostosować tempo próbki do czasu, przez który ma trwać. Możemy także zmienić tonację dźwięku korzystając z listy Transpose. Gdy przejdziemy do zakładki Gliding Stretch będziemy mogli określić początkowe i końcowe parametry tempa oraz wysokości dźwięku. Parametry efektu będą zmieniane liniowo w czasie, podobnie jak to miało miejsce w przypadku narzędzia Amplify.

Prawdopodobnie, ze względu na swą charakterystykę, narzędzie do zmiany tempa i wysokości dźwięku będzie używane najczęściej do modyfikacji głosu ludzkiego. Należy przy tym pamiętać, że zbyt radykalne zmniejszanie tempa może wprowadzić niepożądane zniekształcenia, np. dźwięk stanie się metaliczny lub wzbogacony echem. Jeżeli operujemy na wartościach tempa BPM (Beats Per Minute), to aby dostosować tempo do określonej wartości BPM, musimy rozwiązać proste równanie: x = (100 * y) / z , gdzie y - pożądane tempo, z - obecne tempo. Wynik zmiennej "x" wpisujemy w pole Ratio.

Narzędzie do zmiany tempa i wysokości dźwięku


Drugim narzędziem do zmiany wysokości i tempa dźwięku oferowanym przez Cool Edit Pro jest Pitch Bender. Efekt ten nieco przypomina ten omawiany poprzednio. Jednak w porównaniu z Time/Pitch cechuje go inna zasada działania. Pitch Bender jest pomyślany przede wszystkim jako narzędzie do płynnej zmiany wysokości i tempa dźwięku. Poprzez wykres możemy kształtować te zmiany w czasie. Oś pozioma na wykresie przedstawia czas, natomiast pionowa - wysokość dźwięku podaną w półtonach lub BPM (wybór skali następuje po zaznaczeniu odpowiedniego pola w pozycji Range). Dzięki dynamicznie zmieniającej się wysokości dźwięku można osiągnąć np. efekt zwalniającej płyty winylowej (preset Turntable Losing Power).

Efekt Pitch Bender


Cool Edit Pro zawiera również ciekawy efekt, który symuluje efekt Dopplera (Doppler Shifter). Efekt Dopplera to zjawisko, które występuje np. gdy stoimy przy ulicy i obok przejeżdża samochód, karetka na sygnale czy przelatuje nad nami samolot. Mamy wtedy wrażenie, że wraz ze zbliżaniem się źródła dźwięku (którym w tym przypadku jest silnik) oprócz głośności zmienia się również jego wysokość - od wysokiego, gdy samochód się zbliża, do niskiego, gdy się oddala. Narzędzie zawarte w Cool Edit Pro posiada sporo ustawień i chyba nie ma sensu budować własnych, wpisując samemu parametry efektu. W odróżnieniu od innych efektów opisywanego edytora, wykresu dla efektu Dopplera nie można zmieniać. Pokazuje on jedynie jak działanie efektu będzie wyglądać z obecnymi parametrami. Ze względu na swą charakterystykę, to narzędzie będzie dawać najlepsze efekty na sygnale nie zmieniającym swej wysokości ani głośności, np. stały dźwięk, akord lub pętla.

Narzędzie symulujące efekt Dopplera


Podczas całego procesu obróbki dźwięku i stosowania poszczególnych efektów zależy nam na tym, aby nie popsuć dźwięku. W muzyce jednak nie ma zasad i niekiedy takie zepsucie brzmienia może być potrzebne do uzyskania odpowiedniego efektu. W jaki sposób można stylowo zepsuć brzmienie? Na przykład wprowadzając do dźwięku efekt podobny do tego jaki występuje przy przesterowaniu. W Cool Edit Pro w menu Effects | Special | Distortion znajdziemy odpowiednie do tego celu narzędzie. Jego wykres przypomina ten, który występował w efektach do obróbki dynamiki (np. kompresor). Na osi poziomej prezentowany jest poziom sygnału wejściowego, na pionowej - poziom sygnału wyjściowego. Im większe odchylenia linii na wykresie od linii będącej przekątną tego kwadratu, którym jest wykres, tym intensywniejszy będzie efekt, a sygnał wyjściowy będzie miał wtedy wyższą lub niższą głośność. Jeżeli potrzebujemy jeszcze subtelniejszego dopasowania efektu do naszych potrzeb, możemy odznaczyć pole Symmetric i określić przy pomocy wykresów sposób działania efektu osobno dla dodatnich (zakładka Positive) i ujemnych (zakładka Negative) wartości sampli. Oczywiście nie trzeba samemu rysować wykresu - możemy wykorzystać jedno z kilkunastu dostępnych ustawień. Opisywany efekt można z powodzeniem wykorzystać w różnych gatunkach muzyki do symulowania np. przesterowanego wzmacniacza gitary.

Efekt wprowadzający do dźwięku efekt przesterowania

Zapewne najczęściej pracować będziemy na sygnale o parametrach 44100 Hz, 16-bit, stereo. Jest to obecnie chyba najczęściej spotykany format sygnału, odpowiadający np. dźwiękowi z płyt CD. Nic nie stoi jednak na przeszkodzie, by zmienić któryś z tych parametrów, np. w celu uzyskania zgodności z innymi standardami zapisu dźwięku. Do zmiany parametrów sygnału służy w Cool Edit Pro okno Convert Sample Type z menu Edit. Możemy w nim określić nowe pasmo częstotliwości: możemy je zawęzić lub rozszerzyć. W przypadku rozszerzenia pasma częstotliwości np. z 44100 Hz do 48000 Hz dźwięk nie zyska nowych składowych częstotliwościowych (mając pasmo rzędu 22050 Hz nie zyska składowych powyżej wartości 22050 Hz), ale gdy zechcemy nagrać coś do tego pliku, sygnał zostanie zapisany w paśmie 48000 Hz. Przy konwersji do pasma niższego niż oryginalne pasmo sygnału, warto jest wybrać jak najwyższy współczynnik jakości przeprowadzanej operacji (suwak poniżej) oraz zaznaczyć pole Pre/Post Filter. Dzięki temu operacja zawężania pasma będzie wykonana z najwyższą precyzją i uchroni dźwięk przed dodatkowym pogorszeniem jego jakości (już samo zawężenie pasma spowoduje spadek jakości dźwięku). Oczywiście należy pamiętać, że nie wszystkie karty dźwiękowe obsługują odtwarzanie i nagrywanie dźwięku w pasmach częstotliwości większych niż 44100 Hz.

Możemy w opisywanym oknie zmienić także ilość kanałów dźwięku np. konwertując sygnał stereo do mono (nowy kanał sygnału mono będzie składał się z sygnału obu kanałów stereo w określonych proporcjach) lub odwrotnie (oba kanały sygnału stereo będą zawierały ten sam sygnał mono). Zmiana rozdzielczości bitowej sygnału też nie jest trudna. Mamy do wyboru konwersję do sygnału 8-bit, 16-bit i 32-bit. Zwiększanie rozdzielczości sygnału do 32-bitów jest wskazane przed praktycznie wszystkimi operacjami dokonywanymi na sygnale, gdyż zwiększa precyzję przeprowadzanych obliczeń (sygnał w jednej chwili może przybrać zamiast jednej z 216, jedną z 232 wartości). Podczas konwersji do rozdzielczości niższej niż oryginalna rozdzielczość sygnału (np. z 16-bit do 8-bit) uaktywni się część okna Dither. Służy ona do określenia opcji ditheringu. Dithering, w przypadku konwersji rozdzielczości "w dół", dodaje do sygnału odrobinę szumu. Chociaż dodawany jest szum, jest on na bardzo niskim, praktycznie niesłyszalnym poziomie. Ogólny efekt jest zdecydowanie lepszy przy użyciu ditheringu, niż bez niego. Jako wartość p.d.f. warto ustawić np. pozycję Triangular, a rodzaj Noise Shaping powinno się dostosować do pasma częstotliwości sygnału (ustawienia Noise Shaping A do E2 są odpowiednie dla sygnału 44100 Hz lub 48000 Hz; kolejne ustawienia nadają się do sygnału odpowiednio 44100, 48000 i 96000 Hz).

Narzędzie do konwersji parametrów sygnału


Narzędziem dostarczającym sporo ważnych informacji jest statystyka sygnału (menu Analyze | Statistics). Okno podzielone jest na dwie zakładki: General z wartościami liczbowymi i Histogram z histogramem amplitudy sygnału. Dane tutaj prezentowane mogą dotyczyć całego sygnału w pliku lub jego fragmentu. W zakładce General widzimy dwie kolumny z liczbami. Każda pokazuje dane z prawego lub lewego kanału. Po wciśnięciu strzałki -> kursor w oknie edycji zostanie ustawiony obok miejsca, w którym występuje dana wartość. Pozycje Minimum i Maximum Sample Value podają najniższe i najwyższe wartości sampli występujące w sygnale. Peak Amplitude to szczytowa wartość sygnału (wartości powyżej 0 dB oznaczają przesterowanie). Pole Possibly Clipped Samples pokazuje w ilu miejscach sygnał osiąga szczytową wartość 0 dB. Nie musi to być równoznaczne z przesterowaniem. Gdy użyjemy limitera, prawdopodobnie otrzymamy sporo takich miejsc. Pola RMS Power pokazują minimalną, maksymalną i średnią wartość sygnału mierzoną w dB.

Zakładka Histogram pokazuje procentową "ilość" sygnału o danej amplitudzie w całym sygnale. Na osi poziomej znajdują się wartości w dB, a na pionowej - wartości procentowe. Dane zawarte w obu opisywanych zakładkach są pomocne przy doborze parametrów wzmocnienia lub kompresora.

Statystyka sygnału

Cool Edit Pro zawiera również narzędzie do analizy częstotliwościowej sygnału (menu Analyze | Show Frequency Analysis). Wykres pokazuje jak głośne są poszczególne częstotliwości w danym miejscu sygnału. Gdy zaznaczymy fragment sygnału i wciśniemy przycisk Scan pokazany zostanie wykres średnich wartości w danym fragmencie. Po wciśnięciu przycisku Advanced możemy ustawić wartość FFT (im wyższe wartości, tym dokładniejszy wykres). Gdy ustawimy wartość FFT na równą bądź niższą od 4096, to po wciśnięciu przycisku odtwarzania (bez zamykania okna analizy częstotliwości) wykres będzie dynamiczny. Przy pomocy analizy częstotliwościowej możemy np. zidentyfikować czy nagrana na płytę CD-R muzyka pochodzi z plików MP3 czy też nie. Większość kompresorów MP3 usuwa częstotliwości powyżej 16000 Hz - na wykresie będzie to wyraźnie widać.


Okno analizy częstotliwościowej sygnału


Na koniec drobna uwaga na temat zapisywania plików. Edytory audio pozwalają na zapisanie dźwięku do wielu formatów plików dźwiękowych, w tym do formatu MP3. Najczęściej jednak zapisywane przez edytory audio pliki MP3 są nienajlepszej jakości. Dlatego warto jest zapisać plik najpierw do formatu WAV, a potem dopiero skompresować go do formatu MP3 przy użyciu dobrego kodeka, np. LAME.

 

 

 

 

 

 Cyfrowa obróbka dźwięku.ppt