Rewolucja w tworzeniu efektów dźwiękowych; generator AI zrobi to szybko i zadba o jakość

Dzięki nowemu modelowi AI firmy Stability AI, tworzenie muzyki oraz efektów dźwiękowych, stanie się znacznie prostsze. Narzędzie o nazwie Stable Audio, jest w stanie generować je na podstawie dostarczonego opisu.

tech
Marek Pluta14 września 2023
Źrodło fot. Źródło: Midjourney
i

Muzyka oraz efekty dźwiękowe to niezwykle ważny element filmu lub gry, który pomaga stworzyć odpowiedni klimat. Producenci dbają więc o to, aby były dopasowane do toczących się na ekranie wydarzeń, co nie jest łatwe. Firma Stability AI opracowała jednak nowy model SI o nazwie Stable Audio, który znacznie to ułatwi. Umożliwia generowanie muzyki oraz efektów dźwiękowych na podstawie tekstowego opisu.

AI tworzy efekty dźwiękowe

Stable Audio, opracowane wspólnie przez Stability AI oraz firmę Harmonai, może zrewolucjonizować proces tworzenia ścieżki dźwiękowej do filmów i seriali, nie tylko go przyspieszając, ale również obniżając koszty. Technologia nie tylko oferuje wysoką jakość dostarczanych dźwięków, znacznie lepszą w porównaniu do wcześniejszych generatorów audio wykorzystujących AI, ale też jest w stanie lepiej dopasować je do określonych potrzeb.

Na oficjalnej stronie firmy, możemy znaleźć próbki przygotowanej w ten sposób muzyki oraz efektów dźwiękowych. Wśród nich są m.in. odgłosy zatłoczonej restauracji, a także głos pilota mówiącego przez interkom, które brzmią bardzo realistycznie.

Producent twierdzi, że dzięki współpracy z firmą AudioSparx, w czasie szkolenia modelu, dostarczono mu ponad 800 tys. próbek audio zawierających muzykę, efekty dźwiękowe oraz ścieżki pojedynczych instrumentów, a także odpowiadające im metadane. Dzięki temu technologia doskonale wie, jak naśladować określone dźwięki, ponieważ zostały powiązane z ich opisami tekstowymi w sieci neuronowej.

Krótszy czas produkcji efektów

Sztuczna inteligencja potrafi nie tylko generować szeroką gamę dźwięków, ale też robi to bardzo szybko. Według producenta, renderowanie 95 sekund dźwięku stereo, przy częstotliwości próbkowania 44,1 kHz zapewniającej jakość CD, na procesorze Nvidia A100 zajmuje zaledwie jedną sekundę.

Producent twierdzi, że Stable Audio będzie dostępne dla użytkowników za darmo, z ograniczonymi funkcjami, a także w wersji Pro kosztującej 12 dolarów miesięcznie. Pierwszy wariant umożliwi wygenerowanie jedynie 20 ścieżek miesięcznie, każda o maksymalnej długości 20 sekund. Subskrypcja pozwala wygenerować do 500 utworów, trwających do 90 sekund.

Nowa technologia może więc znacznie skrócić czas potrzebny na przygotowanie efektów dźwiękowych do filmu lub audiobooka, w porównaniu z dotychczas stosowanymi rozwiązaniami. Nie oznacza to oczywiście, że muzycy, którzy zajmują się tworzeniem ścieżek dźwiękowych w dużych produkcjach, będą musieli poszukać nowego zajęcia, gdyż człowiek nadal wykona to lepiej. Z pewnością przyda się natomiast w mniejszych projektach z ograniczonym budżetem, których producentów nie stać na zatrudnienie muzyków. Nie tylko obniży koszty, ale także skróci czas potrzebny na ich realizację.

POWIĄZANE TEMATY: tech AI / sztuczna inteligencja

Marek Pluta

Marek Pluta

Od lat związany z serwisami internetowymi zajmującymi się tematyką gier oraz nowoczesnych technologii. Przez wiele lat współpracował m.in. z portalami Onet i Wirtualna Polska, a także innymi serwisami oraz czasopismami, gdzie zajmował się m.in. pisaniem newsów i recenzowaniem popularnych gier, jak również testowaniem najnowszych akcesoriów komputerowych. Wolne chwile lubi spędzać na rowerze, zaś podczas złej pogody rozrywkę zapewnia mu dobra książka z gatunku sci-fi. Do jego ulubionych gatunków należą strzelanki oraz produkcje MMO.

Gra na trzy generacje konsol. Historia rozwoju GTA 5

Gra na trzy generacje konsol. Historia rozwoju GTA 5

Intel w coraz większym kryzysie? Wyniki niemieckiego sklepu sugerują fatalną sprzedaż procesorów Arrow Lake

Intel w coraz większym kryzysie? Wyniki niemieckiego sklepu sugerują fatalną sprzedaż procesorów Arrow Lake

Długi gameplay z Cyberpunka 2077 na Nintendo Switch 2. Szykuje się dobry port?

Długi gameplay z Cyberpunka 2077 na Nintendo Switch 2. Szykuje się dobry port?

Lekki i niepozorny, ale w jego wnętrzu drzemie RTX 5070. Oto odświeżony ASUS ProArt P16

Lekki i niepozorny, ale w jego wnętrzu drzemie RTX 5070. Oto odświeżony ASUS ProArt P16

Kontrowersje wokół recenzji kart graficznych Nvidii. Youtuber zarzuca firmie próby wywierania presji

Kontrowersje wokół recenzji kart graficznych Nvidii. Youtuber zarzuca firmie próby wywierania presji