SoundSculpt

Context Navigation

SoundSculpt

Генерирање на звучни ефекти со помош на ВИ модел

Опис на проектот

Целта на проектот е да се развие функционална апликација со текстуален интерфејс каде што корисникот ќе може да внесе текстуален промпт, а моделот ќе генерира релевантен звучен ефект. Апликацијата има и основни функции за пост-процесирање, како менување на pitch, reverb, и јачина на звукот, што ќе овозможи корисникот да го прилагоди звукот пред да го зачува.За развојот користев Python и библиотеки како PyTorch, diffusers, scipy, soundfile и други, во главно за работа со аудио и модели. За корисничкиот интерфејс одбрав Gradio, бидејќи е модерен, лесен за употреба и порелевантен во индустријата отколку Tkinter(кој ми беше иницијална опција при истражувачката фаза за проектот).Одлучив да го користам моделот AudioLDM 2, кој е претходно обучен и достапен како open-source. Моделот е стабилен, се користи активно и е со соодветна лиценца за академска и лична употреба.

Тим(индивидуален)

Индекс	Име и Презиме
223165	Михајло Милевски

Фази

Фаза	Линк	Статус	Датум
Ф0	Истражувачка фаза	Одобрена	14.03.2025
Ф1	Подготовка и конфигурација на модел	Одобрена	21.08.2025
Ф2	Имплементација на GUI и пост-процесирачки функционалности	Одобрена	04.09.2025
Ф3	Пост-процесирачки панел (контроли за оптимизирање/едитирање на добиен аудио фајл)	Одоборена	23.09.2025
Ф4	Deploy и презентација на проект	Одобрена	23.09.2025

Last modified 3 weeks ago Last modified on 09/28/25 23:05:18

Attachments (2)

logo.png (6.1 KB ) - added by trac 7 months ago.
Group 1.png (45.4 KB ) - added by 223165 4 weeks ago.

Download all attachments as: .zip

Note: See TracWiki for help on using the wiki.

Download in other formats:

Plain Text