SoundSculpt
Генерирање на звучни ефекти со помош на ВИ модел
Опис на проектот
Целта на проектот е да се развие функционална апликација со текстуален интерфејс каде што корисникот ќе може да внесе текстуален промпт, а моделот ќе генерира релевантен звучен ефект. Апликацијата има и основни функции за пост-процесирање, како менување на pitch, reverb, и јачина на звукот, што ќе овозможи корисникот да го прилагоди звукот пред да го зачува.За развојот користев Python и библиотеки како PyTorch
, diffusers, scipy, soundfile и други, во главно за работа со аудио и модели. За корисничкиот интерфејс одбрав Gradio, бидејќи е модерен, лесен за употреба и порелевантен во индустријата отколку Tkinter(кој ми беше иницијална опција при истражувачката фаза за проектот).Одлучив да го користам моделот AudioLDM 2, кој е претходно обучен и достапен како open-source. Моделот е стабилен, се користи активно и е со соодветна лиценца за академска и лична употреба.
Тим(индивидуален)
Индекс | Име и Презиме |
---|---|
223165 | Михајло Милевски |
Фази
Фаза | Линк | Статус | Датум |
---|---|---|---|
Ф0 | Истражувачка фаза | Одобрена | 14.03.2025 |
Ф1 | Подготовка и конфигурација на модел | Одобрена | 21.08.2025 |
Ф2 | Имплементација на GUI и пост-процесирачки функционалности | Одобрена | 04.09.2025 |
Ф3 | Пост-процесирачки панел (контроли за оптимизирање/едитирање на добиен аудио фајл) | Во процес | TBA |
Ф4 | Deploy и презентација на проект | Во процес | TBA |
Attachments (1)
- logo.png (6.1 KB ) - added by 6 months ago.
Download all attachments as: .zip