Changes between Version 5 and Version 6 of WikiStart


Ignore:
Timestamp:
09/04/25 18:53:01 (28 hours ago)
Author:
223165
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • WikiStart

    v5 v6  
    44== Опис на проектот ==
    55
    6 Целта на проектот е да се развие функционална апликација со текстуален интерфејс каде што корисникот ќе може да внесе текстуален промпт, а моделот ќе генерира релевантен звучен ефект. Апликацијата има и основни функции за пост-процесирање, како менување на pitch, reverb, и јачина на звукот, што ќе овозможи корисникот да го прилагоди звукот пред да го зачува.За развојот користев Python и библиотеки како PyTorch, diffusers, scipy, soundfile и други, во главно за работа со аудио и модели. За корисничкиот интерфејс одбрав Gradio, бидејќи е модерен, лесен за употреба и порелевантен во индустријата отколку Tkinter(кој ми беше иницијална опција при истражувачката фаза за проектот).Одлучив да го користам моделот AudioLDM 2, кој е претходно обучен и достапен како open-source. Моделот е стабилен, се користи активно и е со соодветна лиценца за академска и лична употреба.
     6Целта на проектот е да се развие функционална апликација со текстуален интерфејс каде што корисникот ќе може да внесе текстуален промпт, а моделот ќе генерира релевантен звучен ефект. Апликацијата има и основни функции за пост-процесирање, како менување на pitch, reverb, и јачина на звукот, што ќе овозможи корисникот да го прилагоди звукот пред да го зачува.За развојот користев Python и библиотеки како `PyTorch`, diffusers, scipy, soundfile и други, во главно за работа со аудио и модели. За корисничкиот интерфејс одбрав Gradio, бидејќи е модерен, лесен за употреба и порелевантен во индустријата отколку Tkinter(кој ми беше иницијална опција при истражувачката фаза за проектот).Одлучив да го користам моделот AudioLDM 2, кој е претходно обучен и достапен како open-source. Моделот е стабилен, се користи активно и е со соодветна лиценца за академска и лична употреба.
    77
    88== Тим(индивидуален) ==