Changes between Version 1 and Version 2 of Фаза0


Ignore:
Timestamp:
09/04/25 17:40:08 (32 hours ago)
Author:
223165
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Фаза0

    v1 v2  
    2222
    23231. **AudioLDM (и AudioLDM2)** 
    24    - Diffusion-базиран модел (text-to-audio со промпт
    25    - Поудобен за користење отколку WaveGAN (`HuggingFace` екосистем) 
     24   - Diffusion-базиран модел (text prompt-to-audio
     25   - Полесен за користење и посоодветен за мојата идеја отколку WaveGAN (`HuggingFace` екосистем) 
    2626   - Поддржува prompt-based контрола (супер за мојата идеја) 
    27    - Недостаток: библиотеката не се ажурира >1 година, но стабилна е 
     27   - Недостаток: библиотеката не e ажурирана повеќе од година, но е стабилна  
    2828
    29292. **Meta `AudioCraft` / `AudioGen`** 
     
    3333
    34343. **`ElevenLabs` Sound Effects API (приватно решение)** 
    35    - Индустриско решение, разгледав концепт 
     35   - Индустриско решение, го разгледав како опција при истражување 
    3636   - Недостаток: комерцијално, не е во дух на академски проект 
    3737
     
    4848
    4949- Прво размислував за **Tkinter** 
    50   - Недостатоци: застарен, ретко користен, естетски неубав 
    51 - Се одлучив за **Gradio**
     50  - Беше застарен, ретко користен, естетски не одговараше со моите идеи 
     51- Се одлучив за **Gradio** бидејќи има:
    5252  - Лесна интеграција со ВИ модели 
    5353  - Релевантен и користен во ВИ проекти 
     
    62623. **Backend**: Python + `HuggingFace` Diffusers 
    63634. **Локално извршување**: NVIDIA RTX 4060 + CUDA 12.7 
    64 5. **Deplyment/Presentation**: `HuggingFace` Spaces
     645. **Deployment/Presentation**: `HuggingFace` Spaces
    6565
    6666Со ова ја завршив **Фаза 0 (Истражувачка фаза)**