Context Navigation

Changes between Version 1 and Version 2 of Фаза0

Timestamp:: 09/04/25 17:40:08 (32 hours ago)
Author:: 223165
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

Фаза0

-              v1
+              v2
 . **AudioLDM (и AudioLDM2)**
    - Diffusion-базиран модел (text-to-audio со промпт)
    - Поудобен за користење отколку WaveGAN (`HuggingFace` екосистем)
+   - Diffusion-базиран модел (text prompt-to-audio)
+   - Полесен за користење и посоодветен за мојата идеја отколку WaveGAN (`HuggingFace` екосистем)
    - Поддржува prompt-based контрола (супер за мојата идеја)
    - Недостаток: библиотеката не се ажурира >1 година, но стабилна е
+   - Недостаток: библиотеката не e ажурирана повеќе од година, но е стабилна
 . **Meta `AudioCraft` / `AudioGen`**
 …
 . **`ElevenLabs` Sound Effects API (приватно решение)**
    - Индустриско решение, разгледав концепт
+   - Индустриско решение, го разгледав како опција при истражување
    - Недостаток: комерцијално, не е во дух на академски проект
 …
 - Прво размислував за **Tkinter**
   - Недостатоци: застарен, ретко користен, естетски неубав
 - Се одлучив за **Gradio**
+  - Беше застарен, ретко користен, естетски не одговараше со моите идеи
+- Се одлучив за **Gradio** бидејќи има:
   - Лесна интеграција со ВИ модели
   - Релевантен и користен во ВИ проекти
 …
 . **Backend**: Python + `HuggingFace` Diffusers
 . **Локално извршување**: NVIDIA RTX 4060 + CUDA 12.7
 . **Deplyment/Presentation**: `HuggingFace` Spaces
+. **Deployment/Presentation**: `HuggingFace` Spaces
 Со ова ја завршив **Фаза 0 (Истражувачка фаза)**