| 44 | - Го преземав претходно обучениот модел `cvssp/audioldm2` од HuggingFace. |
| 45 | |
| 46 | - Моделот го префрлив на GPU со `to("cuda")`. |
| 47 | |
| 48 | **Прв тест со тескстуален промпт** |
| 49 | |
| 50 | [[Image(2.2.png)]] |
| 51 | |
| 52 | - Ова ми беше првиот успешен обид после многу "troubleshooting" со верзиите и зависностите. |
| 53 | |
| 54 | == Проблеми и решенија == |
| 55 | |
| 56 | **Несовпаѓање на верзии:** |
| 57 | |
| 58 | - `huggingface_hub` беше нов и ја немаше функцијата `cached_download`, тоа го решив со фиксирање на постара верзија и подоцна со надградба на Diffusers. |
| 59 | |
| 60 | **Недостасувачки пакети:** |
| 61 | |
| 62 | - На пример, добивав грешка за `soxr` и `ClapFeatureExtractor`. Ги инсталирав рачно за да продолжи моделот(така правев за многу од пакетите и библиотеките, вклучувајќи и ресетирање на виртуелна околина неколку пати). |
| 63 | |
| 64 | **Не-препознавање на CUDA:** |
| 65 | |
| 66 | - На почеток не знаев дали мојата графичка карта го поддржува CUDA и дали веќе е инсталирана. Со nvidia-smi потврдив дека системот има CUDA runtime, и после многу debug принтови успеав да го решам тоа. |
| 67 | |
| 68 | == Резултати од `Фаза 1` == |
| 69 | |
| 70 | - Успешно конфигурирав работна средина со `PyCharm` и виртуелно окружување. |
| 71 | |
| 72 | - Успешно го интегрирав AudioLDM2 и генерирав прв аудио фајл од текстуален промпт. |
| 73 | |
| 74 | - Докажав дека моделот функционира локално на мојот лаптоп со GPU поддршка. |