| | 44 | - Го преземав претходно обучениот модел `cvssp/audioldm2` од HuggingFace. |
| | 45 | |
| | 46 | - Моделот го префрлив на GPU со `to("cuda")`. |
| | 47 | |
| | 48 | **Прв тест со тескстуален промпт** |
| | 49 | |
| | 50 | [[Image(2.2.png)]] |
| | 51 | |
| | 52 | - Ова ми беше првиот успешен обид после многу "troubleshooting" со верзиите и зависностите. |
| | 53 | |
| | 54 | == Проблеми и решенија == |
| | 55 | |
| | 56 | **Несовпаѓање на верзии:** |
| | 57 | |
| | 58 | - `huggingface_hub` беше нов и ја немаше функцијата `cached_download`, тоа го решив со фиксирање на постара верзија и подоцна со надградба на Diffusers. |
| | 59 | |
| | 60 | **Недостасувачки пакети:** |
| | 61 | |
| | 62 | - На пример, добивав грешка за `soxr` и `ClapFeatureExtractor`. Ги инсталирав рачно за да продолжи моделот(така правев за многу од пакетите и библиотеките, вклучувајќи и ресетирање на виртуелна околина неколку пати). |
| | 63 | |
| | 64 | **Не-препознавање на CUDA:** |
| | 65 | |
| | 66 | - На почеток не знаев дали мојата графичка карта го поддржува CUDA и дали веќе е инсталирана. Со nvidia-smi потврдив дека системот има CUDA runtime, и после многу debug принтови успеав да го решам тоа. |
| | 67 | |
| | 68 | == Резултати од `Фаза 1` == |
| | 69 | |
| | 70 | - Успешно конфигурирав работна средина со `PyCharm` и виртуелно окружување. |
| | 71 | |
| | 72 | - Успешно го интегрирав AudioLDM2 и генерирав прв аудио фајл од текстуален промпт. |
| | 73 | |
| | 74 | - Докажав дека моделот функционира локално на мојот лаптоп со GPU поддршка. |