== Генерирање на вокали

Првичната идеја за генерирање на пеење беше да користиме [https://github.com/NVIDIA/mellotron Mellotron], но поради тоа што беше потребно да се истренира моделот, е застарен и делумно не сакаше да функционира, ниту пак да се надгради на модерни верзии на Tensorflow, заедно со краткиот временски рок, одлучивме да користиме нешто поедноставно и побрзо.

Како алтернативи ги најдовме наредните апликации:
 - Uberduck - https://uberduck.ai
 - Kits.AI - https://app.kits.ai
 - Voicemod - https://www.voicemod.net/text-to-song
 - ControllaVoice - https://www.controlla.xyz/voice
 - Lyrebird - https://www.descript.com/lyrebird
но бидејќи дел од нив бараа да се плати за користење или имаа некаков систем на кредити за наједноставна синтетизација на глас, одлучивме да користиме Uberduck.

Uberduck е едноставна и лесна за користење алатка, која овозможува брзо генерирање на рапувачки глас.
[[Image(https://i.imgur.com/GmYTetx.png)]]

Оттука, избравме Acapella (no beat) и ја наместивме еднаш на 70 и еднаш на 140bpm за да истестираме на крај како ќе звучи ако изгенерираме поспоро пеење кое ќе го убрзаме на крај, за разлика од пеењето изгенерирано на темпото на песната.

[[Image(https://i.imgur.com/4hu9W3H.png)]]

Кога ќе го наместиме темпото на пеењето, одиме на пишување на лирика, каде што избираме Use custom lyrics. Бидејќи користивме бесплатна корисничка сметка, моравме да го поделиме текстот на по 4 линии и да отстраниме линија или две за да соодветствува на песната.

[[Image(https://i.imgur.com/8A5dLrZ.png)]]

При избирање на кој глас да го користиме, ги истестиравме Aiden Botha, Big G, B LA B, JSXI, RELIKK, T.A.G, Fat Tony, Damon Deepvoice, Frosty John, General Herring, Leroy, Movie Trailer Guy, Newsreader, Zeus, и ZWF.
[[Image(https://i.imgur.com/ov28cAn.png)]]
Најдобар од овие беше Zeus според наредните критериуми:
 - разбирливост
 - колку ги преклопува слоговите
 - колку соодветствува на рап песна
Пробавме да го изгенерираме текстот неколку пати за да видиме дали има варијација, но секој пат звучеше практично идентично за ист текст.

[[Image(https://i.imgur.com/jOacdum.png)]]

Кога ги изгенериравме сите делови од песната, ги симнавме, споивме во еден аудио фајл и ги едитиравме така што останаа само деловите со пеење, дека инаку има и гласовен watermark по пеењето.

[[Image(https://i.imgur.com/bdjQwgr.png)]]