== Генерирање на вокали Првичната идеја за генерирање на пеење беше да користиме [https://github.com/NVIDIA/mellotron Mellotron], но поради тоа што беше потребно да се истренира моделот, е застарен и делумно не сакаше да функционира, ниту пак да се надгради на модерни верзии на Tensorflow, заедно со краткиот временски рок, одлучивме да користиме нешто поедноставно и побрзо. Како алтернативи ги најдовме наредните апликации: - Uberduck - https://uberduck.ai - Kits.AI - https://app.kits.ai - Voicemod - https://www.voicemod.net/text-to-song - ControllaVoice - https://www.controlla.xyz/voice - Lyrebird - https://www.descript.com/lyrebird но бидејќи дел од нив бараа да се плати за користење или имаа некаков систем на кредити за наједноставна синтетизација на глас, одлучивме да користиме Uberduck. Uberduck е едноставна и лесна за користење алатка, која овозможува брзо генерирање на рапувачки глас. [[Image(https://i.imgur.com/GmYTetx.png)]] Оттука, избравме Acapella (no beat) и ја наместивме еднаш на 70 и еднаш на 140bpm за да истестираме на крај како ќе звучи ако изгенерираме поспоро пеење кое ќе го убрзаме на крај, за разлика од пеењето изгенерирано на темпото на песната. [[Image(https://i.imgur.com/4hu9W3H.png)]] Кога ќе го наместиме темпото на пеењето, одиме на пишување на лирика, каде што избираме Use custom lyrics. Бидејќи користивме бесплатна корисничка сметка, моравме да го поделиме текстот на по 4 линии и да отстраниме линија или две за да соодветствува на песната. [[Image(https://i.imgur.com/8A5dLrZ.png)]] При избирање на кој глас да го користиме, ги истестиравме Aiden Botha, Big G, B LA B, JSXI, RELIKK, T.A.G, Fat Tony, Damon Deepvoice, Frosty John, General Herring, Leroy, Movie Trailer Guy, Newsreader, Zeus, и ZWF. [[Image(https://i.imgur.com/ov28cAn.png)]] Најдобар од овие беше Zeus според наредните критериуми: - разбирливост - колку ги преклопува слоговите - колку соодветствува на рап песна Пробавме да го изгенерираме текстот неколку пати за да видиме дали има варијација, но секој пат звучеше практично идентично за ист текст. [[Image(https://i.imgur.com/jOacdum.png)]] Кога ги изгенериравме сите делови од песната, ги симнавме, споивме во еден аудио фајл и ги едитиравме така што останаа само деловите со пеење, дека инаку има и гласовен watermark по пеењето. [[Image(https://i.imgur.com/bdjQwgr.png)]]