— en venlig guide til Suno, Udio og ElevenLabs
I billed-AI handler det om at beskrive et billede. I musik handler det om at beskrive en stemning og en stil. Og i tale-AI handler det slet ikke om "prompts" – det handler om at skrive teksten på en måde, så stemmen lyder naturlig. Vejledningen her er delt i to: musik først, derefter tale.
I stedet for at beskrive et billede beskriver du nu en lyd. De fem byggesten er stort set de samme som med billeder – bare oversat til musikkens verden.
Hvilken slags musik? Folk, jazz, pop, klassisk, rock?
Glad, melankolsk, drømmende, energisk, højtidelig?
Klaver, akustisk guitar, fløjte, harmonika, trommer?
Langsomt, mid-tempo, hurtigt, dansabelt?
Mandlig, kvindelig, kor – eller helt instrumental?
Samme idé – skrevet på to måder. Læg mærke til, hvor meget mere Suno har at arbejde med i den nederste version.
Ingen genre, ingen instrumenter, intet om vokal eller tempo. Suno gætter sig frem og rammer sjældent dét, du forestillede dig.
Nu har Suno genre, stemning, instrumenter, tempo og vokal – og laver noget, der faktisk minder om dét, du har i hovedet.
Det smukke ved Suno og Udio er, at de kan skrive sangteksten for dig – men du kan også få ChatGPT til både at skrive en præcis prompt og en sangtekst på dansk, som du kopierer ind. Sådan får du det helt personlige.
Skriv en helt almindelig dansk besked om hvad sangen skal handle om:
Den første del af svaret kan du kopiere direkte ind i Suno's stil-felt:
Den danske tekst kopierer du ind i Suno's tekst-felt (vælg "Custom mode"):
Hvorfor virker dette så godt? Suno og Udio forstår engelsk bedst i stilbeskrivelsen – men de kan synge på dansk, hvis teksten er skrevet på dansk. ChatGPT kan begge dele på samme tid og giver dig et færdigt sæt, du bare skal kopiere ind.
Skriv "i stil med en dansk folkevise" frem for at nævne en konkret artist. Suno har regler imod at efterligne kendte navne – og det virker alligevel sjældent godt.
"Simple mode" lader Suno skrive både stil og tekst. "Custom mode" lader dig kopiere din egen tekst ind. Brug Custom, hvis det skal være personligt.
Skriv [Vers 1], [Omkvæd] og [Bro] i din egen tekst. Suno bruger det aktivt til at strukturere sangen.
Tilføj "instrumental, no vocals" i stilbeskrivelsen, hvis du fx skal bruge musik til en video.
Stilbeskrivelsen forstår Suno bedst på engelsk. Men sangteksten kan sagtens være på dansk – og bliver sunget på dansk.
Suno laver to forskellige sange ud fra samme prompt. Lyt til begge – ofte er den ene markant bedre end den anden.
Hold dig til 1-2 minutter. Suno er bedst til korte stykker, og dine credits rækker længere.
Når du finder en stilbeskrivelse, der virker, så gem den. Du kan bruge den igen til andre tekster.
Kopier en af disse stilbeskrivelser ind i Suno og se hvad der sker. Du kan lade Suno skrive teksten – eller skrive din egen.
Tekst: lad Suno skrive om foråret, fugle og blomstrende træer
Bruges som: hyggelig baggrundsmusik til familiemiddagen
Tekst: skriv selv om en kanin, en katteunge eller noget tredje
God til: en personlig sang om barndommen eller et minde
Tekst-til-tale fungerer anderledes end billed- og musik-AI. Her skriver du ikke en prompt – du skriver den faktiske tekst, som stemmen skal læse op. Til gengæld er der nogle små tricks til at få det til at lyde naturligt i stedet for "robotagtigt". De er nemme at lære.
Det første – og vigtigste – skridt er at vælge en stemme, der passer til din tekst. ElevenLabs har et stort bibliotek. Tænk over disse fem ting:
Mandlig eller kvindelig stemme?
Ung, voksen eller ældre lyd?
Varm, professionel, fortællende, energisk?
Roligt eller hurtigere taletempo?
Vælg model "Multilingual v2" eller "v3"
Det er her, alting bliver afgjort. ElevenLabs lytter til din tegnsætning for at vide, hvor den skal trække vejret, holde pause og lægge tryk. Her er fem tegn, du skal kende.
Bruges til at give en lille naturlig pause. "Hej, Mette" lyder bedre end "Hej Mette".
Markerer slut på en sætning og giver en tydelig pause. Korte sætninger lyder mere naturligt.
Bruges, når stemmen skal lyde eftertænksom. "Det var… ikke det jeg havde forventet."
Giver en tydelig markering midt i sætningen. "Han kom tilbage — efter mange år — og kiggede sig omkring."
Stemmen ændrer faktisk tonefald ved "!" og "?". Brug dem aktivt – men ikke for mange.
"Det er IKKE i orden" giver tryk på "ikke". Brug sparsomt – det virker bedst som krydderi.
Samme tekst – med og uden den lille tegnsætnings-magi. Læs dem højt for dig selv, og hør forskellen.
Ingen pauser, ingen rytme. Stemmen vil læse det op i ét langt åndedrag, og det lyder maskinelt.
Punktum giver pause efter velkomsten. Komma giver lille pause før "hvad vi laver". Tankestregen markerer en naturlig overgang. Lyder næsten som et menneske.
Du kan snyde dig til en perfekt formateret tekst. Bed ChatGPT om at omskrive din tekst, så den lyder naturlig som oplæsning.
Indsæt det, du vil have læst op, og bed om en omskrivning:
ChatGPT giver dig en version med kommaer, punktummer, tre-prikker og naturlige sætninger.
Vælg en stemme, indsæt teksten, og lyt. Hvis nogle ord udtales forkert, kan du ofte rette det ved at skrive ordet anderledes (fx "kommune" som "kom-mu-ne").
Lyt til 2-3 forskellige stemmer på samme tekst, før du bruger dine gratis credits på en lang tekst.
Klip lange sætninger op i to-tre kortere. Det lyder mere som naturlig tale.
"År 1986" læses bedre, hvis du skriver "år nitten-seks-og-firs". Forkortelser som "f.eks." kan også blive læst forkert – skriv "for eksempel".
Lavere stabilitet = mere udtryksfuld og levende. Højere = mere rolig og forudsigelig. Start omkring midten.
"Aabenraa" kan blive læst forkert. Prøv at skrive det "Åbenrå" eller "O-ben-rå" og se, om det hjælper.
Den gratis udgave af ElevenLabs må kun bruges privat. Vil du bruge stemmen i en YouTube-video, podcast eller produkt, kræves Starter-plan ($5/md).
Du må ikke kopiere andres stemmer uden tilladelse. Klon kun din egen stemme – og kun, hvis det er tydeligt for lytteren.
Hvis du har en hel artikel, så lav den i 3-4 stykker af gangen. Det giver bedre kontrol og mindre risiko for, at noget lyder skævt.
Kopier en af disse tekster ind i ElevenLabs og lyt. Prøv samme tekst med to forskellige stemmer – du vil høre, at det handler om mere end bare ordene.
Anbefalet stemme: en varm, voksen, kvindelig stemme
Tre-prikkerne giver pausen, der gør det eftertænksomt
Korte sætninger og pauser hjælper lytteren med at følge med
God til: prøv en dyb, fortællende mandlig stemme