Beiträge von anke79 im Thema „[KI] AI Musik Modelle“

    Ich suche einen Text2Speech Generator, der die deutsche Synchronstimme von Patrick Stewart immitieren kann.

    Die englische Stimme ist kein Problem, aber der deutsche Sprecher ist nunmal nicht prominent genug. Kann man eine KI mit Sprachbeispielen trainieren?


    Hintergrund: mein neuer Mähroboter erhält den Namen "Mowcutus von Borg". Da hätte ich gerne Sprachausgabe mit der deutsche Synchronstimme über mein Smart Home.

    Habe ich noch nicht selbst ausprobiert, aber bei Kits gibt es die Möglichkeit zumindest für Gesang, sollte aber auch für Sprache gehen, kostet aber. Bei Suno kannst Du extenden z.B., Sprachvorlage hochladen und dann den zusätzlichen Text eingeben. Kommt auch drauf an, wie viel Du gesprochen haben willst, zumindest Suno könntest Du kostenlos ausprobieren, ob die Ergebnisse gut genug sind, Deutsch geht zumindest.

    Leider sind meiner Ergebnisse in Suno nicht so gut.

    Was gefällt Dir bei Deinen Suno-Ergebnissen nicht? Zu künstlich, keine guten Melodien? Ich habe viel mit eigenen Demosong- bzw. Gesangs-Vorlagen/Uploads probiert mit Suno 3.5 und das dann covern lassen (geht leider nur mit Pro-Account). Da waren die Ergebnisse sehr gut und nah an meinen Vorlagen bzw. Prompts. Extenden war aber auch meistens ganz passabel, man braucht halt etwas Trial & Error.

    Ich finde auch interessant das sie jetzt quasi "Udio Rückwärts" gebracht haben - also das man 30 Sekunden aus fertigen Songs auswählen kann und sie neu generieren lassen kann. Das bringt natürlich schon mal deutlich mehr Einfluss für den Nutzer, allerdings weiß ich nicht wie gut es funktioniert. Muss mir demnächst wohl mal einen Monat Suno Premium gönnen um das und Remix auszuprobieren.

    Da gibt's leider die Einschränkung, dass der Song maximal 4 Minuten lang sein darf, sonst geht das bis zu 30 Sekunden remixen leider nicht. Und man sollte vorher einen ganzen Song generien, nicht einen 2./3. ... Teil nehmen, denn dann macht SUNO daraus einen neuen Track ohne den Anfang (kann man natürlich extern wieder zusammenfügen).

    Es ist v.a. nützlich, wenn man die Lyrics nachträglich ändern möchte, weil SUNO vielleicht was falsch gesungen hat oder man es sich anders überlegt hat. Aber auch dann erkennt er die Stellen nicht immer richtig. Ich denke, es ist eher für kleinere Änderungen sinnvoll, größere muss man sich eher übers Extenden erarbeiten.

    Ja, der Klang ist bei SUNO schon oft schlecht/grenzwertig. Ich gebe als Prompt meistens "Clean production" ein, aber weiß nicht, ob das wirklich was bringt. Da ich halt viel mit eigenen Vorlagen/Uploads arbeite, die auch weit weg von perfekter Produktion sind, "imitiert" er das teilweise auch, speziell beim extenden, bei den Covern weniger.

    Mit Udio habe ich nicht so viel gemacht, mangels Pro-Account konnte ich die Uploadfunktion dort nicht nutzen/testen. Für meine Pop/Rock-Songs fand ich den Gesang bei SUNO aber besser/menschlicher und überwiegend ziemlich gut, solange die Soundqualität einigermaßen akzeptabel war.

    Bei Udio kann man sich auch als Free User zusätzliche Credits generieren, indem man 10x2 Samples pro Tag bewertet (was gefällt besser) - war zumindest bis vor 2-3 Wochen noch so. Ich nutze momentan allerdings fast nur SUNO. V.a. die Coverfunktion und die funktioniert teilweise richtig klasse. Vorteil bei Udio ist, dass man auch als Free User das kommerzielle Nutzungsrecht an den Kreationen erhält, bei SUNO bspw. nur als Pro-User, und die Soundqualität ist bei Udio besser.

    Ich habe mit einem Kumpel vor einigen Jahren einige Sachen mit Gesang und Gitarrenbegleitung aufgenommen, dazu einige Demos nur mit Gesang. Daraus bis zu 120 Sekunden Vorlage schneiden (ist leider die Begrenzung) und das dann covern lassen, kompletten Text eingeben und die entsprechenden Prompts. Das klingt teilweise 1:1 wie die Vorlage mit anderem/besserem Gesang, zusätzlichen Elementen, z.B. Drumspur etc.

    Ja, das mit den Prompts ist teilweise Glückssache, aber man kann auch bei Suno konkrete Vorgaben machen allgemein zum Song bzw. konkret in den Lyrics. Das klappt mal besser, mal schlechter. Man muss schon einiges an Trial & Error machen, aber da wir ansonsten eben nur mäßigen Gesang hätten und Gitarren, ist es schon toll, nun nahezu beliebig weitere Instrumente einzubauen, verschiedene Genres zu probieren usw. und das alles in wenigen Sekunden.