• Ich suche einen Text2Speech Generator, der die deutsche Synchronstimme von Patrick Stewart immitieren kann.

    Die englische Stimme ist kein Problem, aber der deutsche Sprecher ist nunmal nicht prominent genug. Kann man eine KI mit Sprachbeispielen trainieren?


    Hintergrund: mein neuer Mähroboter erhält den Namen "Mowcutus von Borg". Da hätte ich gerne Sprachausgabe mit der deutsche Synchronstimme über mein Smart Home.

  • Ich suche einen Text2Speech Generator, der die deutsche Synchronstimme von Patrick Stewart immitieren kann.

    Die englische Stimme ist kein Problem, aber der deutsche Sprecher ist nunmal nicht prominent genug. Kann man eine KI mit Sprachbeispielen trainieren?


    Hintergrund: mein neuer Mähroboter erhält den Namen "Mowcutus von Borg". Da hätte ich gerne Sprachausgabe mit der deutsche Synchronstimme über mein Smart Home.

    Habe ich noch nicht selbst ausprobiert, aber bei Kits gibt es die Möglichkeit zumindest für Gesang, sollte aber auch für Sprache gehen, kostet aber. Bei Suno kannst Du extenden z.B., Sprachvorlage hochladen und dann den zusätzlichen Text eingeben. Kommt auch drauf an, wie viel Du gesprochen haben willst, zumindest Suno könntest Du kostenlos ausprobieren, ob die Ergebnisse gut genug sind, Deutsch geht zumindest.

  • Bei ElevenLabs kannst du eigene Sprachmodelle trainieren. Dafür musst du eine bestimmte Zeit an gesprochenem Text als Audi Datei hochladen je nachdem wie gut der Clon weden soll.

    Du kannst dort auch sehr umfangreich mit der vorgegebenen Stimmen herum probieren, man kann Betonung, Varianz etc. einstellen und ElevenLabs sind was Text to Speech angeht absolute Spitze.

    ElevenLabs_Example.mp3


    Btw; Von meiner Erfahrung her sind Musik AIs nicht wirklich geeignet für längeren gesprochenen Text. Die haben dabei einfach nicht so die Betonung drauf und machen sehr komisch Pausen weil sie eher so auf die länge einer Song Zeile trainiert sind statt auf natürlich lange Sätze. Habs sowohl mit Suno als auch mit Udio schon mehrfach probiert für Intros oder auch nur kürzere Sample-artige Passagen im Endeffekt hab ich dann immer bei ElevenLabs gemacht und später in den Song eingefügt weils einfach soviel besser klang.

    Einmal editiert, zuletzt von IamSalvation (11. Juli 2025 um 12:22)