
Deep Dive 191 – Text-to-Speech mit Thorsten Müller
programmier.bar – der Podcast für App- und Webentwicklung
00:00
Herausforderungen und Fortschritte in der Text-to-Speech-Technologie
In diesem Kapitel werden die Herausforderungen und Fortschritte der Text-to-Speech-Technologiethematisiert, einschließlich der Qualität synthetischer Stimmen und der Komplexität mehrsprachiger Modelle. Die Sprecher teilen ihre persönlichen Erfahrungen beim Training von Modellen wie Koki und Piper und diskutieren den Einsatz von Google Colab zur Verbesserung des Prozesses. Zusätzlich wird der Einsatz von SSML sowie kreative Projekte, wie ein YouTube-Kanal, der sich mit diesen Technologien beschäftigt, erörtert.
Transcript
Play full episode