OpenAI Voice Engine: Sprach-KI kann menschliche Stimmen noch perfekter klonen

Nicht nur KI-ChatBots, auch KI-Sprach- und Videogeneratoren entwickeln sich in rasender Geschwindigkeit weiter (siehe Video unter dem Beitrag). Ende März 2024 hat OpenAI sein Sprach-KI-Modell Voice Engine offiziell vorgestellt. Das Tool braucht nur 15-Sekunden-Audioaufnahmen, um eine menschliche Stimme zu klonen. OpenAI will das KI-Modul zunächst nicht öffentlich zugänglich machen, da es leicht verwandt werden kann, um auf politische Entscheidungsprozesse Einfluss zu nehmen.

KI-generiertes Bild – Bild von Temel auf Pixabay

Was ist, wenn Wähler/Innen im Internet gefälschte Statements von Politikern hören oder sehen und dadurch bei ihrer Stimmabgabe manipuliert werden? Was ist, wenn im Rahmen von Propaganda vermeintliche Regierungs-Aufrufe an das Volk verbreitet werden, die zu einer Massenhysterie führen? OpenAI ist nicht allein mit seinem KI-Tool Voice Engine. Viele KI-Unternehmen bieten Bild-, Audio- und Videogeneratoren an. Ist es überhaupt noch möglich, empfundene Wahrheit vor Manipulationen zu schützen?

OpenAI empfiehlt, dass sprachbasierte Sicherheitsverfahren nicht mehr verwendet werden, da man Sprache nicht mehr trauen kann (Siehe t3n vom 31.03.24). Wasserzeichen und Kennzeichnung von Anwendern der Technologie können nicht verhindern, dass Menschen im Moment des auditiven Deep Fakes getäuscht werden. So wurden im Januar 2024 telefonische Calls mit der Stimme von Joe Biden eingesetzt, um Demokraten in New Hampshire aufzufordern, nicht an den Vorwahlen teilzunehmen.

Es ist, wie es ist. Uns Menschen bleibt wohl vorerst noch der Weg, vertrauenswürdige Quellen im Internet zu identifizieren und andere Quellen zu ignorieren. Doch auch dieser Schutz durch Medienkompetenz wird immer schwieriger, da durchaus auch seriöse Quellen gefaked werden können. Zu befürchten ist, dass sich die Menschen immer mehr in ihre Privatheit zurückziehen und verstummen – nicht nur politisch. „Traue niemandem“ kann zu einer weiteren Stufe von Einsamkeit und Angst führen und seelische Erkrankungen begünstigen.

Hier als Beispiel ein Konkurrent von OpenAI bei den KI-gestützten Audiogeneratoren.
Stimmen klonen mit KI von ElevenLabs – 3,5 Minuten Video von heise-online – 27.02.24