Müssen wir Radiomacher neu darüber nachdenken, wie wir Töne bearbeiten? Seit mit VoCo ein neues Tool zur Audio-Bearbeitung vorgestellt wurde, diskutieren Radiomacher. Auch bei fair radio.
Zum Hintergrund: Adobe hat jüngst ein neues Tool vorgestellt, mit dem sich Audiomaterial bearbeiten und verändern lässt. Es heißt VoCo. Das Programm braucht nach Angaben von Adobe 20 Minuten Stimmmaterial. Dann kann VoCo beliebige Texte mit dieser Stimme sprechen.
Auch im Radio könnte es künftig zum Einsatz kommen. Aber soll es auch?
Wir sind uns uneins.
Stephan Kleiber sagt: Entspannt Euch!
Sandra Müller sagt: Vorsicht!
Und was sagt Ihr dazu?
Hier geht es zur Umfrage von Sandra Müller bei radio-machen.
fair radio-Mann Stephan Kleiber meint:
Adobe tauscht in einer Sprachaufnahme ein paar Wörter aus und das Publikum applaudiert begeistert. Warum eigentlich? So überzeugend ist die Leistung von VoCo wahrlich nicht. Und selbst wenn sich das in Zukunft ändern könnte: Begreifen wir die neue Technologie doch vor allem als Chance.
Stellungnahmen von Konzernchefs, Nachrichten, ja ganze Sendungen soll VoCo also bald liefern. Ich frage mich: wie? Was Adobe auf der Kreativkonferenz gezeigt hat, klingt alles andere als täuschend echt. Wo das Tool etwas eingefügt hat, sind teils deutliche Übergänge zu hören, und bei den neu generierten Worten passt das Tempo nicht. Einfach nur ein bisschen auf der Tastatur herumtippen und fertig – daraus wird nichts. Alles bisher gezeigte legt nahe: VoCo kann vielleicht den Stimmklang einer Person imitieren, hat ansonsten aber dieselben Schwächen wie herkömmliche Systeme zur Spracherzeugung.
Von Navis und Assistenten in Handys wissen wir: Computerstimmen kriegen vieles nicht richtig auf die Reihe und sind weit davon entfernt, wirklich menschlich zu klingen. Schon subtile Veränderungen bei Betonung, Sprachmelodie und Lautstärke kann die Wirkung einer Aussage wesentlich beeinflussen. Emotionen sind das mächtigste Werkzeug des Moderators und die wichtigste Komponente eines guten O-Tons. Ein Politiker, der sich ungerecht behandelt fühlt, regt sich auf. Ein Geschäftsführer, der etwas richtigstellen will, tut das mit Nachdruck. Alles das soll VoCo demnächst perfekt nachbilden können? Obwohl das noch nicht mal im Labor mit den vollsynthetischen Stimmen gelingt?
Eher wahrscheinlich scheint mir, dass das Tool vor allem genutzt werden wird, um Audiomaterial zu reparieren. Schließlich möchte in Bildredaktionen auch niemand mehr auf Photoshop verzichten. Man kann damit Belichtungsfehler beheben, Farbstiche entfernen und so letztlich bessere Fotos in die Ausgabe bekommen. Oder solche, die man ohne Bearbeitung gar nicht erst hätte verwenden können. Wenn ich einen starken O-Ton verloren geben müsste, finde ich es deshalb okay, ihn mit VoCo zu retten. Falls das denn gelingt: Gute Korrekturen, egal in welchem Bereich, erfordern viel Zeit und Können. Gerade weil VoCo eben nicht sofort perfekte Ergebnisse liefert, wird sich der Einsatz zumindest in Redaktionen auf die Fälle beschränken, bei denen sich eine aufwendige Bearbeitung wirklich lohnt.
Natürlich birgt eine solche Software auch Missbrauchspotenzial. Irgendjemandem wird damit etwas in den Mund gelegt werden, das er so nie gesagt hat. Und viele werden es für bare Münze halten. In einer Umgebung, in der gefälschte Bilder und gefälschte Videos an der Tagesordnung sind, werden sich gefälschte O-Töne perfekt einfügen. Doch genau das zeigt, dass die Ursachen für das Phänomen ganz woanders liegen als bei der Technologie. Über ein so gravierendes gesellschaftliches Problem muss man unbedingt diskutieren. Nur sollte dabei eben nicht VoCo im Fokus stehen – sondern die Frage, wie sich verhindern lässt, dass so viele die sozialen Medien für glaubhafte Informationsquellen halten.
Journalismus könnte eine Antwort sein, und zwar ohne dass er dabei auf sinnvolle Bearbeitungstechniken verzichten muss. In Sachen Photoshop haben wir die Chance schon verpasst: Die Medien erklären mir nicht, wie und wofür sie das einsetzen. VoCo wäre die Gelegenheit, ein neues Werkzeug richtig einzuführen – nämlich transparent für den Hörer und einer offenen Diskussion darüber, wo man Grenzen setzt. Dabei darf es nach meinem Geschmack durchaus etwas weniger kulturpessimistisch zugehen. Und dazu gehört, neue Technologien (die so neu oft gar nicht sind) nicht immer nur danach zu beurteilen, was sie alles kaputtmachen können.
fair radio-Frau Sandra Müller meint:
Für mich ist klar: VoCo wird unsere Radio- und Audiowelt maßgeblich verändern. Und auf den Umgang mit VoCo sollten wir uns schon jetzt genau
vorbereiten. Denn was Adobe da präsentiert hat, ist ein Quantensprung in der Audiobearbeitung. Weil sich Audio damit nicht nur bearbeiten, sondern herstellen lässt. Nachahmen. Simulieren. Und zwar so echt, dass es klingt, als habe jemand bestimmte Dinge genau so gesagt.
Mit VoCo lassen sich also vermeintliche Original-Töne fabrizieren. Mit Aussagen nach Belieben. Klar: Mit Audioschnitt konnte man auch bislang viel basteln. Aber das war/ist aufwändig und nix für Laien. Genau das wird sich mit VoCo ändern.
Und ausnahmsweise bin ich in dieser Sache Pessimist. Ich glaube: Wenn dieses Tool erst auf dem Markt ist, werden bald gefakete Töne auftauchen. Töne, die eine Agenda haben. Töne, die die angeblichen Sprecher in Misskredit oder Hörer einfach in die Irre führen wollen. Diese Töne werden sich in den sozialen Netzwerken verbreiten. So wie heute schon gefakete Bilder.
Es wird eine Diskussion folgen darüber, wie man echte von falschen O-Tönen unterscheidet. Den meisten normalen Nutzern wird das aber nicht helfen. Stattdessen wird sich bei Ihnen eine generelle Unsicherheit festsetzen. Denn welchem Audio kann man trauen? Welchem nicht?
Und manche werden diese Unsicherheit aktiv schüren. Viel mehr Hörer/Nutzer als früher werden auch uns Radiomachern unterstellen: „Ist doch alles gefaked.“ Und wir werden beweisen müssen, das nicht! Aber wie?
Ich sehe da mit Schaudern eine Unmenge an MetaMetaMeta-Erklärarbeit auf uns zukommen.
Und die wird um so schwerer, weil ich vermute, dass professionelle Radiomacher solche Tools bald selber nutzen werden. Zum Beispiel um Geld zu sparen, auf einfache Art Stimmen zu variieren oder schnell an Töne zu kommen.
Szenario 1:
Bei „Radio NEU“ liest künftig eine VoCo-Stimme die Nachrichten. Eine Redakteurin tippt, was sie zu sagen hat. Eine Person reicht um mehrere
Nachrichtensendungen mit verschiedenen Stimmen on air zu bringen.
Szenario 2:
Ein Reporter bei „Radio NEU“ braucht dringend ein aktuelles Statement zum VW-Skandal. Der VW-Chef ist aber nicht zu erreichen. Die Pressestelle lässt ein Statement von dessen VoCo-Stimme sprechen. Der Sender spielt es, weil das doch besser klingt als nachgesprochen.
Irgendwie cool, praktisch, faszinierend, aber eben auch irritierend und mit „Geschmäckle“. Denn wird der Hörer dadurch nicht auch getäuscht?
Ich glaube schon und finde wichtig, sich schon jetzt Gedanken zu machen: Wie wollen wir mit diesem Tool und damit erstelltem Material umgehen? Wo wollen wir es einsetzen? Wo nicht?
Für mich ist klar: Nicht einfach so. Nicht ohne klare Grenzen. Nicht ohne die Hörer transparent über solche Methoden zu informieren. Wir müssen vielmehr frühzeitig klar machen, nach welchen Regeln wir Radiomacher Audios bearbeiten. Und wer dagegen verstößt, muss mit klaren Sanktionen rechnen.
Denn ob Gesagtes wirklich Gesprochenes ist oder nur Vertontes, macht für mich einen gewaltigen Unterschied. Und wir sollten nicht anfangen, den beliebig zu verwischen. Nur dann kann der Hörer in unsere professionellen Audios weiter Vertrauen haben.
Sandra hat auf Ihrem Blog eine Umfrage gestartet – hier geht es lang: Gibt es ethische Grenzen für den Einsatz von VoCo?