Zurück zur Startseite
 Startseite   Kontakt   Impressum   English  Zitat von Friedrich Jürgenson

Überlegungen zur Sprachsynthese-Methode

von Tom Butler (AA-EVP)

Das Computerprogram EVPmaker für Windows-PCs lädt eine durch den Benutzer vorgegebene Audiodatei mit aufgenommener Sprache in den Arbeitsspeicher und setzt durch einen Zufallsprozeß Segmente daraus zu einer neuen Datei zusammen. Wie lang diese Segmente sind und wie schnell diese in die Ausgabedatei geschrieben werden, hängt von den Einstellungen ab, die der Benutzer festlegt. Das Ergebnis ist eine zerhackte Folge von Sprachfragmenten, so als ob der Computer ein ernsthaftes Stottern entwickelt hätte. In diesem Ausgangssignal sind anomal erscheinende Worte zu hören, die dem Enfluß von kommunizierenden Wesenheiten auf den Zufallsprozeß zugeschrieben werden, der fortlaufend Fragmente aus der Eingabedatei auswählt.

Bisher haben wir Neulingen der Tonbandstimmenforschung von der Benutzung dieser Methode abgeraten, weil hierbei aufgenommene menschliche Sprache als Rohmaterial verwendet wird, was ein erhebliches Potential für Fehlinterpretationen birgt, indem normale Sprachfragmente für paranormale Stimmen gehalten werden.

Kürzlich stellte Stefan eine Allophon-Datei zur Verfügung, und Margaret Downey hat jetzt eine Phonemdatei, die beide anstelle von Sprachaufnahmen als Eingabedatei für EVPmaker verwendet werden können.

Ein Phonem ist das kleinste, unterscheidbare Segment von Sprache, wie z.B. "p" oder "i". Allophone sind Phonemvarianten und beziehen sich auf den unterschiedlichen Klang ein und desselben Phonems; beispielsweise klingt das "ch" in "ich" anders als in "ach".

Wir sind wirklich begeistert von der Verwendung von Allophonen oder Phonemen als Eingabe für EVPmaker, denn entweder ist das Ergebnis ein zufälliges, aber normalerweise sinnloses Wort, oder es handelt sich um Kommunikation. Beispielsweise könnte ich fragen: "Wer ist heute bei mir?" Wenn ich in der zerhackten Ausgabe von Sprachfragmenten "Frank" höre, kann ich berechtigterweise annehmen, daß es sich um eine Antwort handelt. Wenn ich dagegen "Haus" hören, dann höre ich wahrscheinlich ein zufällig gebildetes Wort, das ignoriert werden sollte.

Es ist wichtig, sich daran zu erinnern, daß diese Worte nicht wirklich gesprochen werden. Es handelt sich um simulierte Worte. Dies trifft auch auf die herkömmlichen Tonbandstimmen zu, die durch Umformungen von Hintergrundgeräuschen in Sprache entstehen, jedoch haben wir hierbei noch weitere Informationen wie Sprachmelodie und Geschlecht, die uns zusätzlich helfen können, den Inhalt des Gesprochenen zu verstehen.

Die Quintessenz bei synthetisierter Sprache ist, nach simulierten Wortern Ausschau zu halten. Das Wort "Tom" könnte z.B. als "om" oder "dom" gesprochen werden. Zwar müssen wir weiterhin darauf achtgeben, nicht Bedeutungen in Laute hineinzulegen, die nicht beabsichtigt sind, doch zumindest ist die Wahrscheinlichkeit, daß es sich bei deutlichen und pasenden Lauten um echte Mitteilungen handelt, viel größer.

Es gibt Dinge bei der Anwendung dieser Methode, die noch weiter ausgetüftelt werden müssen. Margaret Downey schaltet die EVPmaker-Ausgabe manchmal ab, während sie spricht, damit ihre Fragen nicht durch den zerhackten Klang unverständlich werden, oder sie verstärkt die Teile der Ausgabedatei, die Antworten enthält. Auch die richtige Kombination von Samplerate und Länge zu finden könnte noch ein Thema sein.

Sprachsynthese scheint eine effektive Methode für das Erhalten von Informationen und für die Forschung zu sein. Ein weiterer wichtiger Aspekt ist, daß die etablierte Wissenschaft keine Einspielmethode akzeptieren wird, bei der Aufnahmen menschlicher Sprache als Rohmaterial benutzt werden. Die Einspielmethode der durch Zufallsprozesse gesteuerten Sprachsynthese funktioniert und könnte die Grenzen unserer bisherigen Möglichkeiten erweitern.


(Quelle: AA-EVP NewsJournal Vol 28, No 1, Spring 2009)


(Erschienen in der VTF-Post P 135, Ausgabe 2/2009)