bevor ich weiter schreibe eine Klarstellung: wenn ich hier noch einmal
Vokabeln lese wie "sinnlos anlegst", dann bin ich hier weg; auf diesem
Niveau diskutiere ich nicht. Ich weiß, dass es der übliche Stil in
vielen NGs ist, sich auf diese Weise persönlich zu diffamieren, aber da
mach ich nicht mit.
Eine FFT mit nachfolgender inverser FFT bewirkt nichts anderes als eine
Reihe schmalbandiger Bandpassfilter in parallelen Kanälen.
> Es gibt ein Rauschfilter das folgendermaßen arbeitet:
>
> -Oversampling
> -FFT
> -Rauschflordiskriminator
> -inverse FFT
>
> Es wird in milit. RADAR-Anlagen eingesetzt :-)
da sind wir schon wieder beim Punkt, den ich meine: von diesem
"Rauschflordiskriminator" hast du bisher nichts gesagt. Der hat halt
auch überhaupt nicht mit einer Rauschverminderung eines Sprachsignals zu
tun.
Um einzelne Sinussignale oder Impulsfolgen (Radar) in einem verrauschten
Signal zu detektieren, ist eine Spektralanalyse (z.B. FFT) sinnvoll, um
dann die großen Spektralanteile (Nutzsignale) durchzulassen und die
kleinen (Rauschen) zu sperren. Danach kann man mit der inversen FFT den
Rest wieder zusammensetzen und hat die Rauschunterdrückung geschafft.
Und jetzt setzt du dich bitte mal mit einem Sprachsignal auseinander.
Das besteht aus einem ganzen Sack voller tonaler Komponenten (Sinus und
Oberschwingungen) und zusätzlich atonaler Komponenten (praktisch alle
Konsonanten, die für das Verstehen besonders wichtig sind). Letztere
erstrecken sich über das gesamte Frequenzband.
Und jetzt bist du wieder dran: wie kann dein "Rauschflordiskriminator"
die atonalen Komponenten des Sprachsignals vom Rauschen unterscheiden?
Wenn du dieses Geheimnis verrätst, hast du gewonnen.
Das ist schon wieder Quatsch was Du schreibst. denn FFT + invFFT = gar
nichts ... da kommt unverändert das Originalsignal heraus.
Diese Diskriminatoren schneiden kleine Spektrallinien im Spektrum (also
unten) einfach ab, setzen die Null.
Du musst dringend das Buch von Brigham lesen und noch ein wenig studieren.
mfG Leo
oha.
selbstverständlich. Habe ich das Gegenteil behauptet?
auch das hatte ich in dem Teil beschrieben, den du jetzt nicht zitiert hast.
Brigham kenne ich nicht, aber unzählige andere Literatur über FFT, und
ich arbeite seit Jahren damit. Und nein, das Studieren habe ich längst
hinter mir (obwohl man bekanntlich nie auslernt).
Nachdem du dich beharrlich weigerst, deine FFT/Diskriminator-Methode in
den Zusammenhang mit einem Sprachsignal zu stellen, ist das für mich das
Ende der Fahnenstange.
Und tchüss.
On Thu, 22 Mar 2012 19:08:48 +0100, Leo Baumann wrote:
Hast du schon mal wirklich selbst ein Sprachsignal verarbeitet, eine
Methode oder Hardware dafür entworfen, die dann auch in einem Produkt zum
Einsatz gekommen sind?
Ansonsten gebe ich Heinrich völlig recht.
Servus
Wolfgang
Ja Wolfgang, ich habe Signale der demodulierten ZF von Schiffs-RADAR-Anlagen
mit dieser Methode und zusätzlich mit einer CEPSTRUM-Analyse zur
Impulslängenbestimmung digital verarbeitet, aber dieses Wissen, das ich das
gemacht habe, hilft Euch nicht weiter. Auch war ich vor vielen Jahren an der
theoretischen Entwicklung der CEPSTRUM-Analyse beteiligt und habe
Brauchbarkeitsstudien dafür durchgeführt. Auch das hilft Euch hier nicht
weiter.
Meine Literaturangabe war gut gemeint. Es handelt sich um 2 Bücher in denen
die MODERNSTEN und AKTUELLSTEN Erkenntnisse der digitalen Signalverarbeitung
ausführlich behandelt werden, auch die der CEPSTRUM-Analysen.
Falls es Euch interessiert, hier dazu eine meine Arbeiten aus der digitalen
Signalverarbeitung, obwohl ich nicht so gerne auf die Kacke haue:
www.leobaumann.de/Cepstrum.pdf
mfG Leo
Außerdem, Wikipedia --> Überabtastung, da findest Du schon den
entscheidenden Hinweis:
Zitat:
Oversampling führt nicht zu höheren Datenraten und höherem
Speicherplatzverbrauch. Dieses Verfahren findet beim Auslesen und nicht beim
Schreiben von Daten Anwendung. Ein Nebeneffekt ist, dass durch Oversampling
der Störabstand, beispielsweise bei CD-Wiedergabe, verbessert wird. Die
Rauschleistung wird durch Überabtastung gleichmäßig auf ein größeres
Frequenzintervall verteilt.
Zitat Ende:
Das hat nichts mit Quantisierungsrauschen zu tun.
Du hast einfach keine Ahnung!
mfG Leo
Es gibt ein Rauschfilter das folgendermaßen arbeitet:
-Oversampling
-FFT
-Rauschflordiskriminator
-inverse FFT
Es wird in milit. RADAR-Anlagen eingesetzt :-)
mfG Leo
X-No-Archive: Yes
begin quoting, "Ralf . K u s m i e r z" schrieb:
Ich hab's inzwischen ganz brauchbar hingekriegt. Im wesentlichen habe
ich mit 3 kHz Eckfrequenz hochpaßgefiltert und dann mit dem Kompressor
von Audacity die Pegel vergleichmäßigt (und dieses blöde Programm
realisiert das einfach nur mies - unerklärlicherweise gibt es
zwischendrin leise Stellen, die eben nicht angeglichen werden; ein
Grund dafür ist nicht ersichtlich).
Die ganze Angelegenheit sollte sich (*nicht* mit Audacity*) ziemlich
leicht automatisieren lassen:
1. Sppracherkenung (also: Erkennung, *daß* gesprochen wird, keine
sematische Analyse)
Dazu braucht man eigentlich nur den Level ermitteln, also
gleichrichten und tiefpassen, dann müßte "Sprache" einen ziemlich
typischen rhythmischen Verlauf ergeben, den man als Spektrogramm des
Hüllkurvensignals identifizieren können sollte. (Der wird wohl von der
verwendeten Sprache abhängen - Deutsch und Englisch haben wohl
typischerweise andere Sprachrhythmen als das melodiöser "gesungene"
Französisch und Italienisch. Das läßt sich aber auch aus der
jeweiligen Aufnahme automatisiert "lernen" - notfalls muß der Anwender
dem Programm noch einen expliziten Hinweis "das hier ist jetzt
Sprache" geben.) Dann weiß daß Programm, daß gerade gesprochen wird.
Damit kann man dann die Sprache als solche von anderen Geräuschen
isolieren.
2. Spektralanalyse
Aus den in 1. identifizierten "Sprechimpulsen" kann man Spektren
machen, die eine halbwegs normale Verteilung haben sollten - wenn die
gefundene Verteilung "schief" bzw. verzerrt ist, kann man daraus dann
die Filterparameter berechnen, um den Frequenzgang zu entzerren. Damit
wird dann auch automatisch das Rauschen minimiert.
3. Pegelangleichung
Das ist dann der triviale Teil der Angelegenheit.
Ich denke, daß ich das ziemlich fix programmiert hätte - was
allerdings nicht sinnvoll sein dürfte, da die großen Akustikhersteller
das sicher schon längst getan und in die Geräte eingebaut haben. (Daß
man die Geräte kaufen kann, bedeutet ja nicht, daß man dann auch die
Algorithmen explizit zur Verfügung hätte.) Als erstes hätte ich mal
die Spracherkenner im Verdacht - wenn die eine semantische Analyse
machen wollen, müssen sie schließlich als erstes mal das Signal selbst
normalisieren und sauberputzen.
Geht nicht automatisch? Da lachen ja die Hühner!
*)
Ich habe jetzt die neue Audacity-Version 14 noch nicht installiert -
vielleicht wurden dort genau die Bugs behoben.
Gruß aus Bremen
Ralf
--
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphäre Autor bißchen Ellipse Emission
Polytechforum.com is a website by engineers for engineers. It is not affiliated with any of manufacturers or vendors discussed here.
All logos and trade names are the property of their respective owners.