Advances in blind multichannel Wiener filtering of noisy speech

  • In the context of multichannel speech enhancement, the main contribution of this work is a novel two stage estimation technique for the spectral enhancement component of the multichannel Wiener filter, the so-called postfilter. In a first step, a simple statistical model of the microphone signals is presented and maximum-likelihood (ML) estimators for the speech and noise power spectral densities are derived to form an ML-based postfilter. In the second step, the ML-based postfilter itself is considered as a statistical quantity. Modeling its distribution in the form of a postfilter likelihood and proposing an a priori model of an ideal Wiener postfilter allows a Bayesian correction of the estimated postfilter values. This Bayesian refinement is implemented as an extension to the ML-based postfilter in the form of a lightweight pre-calculated look-up table.
  • Im Umfeld der mehrkanaligen Sprachsignalverbesserung bildet den Kern der vorliegenden Arbeit ein neuartiges, zweistufiges Schätzverfahren für die Spektralverbesserung im mehrkanaligen Wiener-Filter, das sogenannte Postfilter. Im ersten Schritt wird ein einfaches statistisches Modell der Mikrofonsignale vorgestellt und maximum-likelihood (ML) optimale Schätzer für die Sprach- und Störsignalleistungsdichtespektren werden hergeleitet. Aus diesen ML-optimalen Schätzungen wird anschließend ein ML-basiertes Postfilter gebildet. Im zweiten Schritt wird das ML-basierte Postfilter selbst als statistische Größe aufgefasst. Die Modellierung seiner Verteilung in Form einer Postfilter-Likelihood und das Einführen einer A-priori-Verteilung des idealen Wiener-Postfilters ermöglichen eine Bayes’sche Korrektur der geschätzten Postfilter-Werte. Diese Bayes-Verfeinerung wird als Erweiterung des ML-basierten Postfilters in Form einer vorberechneten Nachschlagetabelle umgesetzt.

Download full text files

Export metadata

Statistics

Number of document requests

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Philipp ThüneORCiDGND
URN:urn:nbn:de:hbz:294-54999
Referee:Gerald EnznerGND, Peter JaxGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2017/12/16
Date of first Publication:2017/12/16
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Elektrotechnik und Informationstechnik
Date of final exam:2017/11/07
Creating Corporation:Fakultät für Elektrotechnik und Informationstechnik
GND-Keyword:Signalverarbeitung; Sprachverarbeitung; Geräuschminderung; Bayes-Inferenz; Akustische Signalverarbeitung
Dewey Decimal Classification:Technik, Medizin, angewandte Wissenschaften / Elektrotechnik, Elektronik
Licence (German):License LogoKeine Creative Commons Lizenz - es gilt der Veröffentlichungsvertrag und das deutsche Urheberrecht