Datenakquisition und Datenanalyse von Nomen-Adjektiv-Komposita

  • Gegenstand dieser Untersuchung sind Nomen-Adjektiv-Komposita und ihre computerlinguistische Erkennung und Analyse in einem deutschen Textkorpus mit ca. 203 Millionen Wörtern. Sowohl für die Erkennung als auch für die Analyse werden verschiedene u.a. alternative computerlinguistische Verfahren implementiert und diskutiert. Die Erkennung von Nomen-Adjektiv-Komposita impliziert auch ihre Segmentierung. Hierzu werden zwei alternative Verfahren entwickelt und vorgestellt: ein Regel- bzw. Wort-basiertes Verfahren, sowie ein Verfahren aus dem Bereich des maschinellen Lernens. Die segmentierten Daten sind Input für eine Reihe unterschiedlicher Analysen. Im Vordergrund steht die Untersuchung computerlinguistischer Verfahren für die Erkennung von Similaritäten zwischen NAK-Wortbildungsmustern.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Roman Nino SimunicGND
URN:urn:nbn:de:hbz:294-56831
Referee:Tibor KissGND, Ralf KlabundeORCiDGND
Document Type:Doctoral Thesis
Language:German
Date of Publication (online):2018/04/24
Date of first Publication:2018/04/24
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Philologie
Date of final exam:2018/02/02
Creating Corporation:Fakultät für Philologie
GND-Keyword:Computerlinguistik; Komposition; Maschinelles Lernen; Morphologie (Linguistik); Sprachverarbeitung
Dewey Decimal Classification:Sprache / Sprache, Linguistik
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht