Datenakquisition und Datenanalyse von Nomen-Adjektiv-Komposita
- Gegenstand dieser Untersuchung sind Nomen-Adjektiv-Komposita und ihre computerlinguistische Erkennung und Analyse in einem deutschen Textkorpus mit ca. 203 Millionen Wörtern. Sowohl für die Erkennung als auch für die Analyse werden verschiedene u.a. alternative computerlinguistische Verfahren implementiert und diskutiert. Die Erkennung von Nomen-Adjektiv-Komposita impliziert auch ihre Segmentierung. Hierzu werden zwei alternative Verfahren entwickelt und vorgestellt: ein Regel- bzw. Wort-basiertes Verfahren, sowie ein Verfahren aus dem Bereich des maschinellen Lernens. Die segmentierten Daten sind Input für eine Reihe unterschiedlicher Analysen. Im Vordergrund steht die Untersuchung computerlinguistischer Verfahren für die Erkennung von Similaritäten zwischen NAK-Wortbildungsmustern.
Author: | Roman Nino SimunicGND |
---|---|
URN: | urn:nbn:de:hbz:294-56831 |
Referee: | Tibor KissGND, Ralf KlabundeORCiDGND |
Document Type: | Doctoral Thesis |
Language: | German |
Date of Publication (online): | 2018/04/24 |
Date of first Publication: | 2018/04/24 |
Publishing Institution: | Ruhr-Universität Bochum, Universitätsbibliothek |
Granting Institution: | Ruhr-Universität Bochum, Fakultät für Philologie |
Date of final exam: | 2018/02/02 |
Creating Corporation: | Fakultät für Philologie |
GND-Keyword: | Computerlinguistik; Komposition; Maschinelles Lernen; Morphologie (Linguistik); Sprachverarbeitung |
Dewey Decimal Classification: | Sprache / Sprache, Linguistik |
Licence (German): | Keine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht |