Die Vorteile der Zerlegung von Komposita bei der Klartextanalyse werden dargestellt. Dazu werden verschiedene Wortmodelle erläutert. Für ein Wortmodell, bei dem ein Wort interpretiert wird als Folge von Wortteilen aus drei Typen von Segmenten, wird eine Sprache definiert, die eine formale komprimierte Notation der Regeln für die Wortanalyse erlaubt. Die Implementierung des Verfahrens wird mit einer Beschreibung der Lexika und des Wortsegmentierungsalgorithmus vorgestellt.
The pay-offs of the analysis of compound word forms in language processing are described. Various word models are presented. For one word model, which interpretes a word as a sequence of word parts made up of three types of segments, a language is defined. This language allows for a formal and compressed notation of rules for the analysis of words. The implementation of the system is described including dictionaries and segmentation algorithm.
Schlüssel-Wörter
Klartextverarbeitung - Morphologie - morphosyntaktische Analyse - Komposita
Key-words
Language Processing - Morphology - Morphosyntactieal Analysis - Compound Words