Methods Inf Med 1969; 08(02): 84-90
DOI: 10.1055/s-0038-1635967
Original article
Schattauer GmbH

Identification and Transformation of Terminal Morphemes in Medical Englishi)

Identifikation Von Morphemen und Ihre Transformation in Medizinisches Englisch
A. W. Pratt
1   From the Division of Computer Research and Technology, National Institutes of Health
,
M. Pacak
1   From the Division of Computer Research and Technology, National Institutes of Health
› Institutsangaben
Weitere Informationen

Publikationsverlauf

Publikationsdatum:
09. Februar 2018 (online)

The system for the identification and subsequent transformation of terminal morphemes in medical English is a part of the information system for processing pathology data which was developed at the National Institutes of Health.

The recognition and transformation of terminal morphemes is restricted to classes of adjectivals including the -ING and -ED forms, nominals and homographic adjective/noun forms.

The adjective-to-noun and noun-to-noun transforms consist basically of a set of substitutions of adjectival and certain nominal suffixes by a set of suffixes which indicate the corresponding nominal form(s).

The adjectival/nominal suffix has a polymorphosyntactic transformational function if it has the property of being transformed into more than one nominalizing suffix (e.g., the adjectival suffix -IC can be substituted by a set of nominalizing suffixes -0, -A, -E, -Y, -IS, -IA, -ICS): the adjectival suffix has a monomorphosyntactic transformational property if there is only one admissible transform (e.g., -CIC-X).

The morphological segmentation and the subsequent transformations are based on the following principles:

a. The word form is segmented according to the principle of »double consonant cut,« i.e., terminal characters following the last set of double consonants are analyzed and treated as a potential suffix. For practical purposes only such terminal suffixes of a maximum length of four have been analyzed.

b. The principle that the largest segment of a word form common to both, adjective and noun or to both noun stems is retained as a word base for transformational operations, and the non-iden, tical segment is considered to be a »suffix.«

The backward right-to-left character search is initiated by the identification of the terminal grapheme of the given word form and is extended to certain admissible sequences of immediately preceding graphemes.

The nodes which represent fixed sequences of graphemes are labeled according to their recognition and/or transformation properties.

The tree nodes are divided into two groups:

a. productive or activated

b. non-productive or non-activated

The productive (activated) nodes are sequences of sets of graphemes which possess certain properties, such as the indication about part-of-speech class membership, the transformation properties, or both. The non-productive (non-activated) nodes have the function of connectors, i.e., they specify the admissible path to the productive nodes.

The computer program for the identification and transformation of the terminal morphemes is openended and is already operational. It will be extended to other sub-fields of medicine in the near future.

Die Methode der Identifizierung und nachfolgenden Umwandlung kleinster Wortbedeutungseinheiten in medizinische Fachausdrücke im Englischen ist ein Teil des an den National Institutes of Health entwickelten Informationssystems zur Verarbeitung von Pathologiedaten.

Die Erkennung und Umwandlung von Morphemen ist beschränkt auf Klassen von Adjektivformen (einschließlich der Endungen -ING und -ED), auf Nomina und gleich geschriebene Adjektiv-ZSubstantivFormen.

Die Adjektiv-ZSubstantivund Substantiv-/Substantiv-Transformationen bestehen im Prinzip aus einem Satz von Substitutionen von adjektivischen und gewissen nominalen Endungen durch eine Folge von Endungen, die die entsprechenden substantivischen Formen anzeigen.

Die adjektivisch-nominale Endung hat eine polymorphsyntaktische Umwandlungsfunktion, wenn sie sich in mehr als eine nominalisierende Nachsilbe umwandeln läßt (Beispiel: die adjektivische Endung -IC kann durch eine Reihe von nominalisierenden Endungen, wie -0, -A, -E, -Y, -IS, -IA, -ICS, ersetzt werden); das adjektivische Suffix hat eine monomorphsyntaktische Eigenschaft, wenn nur eine Umwandlungsform zulässig ist (z.B. -CIC >--X).

Die morphologische Untergliederung und die nachfolgenden Transformationen basieren auf folgenden Prinzipien:

a.) Der Unterteilung der Wort-Form nach dem Prinzip des »Doppelkonsonanten-Schnitts«; d.h. die auf den letzten Doppelkonsonanten folgenden Buchstaben werden als mögliche Suffixe analysiert und behandelt. Aus praktischen Gründen sind nur terminale Suffixe von höchstens vier Zeichen analysiert worden.

b.) Dem Prinzip, das dem Adjektiv und Substantiv bzw. beiden Nominalstämmen gemeinsame längste Wort-Bruchstück als Ausgangspunkt für die Umwandlungsoperationen zu benutzen und das nichtidentische Segment als »Endung« zu betrachten.

Die von rückwärts beginnende Abfrage wird durch die Identifikation des terminalen Graphems der gegebenen Wort-Form ausgelöst und auf bestimmte zulässige Folgen unmittelbar davor stehender Grapheme erweitert. Die »Knoten«, die bestimmte Graphemfolgen repräsentieren, werden entsprechend. ihrer Erkennungsund/oder Transformations-Eigenschaften gekennzeichnet. Sie werden in zwei Gruppen unterteilt:

b.) produktive oder aktivierte,

b.) unproduktive oder unwirksame.

Die produktiven (aktivierten) Knoten sind Folgen von Graphemsätzen, die bestimmte Eigenschaften besitzen, beispielsweise den Hinweis auf ihre Klassenzugehörigkeit in der Rumpfsprache, ihre Umwandlungseigenschaften, oder beides. Die unproduktiven (unwirksamen) Knoten haben die Funktion von Kupplungsstücken, d.h. sie geben den zulässigen Weg zu den produktiven Knoten an.

Das Computerprogramm für die Erkennung und Umwandlung der terminalen Morpheme ist »offen« und bereits in Betrieb. Es soll in nächster Zeit auf weitere Untergebiete der Medizin ausgedehnt werden.

 
  • References

  • 1 Chapin P. G. On the Syntax of Word Derivation in English. (The Mitre Corp., Bedford/Mass., Information System Language Study No. 16, MTP-68. 1967
  • 2 Chapin P. G. A Procedure for Morphological Analysis. (Internal Report, The Mitre Corp., Bedford/Mass). 1966
  • 3 Chomsky N. Aspects of the Theory of Syntax. The M.I.T. Press; Cambridge/Mass: 1965
  • 4 Dolby J. L. The Application of English-Word Morphology to Automatic Indexing and Extracting. (ClearingHouse for Federal Scientific and Technical Information; AD 615 424).
  • 5 Dohland W. A. N. Dorland’s Medical Dictionary. 24th Edition.. Saunders; Philadelphia-London: 1965
  • 6 Eahl L. L. Part-of-Speech Implications of Affixes. Mechanical Translation 09: 38-46 1966;
  • 7 Nida E. A. Morphology. The University of Michigan Press; Ann Arbor: 1946
  • 8 Norton L. M. Text-Processing System Programming. Internal Report; The Mitre Corp., Bedford/Mass. 1967
  • 9 Pacak M. Computational Morphology. in Austin W. M. (Edit.) Papers in Linguistics in Honor of Leon Dostert. Mouton; The Hague: 1967
  • 10 Pratt A. W, Teomas L. B. An Information Processing System for Pathology Data. Pathology Annual-66, (Appleton-Century-Crofts Publisher. 1967
  • 11 Snop. Systematized Nomenclature of Pathology. College of American Pathologists. 1965