Subscribe to RSS
DOI: 10.1055/s-0038-1634842
A Medical Text Analysis System for German - Syntax Analysis[*]
The author is particularly grateful to Prof. Dr. Carl Theo Ehlers for his active interest in this work and his continuous encouragement.Publication History
Publication Date:
07 February 2018 (online)
Abstract:
Much information about patients is stored in free text. Hence, the computerized processing of medical language data has been a well-known goal of medical informatics resulting in different paradigms. In Gottingen, a Medical Text Analysis System for German (abbr. MediTAS) has been under development for some time, trying to combine and to extend these paradigms. This article concentrates on the automated syntax analysis of German medical utterances. The investigated text material consists of 8,790 distinct utterances extracted from the summary sections of about 18,400 cytopathological findings reports. The parsing is based upon a new approach called Left-Associative Grammar (LAG) developed by Hausser. By extending considerably the LAG approach, most of the grammatical constructions occurring in the text material could be covered.
* This article is mainly a synopsis of the author’s Habilitation thesis
-
REFERENCES
- 1 Pratt AW. Medicine, computers, and linguistics. Adv Biomed Eng 1973; 03: 97-140.
- 2 Schneider W, Sågvall Hein AL. eds. Computational Linguistics in Medicine. Amsterdam: North-Holland Publ Comp; 1977
- 3 Wingert F. ed. Klartexlverarbeitung. Berlin: Springer Verlag; 1978
- 4 Pacak MG, Dunham GS. Computers and Medical Language. Med Inform 1979; 04: 13-27.
- 5 Cote RA, Protti DJ, Scherrer JR. eds. Role of Informatics in Health Data Coding and Classification Systems. Amsterdam: North-Holland Publ Comp; 1985
- 6 Scherrer JR, Côté RA, Mandil SH. eds. Computerized Natural Medical Language Processing for Knowledge Representation. Amsterdam: North-Holland Publ Comp; 1989
- 7 Shapiro AR. Text processing in medicine and medical information science. In: Van Bemmel JH, Ball MJ, Wigertz O. eds. MEDINFO 83. Amsterdam: North-Holland Publ Comp; 1983: 92-5.
- 8 Crivelli M, Zeller C, Scherrer M. Verarbeitung von frei verfaßten Anamnesen durch den Computer. Schweiz Med Wochenschr 1978; 108: 1026-31.
- 9 Scherrer M, Tschumi HJ, Zeller C, Zimmermann Ch. Die subjektiven Frühsymptome des Bronchialkarzinoms. Retrospektive Analyse von in freiem Text verfaßten Anamnesen durch den Großcomputer. Schweiz Med Wochenschr 1980; 110: 715-21.
- 10 Scherrer M, Zeller C, Berger M. Asthma bronchiale, Polyposis nasi und Schmerzmittel-Unverträglichkeit (ASA-Trias). Eine erfolgreiche computerunterstützte Analyse frei eindiktierter Texte. Schweiz Med Wochenschr 1984; 114: 321-42.
- 11 Gell G. AURA: A clinical data bank based on free text. In: O’Moore RR, Barber B, Reichertz PL, Roger F. eds. Medical Informatics Europe 82. Berlin: Springer Verlag; 1982: 850-6.
- 12 Gell G. AURA: Routine Documentation of Medical Texts. Meth Inform Med 1983; 22: 63-8.
- 13 Enders E. Einsetzbarkeit eines Dokumenten-Retrieval-Systems zur Dokumentation klinischer Klartextdaten (Ph. D. Thesis). GieBen: Justus Liebig University; 1980
- 14 Epple JH. Einsatzmglichkeiten des Dokumenten-Retrieval-Systems STAIRS/VS bei der Dokumentation klinischer Klartextdaten (Ph. D. Thesis). GieBen: Justus Liebig University; 1986
- 15 Blair DC, Maron ME. An evaluation of retrieval effectiveness for a full-text document-retrieval system. Comm ACM 1985; 28: 289-99.
- 16 Röttger P, Reul H, Klein I, Sunkel H. Die vollautomatische Dokumentation und statistische Auswertung pathologisch-anatomischer Befundberichte. Meth Inform Med 1969; 08: 19-26.
- 17 Röttger P. Theoretische Grundlagen, empirische Generierung und Anwendungsstruktur eines Textverarbeitungssystems fur die Pathologie (Habilitation Thesis). Frankfurt: Johann Wolfgang Goethe University; 1979
- 18 Wingert F. Word segmentation and morpheme dictionary for pathology data processing. In: Anderson J, Forsythe JM. eds. MEDINFO 74. Amsterdam: North-Holland Publ Comp; 1975: 915-21.
- 19 Wingert F. Morphologie Analysis of Compound Words. Meth Inform Med 1985; 24: 155-62.
- 20 Wingert F. An Indexing System for SNOMED. Meth Inform Med 1986; 25: 22-30.
- 21 Wingert E. Automatische Indexierung in die ICD. In: Ehlers CTh, Beland H. eds. Perspektiven der Informationsverarbeitung in der Medizin. Kritische Synopse der Nutzung der Informatik in der Medizin. Berlin: Springer Verlag; 1986: 215-8.
- 22 Wingert F. Automated indexing of SNOMED statements into ICD. Meth Inform Med 1987; 26: 93-8.
- 23 Haase J, Klar R, Pietrzyk P. Ein Programm zur Diagnosenverschliisselung im Dialogverkehr. Meth Inform Med 1978; 17: 145-50.
- 24 Adlassnig KP, Grabner H. Verarbeitung natürlichsprachiger medizinischer Begriffe. In: Grabner G. ed. WAMIS: Wiener All-gemeines Medizinisches Informations-System. Berlin: Springer Verlag; 1985: 162-89.
- 25 Diekmann F, Müller U, Ruhl U. Unterstiitzung der Diagnosenstatistik der Krankenhauser durch ein Diagnose-Codier-System. In: Ehlers CTh, Beland H. eds. Perspektiven der Informationsverarbeitung in der Medizin. Kritische Synopse der Nutzung der Informatik in der Medizin. Berlin: Springer Verlag; 1986: 182-5.
- 26 Michel A, Dudeck J. Diagnoseverschliisselung nach ICD mit einem hierarchisch strukturierten System von Schlusselworten. In: Ehlers CTh, Beland H. eds. Perspektiven der Informationsverarbeitung in der Medizin. Kritische Synopse der Nutzung der Informatik in der Medizin. Berlin: Springer Verlag; 1986: 224-7.
- 27 Giere W. BAIK. Befunddokumentation und Arztbriefschreibung im Krankenhaus. Taunusstein: Media Verlag; 1986
- 28 Dorda W, Haidl B, Sachs P. Processing medical natural language data by the system WAREL. Meth Inform Med 1988; 27: 67-72.
- 29 Espinosa A, Bernauer J, Hoffmann W. Semiautomatic encoding of medical diagnosis by non-professionals. In: Rienhoff O, Piccolo U, Schneider B. eds. Expert Systems and Decision Support in Medicine. Berlin: Springer Verlag; 1988: 490-4.
- 30 Ingenerf J, Haux R, Repges R, Richter MM. Wissensbasiertes Indexieren von medizinischen Phrasen auf der Basis von SNOMED: Methodik und Realisation von EIDOS. In: Rienhoff O, Piccolo U, Schneider B. eds. Expert Systems and Decision Support in Medicine. Berlin: Springer Verlag; 1988: 455-61.
- 31 Wagner J, Baud R, Borst F, KQhler CO, Scherrer JR. A knowledge-based system for interactive medical diagnosis encoding. In: Rienhoff O, Piccolo U, Schneider B. eds. Expert Systems and Decision Support in Medicine. Berlin: Springer Verlag; 1988: 449-54.
- 32 Shapiro PA. ACORN - An automated coder of report narrative. Meth Inform Med 1967; 06: 153-62.
- 33 Sager N. Natural language information formatting: the automatic conversion of texts to a structured database. In: Yovits MC. ed. Advances in Computers. Vol. 17. New York: Academic Press; 1978: 89-162.
- 34 Sager N. Natural Language Information Processing. A Computer Grammar of English and Its Applications. Reading: Addison-Wesley; 1981.;
- 35 Sager N, Friedman C, Lyman MS. Medical Language Processing. Computer Management of Narrative Data. Reading: Addison-Wesley; 1987
- 36 Sager N. Medical language processing: computer management of narrative data. In: Scherrer JR, Côté RA, Mandil SH. eds. Computerized Natural Medical Language Processing for Knowledge Representation. Amsterdam: North-Holland Publ Comp; 1989: 57-65.
- 37 Grimm WD, Graichen D, Doerre F. Development of a natural linguistic medical indexing language based on a syntactic-semantic analysis. In: Lindberg DAB, Kaihara S. eds. MEDINFO 80. Amsterdam: North-Holland Publ Comp; 1980: 1295-300.
- 38 Graichen D, Dorre F, Grimm WD. Formal means for the semantic representation of medical data and clinical knowledge. In: O’Moore RR, Barber B, Reichertz PL, Roger F. eds. Medical Informatics Europe 82. Berlin: Springer Verlag; 1982: 863-5.
- 39 Wehrli E. Syntactic analysis in medical data processing. In: Van Bemmel JH, Ball MJ, Wigertz O. eds. MEDINFO 83. Amsterdam: North-Holland Publ Comp; 1983: 116-9.
- 40 Borst F, Wehrli E, Scherrer JR. MEDIAL, a natural language processing system for medical records. In: Roger FG, Willems JL, O’Moore R, Barber B. eds. Medical Informatics Europe 84. Berlin: Springer Verlag; 1984: 128-33.
- 41 Mery C, Normier B, Ogonowski A. “IN-TERMED”. A medical language interface. In: Fox J, Fieschi M, Engelbrecht R. eds. AIME 87. Berlin: Springer; 1987: 3-8.
- 42 Berrut C, Cinquin P. Natural language understanding of medical reports. In: Scherrer JR, Cote RA, Mandil SH. eds. Computerized Natural Medical Language Processing for Knowledge Representation. Amsterdam: North-Holland Publ Comp; 1989: 129-37.
- 43 Zweigenbaum P, Cavazza M. Deep sentence understanding in a restricted domain. In: CO LING 90. Proceedings of the Thirteenth Conference on Computational Linguistics, Helsinki 1990: 82-4.
- 44 Morel-Guillemaz AM, Baud RH, Scherrer JR. Proximity processing of medical text. In: O’Moore R, Bengtsson S, Bryant JR, Bryden JS. eds. Medical Informatics Europe VO. Berlin: Springer Verlag; 1990: 625-30.
- 45 Pietrzyk PM. Survey of the Goettingen medical text analysis system. In: Hansen R, Solheim BG, O’Moore RR, Roger FH. eds. Medical Informatics Europe ‘88. Berlin: Springer Verlag; 1988: 128-32.
- 46 Pietrzyk PM. Analyse medizinischer Freitexle: Strukturierung und Syntaxanalyse (Habilitation Thesis). Göttingen: Georg August University; 1989
- 47 Pietrzyk PM. Medizinische Freitextverarbeitung mit Hilfe von ATN-Grammatiken. In: Ehlers CTh, Beland H. eds. Perspektiven der Informationsverarbeitung in der Medizin. Kritische Synapse der Nutzung der Informatik in der Medizin. Berlin: Springer Verlag; 1986: 303-6.
- 48 Wingert F. Medical Linguistics: Automated indexing into SNOMED. Crit Rev Med Inform 1988; 01: 333-403.
- 49 Clayton PD, Pryor TA, Gardner RM, Warner HR. HELP - A medical information system which combines automated medical decision-making with clinical data review and administrative support. In: Jesdinsky HJ, Trampisch HJ. eds. Prognose-und Entscheidungsfindung in der Medizin. Berlin: Springer Verlag; 1985: 266-72.
- 50 Bátori IS, Lenders W, Putschke W. eds. Computational Linguistics. Berlin: de Gruyter; 1989
- 51 Hellwig P. Parsing natürlicher Sprachen: Grundlagen. In: Bátori IS, Lenders W, Putschke W. eds. Computational Linguistics. Berlin: de Gruyter; 1989: 348-77.
- 52 Lyons J. Einfuhrung in die moderne Linguistik. 6th ed. MUnchen: CH Beck; 1984
- 53 Lewandowski Th. Linguistisches Wörterbuch 1-3. 4th ed. Heidelberg: Quelle & Meyer; 1984: 1985 1985.
- 54 Engel U. Syntax der deutschen Gegen-wartssprache. 2nd ed. Berlin: Erich Schmidt Verlag; 1982
- 55 Latour B. Verbvalenz. Eine Einführung in die dependentielle Satzanalyse des Deutschen. München: Max Hueber Verlag; 1985
- 56 Heringer HJ. Theorie der deutschen Syntax. 2nd ed. Munchen: Max Hueber Verlag; 1973
- 57 Hellwig P. Parsing natürlicher Sprachen: Realisierungen. In: Bátori IS, Lenders W, Putschke W. eds. Computational Linguistics. Berlin: de Gruyter; 1989: 378-432.
- 58 Winograd T. Language as a Cognitive Process. Vol. I: Syntax. Reading: Addison-Wesley; 1983
- 59 King M. ed. Parsing Natural Language. London: Academic Press; 1983
- 60 Hausser R. NEWCAT: Parsing Natural Language Using Left-Associative Grammar. Berlin: Springer Verlag; 1986
- 61 Pietrzyk PM. Syntaktische Analyse zytopathologischer Beurteilungstexte. In: Rienhoff O, Piccolo U, Schneider B. eds. Expert Systems and Decision Support in Medicine. Berlin: Springer Verlag; 1988: 443-8.
- 62 Hausser R. Computation of Language. Berlin: Springer Verlag; 1989
- 63 Drosdowski G. ed. Duden. Grammatik der deutschen Gegenwartssprache. 4th ed. Mannheim: Bibliographisches Institut; 1984
- 64 Schefe P. Statistische syntaktische Analyse von Fachsprachen mit Hilfe elektronischer Rechenanlagen am Beispiel der medizinischen, betriebswirtschaftlichen und literatur-wissenschaftlichen Fachsprache im Deutschen. Goppingen: Verlag Alfred Kiimmerle; 1975
- 65 Winston PH, Horn BKP. LISP. 2nd ed. Reading: Addison-Wesley; 1984
- 66 King M. Computational linguistics: issues and solutions. In: Blaser A. ed. Natural Language at the Computer. Berlin: Springer Verlag; 1988: 9-30.