Summary
Despite many investigations of the potential role of formal symbolic logic in medicine, little attention has been paid to the distribution of words in large quantities of natural language text and how this might affect the choice of a logic system. With the emergence of communicating word processor technology, it is now possible to enter large amounts of routine medical text in computer-readable form and study its implications for symbolic logic formalisms.
We examined the word distribution in the Anatomical Diagnosis reports of 7,000 consecutive autopsied patients from the Department of Pathology of The Johns Hopkins Hospital. We found that uncommon disease entities consisting of common component words were best recovered using a search algorithm which examines conjunction (and) logic in ascending order of word frequency and alternation (inclusive or) logic in descending order of word frequency. This logic is non-Abelian, non-distributive, and associative for conjunction but not for alternation. Our results suggest that natural language text analysis, which is essential for studying medical documents by computer, may require heretofore little studied variant forms of symbolic logic.
Trotz vieler Untersuchungen über die potentielle Rolle der formalen symbolischen Logik in der Medizin wurde bisher der Wortverteilung in umfangreichen Klartexten und ihrer Wirkung auf die Wahl des anzuwendenden logischen Systems wenig Aufmerksamkeit gewidmet. Mit dem Aufkommen der Wortprozessor/Kommunikationstechnologie ist es jetzt möglich, umfangreiche medizinische Texte in computerlesbarer Form einzuspeichern und die aus quantitativen Klartextanalysen gewonnenen Erkenntnisse für die Ausarbeitung des symbolisch-logischen Formalismus zu verwenden.
Wir untersuchten die Wortverteilung in den Sektionsberichten von 7000 aufeinanderfolgenden Obduktionen des Pathologischen Instituts des Johns Hopkins Hospital. Dabei fanden wir, daß ungewöhnliche, aus häufig gebrauchten Wortkombinationen bestehende Krankheitsbegriffe am besten wiedergefunden werden können, wenn der Suchalgorithmus die Konjunktionslogik (logisches »und«) in aufsteigender Reihenfolge und die Alternationslogik (logisches »oder«) in absteigender Reihenfolge der Worthäufigkeit enthält. Diese Logik ist nicht-Abelsch und nicht-distributiv. Sie ist assoziativ für die Konjunktion, aber nicht für die Alternation. Unsere Ergebnisse weisen darauf hin, daß zur Klartextanalyse, die einen wesentlichen Bestandteil der Computerverarbeitung medizinischer Texte darstellt, bisher wenig benutzte Formen der symbolischen Logik mit herangezogen werden sollten.
Key-Words
Natural Language Text Analysis - Symbolic Logic - Autopsy Protocol
Schlüssel-Wörter
Analyse der Umgangssprache - symbolische Logik - Sektionsbericht