Summary
Despite many investigations of the potential role of formal symbolic logic in medicine,
little attention has been paid to the distribution of words in large quantities of
natural language text and how this might affect the choice of a logic system. With
the emergence of communicating word processor technology, it is now possible to enter
large amounts of routine medical text in computer-readable form and study its implications
for symbolic logic formalisms.
We examined the word distribution in the Anatomical Diagnosis reports of 7,000 consecutive
autopsied patients from the Department of Pathology of The Johns Hopkins Hospital.
We found that uncommon disease entities consisting of common component words were
best recovered using a search algorithm which examines conjunction (and) logic in
ascending order of word frequency and alternation (inclusive or) logic in descending
order of word frequency. This logic is non-Abelian, non-distributive, and associative
for conjunction but not for alternation. Our results suggest that natural language
text analysis, which is essential for studying medical documents by computer, may
require heretofore little studied variant forms of symbolic logic.
Trotz vieler Untersuchungen über die potentielle Rolle der formalen symbolischen Logik
in der Medizin wurde bisher der Wortverteilung in umfangreichen Klartexten und ihrer
Wirkung auf die Wahl des anzuwendenden logischen Systems wenig Aufmerksamkeit gewidmet.
Mit dem Aufkommen der Wortprozessor/Kommunikationstechnologie ist es jetzt möglich,
umfangreiche medizinische Texte in computerlesbarer Form einzuspeichern und die aus
quantitativen Klartextanalysen gewonnenen Erkenntnisse für die Ausarbeitung des symbolisch-logischen
Formalismus zu verwenden.
Wir untersuchten die Wortverteilung in den Sektionsberichten von 7000 aufeinanderfolgenden
Obduktionen des Pathologischen Instituts des Johns Hopkins Hospital. Dabei fanden
wir, daß ungewöhnliche, aus häufig gebrauchten Wortkombinationen bestehende Krankheitsbegriffe
am besten wiedergefunden werden können, wenn der Suchalgorithmus die Konjunktionslogik
(logisches »und«) in aufsteigender Reihenfolge und die Alternationslogik (logisches
»oder«) in absteigender Reihenfolge der Worthäufigkeit enthält. Diese Logik ist nicht-Abelsch
und nicht-distributiv. Sie ist assoziativ für die Konjunktion, aber nicht für die
Alternation. Unsere Ergebnisse weisen darauf hin, daß zur Klartextanalyse, die einen
wesentlichen Bestandteil der Computerverarbeitung medizinischer Texte darstellt, bisher
wenig benutzte Formen der symbolischen Logik mit herangezogen werden sollten.
Key-Words
Natural Language Text Analysis - Symbolic Logic - Autopsy Protocol
Schlüssel-Wörter
Analyse der Umgangssprache - symbolische Logik - Sektionsbericht