Methods Inf Med 1968; 7(02): 79-92
DOI: 10.1055/s-0038-1636347
Original Article
Schattauer GmbH

Computer Evaluation of Statistical Properties of Clinical Information in the Differential Diagnosis of Chest Pain[*]

COMPUTER-BEWERTUNG DER STATISTISCHEN EIGENSCHAFTEN KLINISCHER INFORMATION BEI DER DIFFERENTIALDIAGNOSE VON BRUSTSCHMERZEN
H. V. Pipbergee
1   From the Veterans Administration Cooperative Study on Automatic Cardiovascular Data Processing, V. A. Hospitals, Birmingham, Ala., Brooklyn, N. Y., San Francisco, CaliL, Washington, D. C, West Roxbury, Mass., and the Department oi Medicine, Georgetown University, School oi Medicine, Washington, D. C, U.S.A.
,
J. D. Klingemanand
1   From the Veterans Administration Cooperative Study on Automatic Cardiovascular Data Processing, V. A. Hospitals, Birmingham, Ala., Brooklyn, N. Y., San Francisco, CaliL, Washington, D. C, West Roxbury, Mass., and the Department oi Medicine, Georgetown University, School oi Medicine, Washington, D. C, U.S.A.
,
J. Cosma
1   From the Veterans Administration Cooperative Study on Automatic Cardiovascular Data Processing, V. A. Hospitals, Birmingham, Ala., Brooklyn, N. Y., San Francisco, CaliL, Washington, D. C, West Roxbury, Mass., and the Department oi Medicine, Georgetown University, School oi Medicine, Washington, D. C, U.S.A.
› Author Affiliations
Further Information

Publication History

Publication Date:
17 February 2018 (online)

A pilot study was undertaken to determine quantitatively from a large number of signs, symptoms and laboratory tests of patients with, the differential diagnosis of chest pain, which information items could serve as optimal descriptors and/or discriminators of disease. Data were obtained from 1238 patients. For each subject 429 questions of the »yes-no« type were answered and 69 numerical data collected. Incidence rates of signs and symptoms were considered as descriptors. Out of those exceeding an incidence rate of 25 percent, between 60 and 95 percent referred to medical history, depending upon the disease entity under study.

Contingency table analysis and chi-square tests were used first to determine the discriminative power of various items. Historical data predominated again. Out of the total of 498 information items tested only 46 reached a chi-square level of 40 which was considered the minimum for efficient separation of diseases. Many items with high incidence rates contributed little or nothing to disease differentiation.

To test the discriminative power of the identified signs, symptoms and laboratory data, discriminant function analysis was used. The number of items could be further reduced to less than 10. More than 95 percent of the 1000 patients with Coronary Artery Disease and Pneumonia could be classified correctly with this reduced set.

Data reduction and identification of optimal descriptors and discriminators can be considered as one of the most important preliminary steps in computer analysis of clinical information.

Es wurde ein quantitativer Versuch unternommen, aus einer großen Anzahl von anamnestischen Daten, Krankheits-Symptomen und Laboratoriumsbefunden diejenigen zu identifizieren, die optimal zur Charakterisierung eines Krankheitsbildes beitragen und außerdem zwischen verschiedenen Krankheitsbildern differenzieren. Als Modell für die Untersuchung wurde die Differentialdiagnose von ,,Schmerzen in der Brust” ausgewählt. Die Zahl der Patienten betrug 1238. Von jedem wurden 429 ,,ja-nein” Fragen beantwortet und 69 numerische Befunde erhoben. Die prozentuale Frequenz der jeweiligen Informationen wurde, wenn sie 25 Prozent überstieg, als signifikant für die Charakterisierung eines Krankheitsbildes angesehen. Zwischen 60 und 95 Prozent dieser Charakteristika bezogen sich auf Anamnese und Symptome.

Um optimale Diskriminatoren zwischen verschiedenen Krankheiten zu bestimmen, wurde zunächst eine Vierfeldertafel-Analyse zusammen mit einer χ2-Formel verwandt. Anamnestische Daten und Krankheits-Symptome dominierten auch hierbei. Von den 498 verschiedenen Informationen, die untersucht wurden, erreichten nur 46 ein χ2-Niveau von 40, das als Minimum für effektive Diskriminierung angesehen wurde. Eine große Reihe von Befunden, die mit großer Frequenz auftraten, trugen wenig oder gar nicht zur Differenzierung zwischen verschiedenen Krankheiten bei.

Um die effektive Wirkung der identifizierten Krankheits-Faktoren auf die Differentialdiagnose zu untersuchen, wurde eine Diskriminanz-Funktions-Analyse durchgeführt. Dabei konnte die Anzahl der signifikanten Faktoren bis auf weniger als 10 reduziert werden. Mehr als 95 Prozent von 1000 Patienten mit Koronar-Erkrankungen oder Pneumonie konnten mit dieser kleinen Anzahl von Krankheitsfaktoren korrekt klassifiziert werden.

Verminderung der Anzahl von medizinischen Daten und Identifizierung derjenigen Faktoren, die effektiv nicht oder wenig zur Krankheitsbeschreibung oder Differentialdiagnose beitragen, stellt eine der dringendsten Aufgaben in der heutigen medizinischen Forschung dar. Der ständige Zuwachs an neuen Daten und neuen Erkenntnissen kann nur gemeistert werden, wenn gleichzeitig Informationen, die in diesem Prozeß überflüssig oder irrelevant werden, eliminiert werden können. Dabei findet der Elektronenrechner eine seiner sinnvollsten Aufgaben, da derartige quantitative Analysen von klinischen Informationen kaum ohne dieses Hilfsmittel bewältigt werden können.

* Supported in part by research grants from the U.S. Public Health Service, Division of Chronic Diseases (CD 00064-06) and the National Heart Institute (HE 09696-02).