Methods Inf Med 1987; 26(02): 77-88
DOI: 10.1055/s-0038-1635488
Original Article
Schattauer GmbH

Descriptive Data Analysis: A Concept between Confirmatory and Exploratory Data Analysis

Deskriptive Datenanaiyse: Ein Konzept zwischen konfirmatorischer und exploratorischer Datenanalyse
K. Abt
1   (From the Department of Biomathematics, Center of Medical Informatics, Medical School, University of Frankfurt, F. R. Germany)
› Author Affiliations
Further Information

Publication History

Publication Date:
16 February 2018 (online)

Summary

Confirmatory Data Analysis (CDA) in randomized comparative (“controlled”) studies with many variables and/or time points of interest finds its limitations in the multiplicity of desired inferential statements which leads to unfeasibly small adjusted significance levels (“Bon-ferronization”) and, thereby, to unduly increased risks of not rejecting false hypotheses. In general, analytical models adequate for such complex data structures and suitable for practical use do not exist as yet. Exploratory Data Analysis (EDA), on the other hand, is usually intended to generate hypotheses and not to lead to final conclusions based on the results of the study.

In this paper, it is proposed to fill the conceptual gap between CDA and EDA by “Descriptive Data Analysis” (“DDA”) which concept is mainly based on descriptive inferential statements. The results of a DDA in a controlled study are interpreted simultaneously on the basis of the investigator’s experience with respect to numerically relevant treatment effect differences and on “descriptive significances” as they appear in “near regular” patterns corresponding to the resulting relevant effect differences. A DDA may also contain confirmatory parts and/or tests on global hypotheses at a prechosen maximum risk α of erroneously rejecting true hypotheses. The paper is in parts expository and is addressed to investigators as well as statisticians.

Die Anwendungsmöglichkeiten der konfirmatorischen Datenanalyse (CDA) in randomisier-ten, vergleichenden (»kontrollierten«) Studien mit vielen interessierenden Variablen und/oder Zeitpunkten sind dadurch begrenzt, daß wegen der gewünschten zahlreichen Inferenzaussagen die zu adjustierenden Signifikanzschwellen zwangsweise unmäßig klein werden. Aufgrund dieser »Bonferronisierung« werden die Risiken für irrtümlich beibehaltene Hypothesen untragbar hoch. Es gibt bis heute im allgemeinen auch keine Auswertungsmodelle, die den Strukturen derart komplexer Studien gerecht werden und gleichzeitig praktisch verwendbar sind. Die explorative Datenanalyse (EDA) ist demgegenüber für die Erzeugung von Hypothesen gedacht und nicht dafür, endgültige Schlüsse aus den Studienresultaten zu ziehen. In der vorliegenden Arbeit wird vorgeschlagen, die konzeptuelle Lücke zwischen CDA und EDA durch »Deskriptive Datenanaiyse« (DDA) zu füllen, wobei dieses Konzept hauptsächlich auf deskriptiven Inferenzaussagen beruht. Danach werden die Ergebnisse der Analyse in einer kontrollierten Studie simultan interpretiert: zum einen auf der Basis der Erfahrung des Substanzwissenschaftlers bezüglich numerisch relevanter Wirkungsdifferenzen und zum anderen auf derjenigen »deskriptiver Signifikanzen«, falls diese in »nahezu regulären« Mustern in Korrespondenz zu den relevanten Wirkungsdifferenzen auftreten. Eine DDA kann auch konfirmatorische Teile und/oder Tests für globale Hypothesen enthalten, wobei ein vorgewähltes maximales Risiko α für die irrtümliche Ablehnung der Hypothesen eingehalten wird. Die Arbeit hat zum Teil einführenden Charakter und wendet sich sowohl an Substanzwissenschaftler als auch an Statistiker.