A free text data collection system has been developed at the University of Illinois utilizing single word, syntax free dictionary lookup to process data for retrieval. The source document for the system is the Surgical Pathology Request and Report form. To date 12,653 documents have been entered into the system.
The free text data was used to create an IRS (Information Retrieval System) database. A program to interrogate this database has been developed to numerically coded operative procedures. A total of 16,519 procedures records were generated. One and nine tenths percent of the procedures could not be fitted into any procedures category; 6.1% could not be specifically coded, while 92% were coded into specific categories. A system of PL/1 programs has been developed to facilitate manual editing of these records, which can be performed in a reasonable length of time (1 week). This manual check reveals that these 92% were coded with precision = 0.931 and recall = 0.924. Correction of the readily correctable errors could improve these figures to precision = 0.977 and recall = 0.987. Syntax errors were relatively unimportant in the overall coding process, but did introduce significant error in some categories, such as when right-left-bilateral distinction was attempted.
The coded file that has been constructed will be used as an input file to a gynecological disease/PAP smear correlation system. The outputs of this system will include retrospective information on the natural history of selected diseases and a patient log providing information to the clinician on patient follow-up.
Thus a free text data collection system can be utilized to produce numerically coded files of reasonable accuracy. Further, these files can be used as a source of useful information both for the clinician and for the medical researcher.
An der Universität Illinois ist ein Klartext-Datensammelsystem entwickelt worden, welches zum Datenretrieval ein syntaxfreies, maschinengespeichertes Einzelwort-Lexikon verwendet. Das Ausgangsdokument für das System ist das Surgical Pathology Request and Report Formular. Bis heute sind 12 653 Dokumente in das System eingespielt worden.
Die Klartextdaten wurden benutzt, um eine 1RS (Information Retrieval System) Datensammlung zu schaffen. Ein Programm zur Befragung dieser Datensammlung ist für numerisch verschlüsselte Operationsverfahren entwickelt worden. Insgesamt wurden 16 519 Operationsberichte erstellt. 1,9% der Operationsverfahren konnten nicht in eine Kategorie eingeordnet werden; 6,1% konnten nicht spezifisch verschlüsselt werden, während 92% in spezifische Kategorien eingeordnet wurden. Um die manuelle Überarbeitung dieser Berichte in einer angemessenen Zeitspanne (eine Woche) zu gestatten, wurde ein System von PL/1 Programmen entwickelt. Die manuelle Überprüfung ergab, daß diese 92% mit einer Präzision von 0,931 und einer Recall-Rate von 0,924 verschlüsselt wurden. Bei Korrektur leicht zu verbessernder Fehler konnte die Präzision auf 0,977 und die Recall-Rate auf 0,987 verbessert werden. Im gesamten Kodierungsprozeß waren Syntaxfehler relativ unbedeutend, brachten jedoch wesentliche Fehler in manche Kategorien ein, so z.B. wenn eine Unterscheidung in rechts-links-bilateral versucht wurde.
Die so erstellte verschlüsselte Datei wird als Eingabematerial für ein Korrelationssystem »Gynäkologische Krankheit/PAP-Abstrich« benutzt. Die Ausgabe dieses Systems enthält retrospektive Informationen über den Verlauf ausgewählter Krankheiten und ein Patienten-Logbuch mit Informationen für den Kliniker hinsichtlich der Patientennachsorge.
So kann ein Klartext-Datensammelsystem dazu benutzt werden, um mit hinreichender Genauigkeit numerisch verschlüsselte Dateien zu erstellen. Weiterhin können diese Datenbestände als eine Quelle nützlicher Informationen sowohl für den Kliniker als auch für den medizinischen Forscher dienen.
Key-Words
Automatic Coding - Free Text Processing - Surgical Operative Procedures
Schlüssel-Wörter
Automatische Verschlüsselung - Klartextverarbeitung - chirurgische Operationsverfahren