An automated method for coding hospital patient records is described, which uses a
combination of simple computer programs and a structured dictionary. The system accepts
unrestricted medical language in French as input, and generates code combinations
which represent the semantic values of the original statements. The coding structure
is the trial version of the Systematized Nomenclature of Medicine (SNOMED) [9], A prototype system has been developed from a 20,000 word corpus of
obstetrical and gynecological data, recorded from patient records written by French-speaking
Quebec physicians. Preliminary test results on a small sample show that the system
generates accurate codes and code combinations for 97.9% of the data tested. The programs
were written in Fortran IV and implemented on a DEC PDP-9 computer. The dictionary
keys are word segments and the entries contain operators, word segments and SNOMED
codes. The dictionary structure permits a single entry to generate multiple SNOMED
codes and to handle the types of linguistic paraphrase found in hospital records.
The SNOMED codes and code combinations constitute a metalanguage which provides the
means for data compression and uniform representation of natural language medical
data.
Es wird eine automatisierte Methode zur Verschlüsselung von Krankenblättern beschrieben,
die mit einer Kombination von einfachen Computerprogrammen und einem strukturierten
Wörterbuch arbeitet. Das System nimmt uneingeschränkte Medizinsprache in Französisch
als Eingabe an und schafft Schlüsselkombinationen, die die semantischen Werte der
ursprünglichen Aussagen darstellen. Die Verschlüsselungsstruktur ist die Probefassung
von Systematized Nomenclature of Medicine (SNOMED) [9]. Aus einem Corpus von 20.000 Wörtern geburtshilflicher und gynäkologischer
Daten ist ein Prototypsystem entwickelt worden, entnommen aus Krankenblättern, die
von französischsprachigen Ärzten in Quebec geschrieben wurden. Vorläufige Testergebnisse
an einer kleinen Stichprobe zeigen, daß das System exakte Codes und Schlüsselkombinationen
für 97,9% der getesteten Daten hervorbringt. Die Programme wurden in Fortran IV geschrieben
und auf einem DEC PDP-9 Computer ausgeführt. Die Wörterbuchschlüssel sind Wortsegmente,
und die Eintragungen enthalten Operatoren, Wortsegmente und SNOMED-Schlüssel. Die
Wörterbuchstruktur ermöglicht es, daß eine einzige Eintragung vielfache SNOMED-Schlüssel
hervorbringt und daß die in Krankenblättern auftauchenden Arten linguistischer Paraphrasen
gehandhabt werden können. Die SNOMED-Schlüssel und Schlüsselkombinationen stellen
eine Metasprache dar, welche die Mittel zur Datenkomprimierung und gleichförmigen
Darstellung medizinischer Daten in natürlicher Sprache liefert.
Key-Words
Automatic Coding - Natural Language Text Processing - Computer Dictionary Structures
- Word Segmentation Methods - French Medical Statements - SNOMED
Schlüssel-Wörter
Automatische Verschlüsselung - Textverarbeitung in natürlicher Sprache - Computerwörterbuch-Strukturen
- Methoden der Wortsegmentierung - französische medizinische Aussagen - SNOMED