Methods Inf Med 1972; 11(03): 152-162
DOI: 10.1055/s-0038-1636075
Original Article

A Retrieval System for a Library of Pathology Reports, Slides and Kodachromes[*)]

EIN RETRIEVAL-SYSTEM FÜR EINE SAMMLUNG VON PATHOLOGIE-BERICHTEN, DIAS UND KODACHROMES
P. GAYNON
(From the Department of Pathology, Abraham Lincoln School of Medicine, University oi Illinois)
,
R. L. WONG
(From the Department of Pathology, Abraham Lincoln School of Medicine, University oi Illinois)
› Author Affiliations

With the objective of providing easier access to pathology specimens, slides and kodachromes with linkage to x-ray and the remainder of the patient’s medical records, an automated natural language parsing routine, based on dictionary look-up, was written for Surgical Pathology document-pairs, each consisting of a Request for Examination (authored by clinicians) and its corresponding report (authored by pathologists). These documents were input to the system in free-text English without manual editing or coding.

Two types of indices were prepared. The first was an »inverted« file, available for on-line retrieval, for display of the content of the document-pairs, frequency counts of cases or listing of cases in table format. Retrievable items are patient’s and specimen’s identification data, date of operation, name of clinician and pathologist, etc. The English content of the operative procedure, clinical findings and pathologic diagnoses can be retrieved through logical combination of key words. The second type of index was a catalog. Three catalog files — »operation«, »clinical«, and »pathology« — were prepared by alphabetization of lines formed by the rotation of phrases, headed by keywords. These keywords were automatically selected and standardized by the parsing routine and the phrases were extracted from each sentence of each input document. Over 2,500 document-pairs have been entered and are currently being utilized for purpose of medical education.

Im Bestreben, einen besseren Zugriff zu pathologischem Untersuchungsmaterial, zu Diapositiven und Kodachromes zugleich mit verknüpfenden Hinweisen auf Röntgenaufnahmen und die übrige Krankengeschichte des Patienten zu ermöglichen, wurde eine automatisierte linguistische Klartextanalyse-Routine auf der Grundlage des Nachschlagens im Wörterbuch für Formblätter für bioptische Untersuchungen geschrieben. Bei den erwähnten Formblättern handelt es sich um ein Auftrags-Formblatt zur Durchführung einer Untersuchung (geschrieben vom Kliniker) und den entsprechenden Bericht des Pathologen. Diese Dokumente wurden in Klartext, d. h. ohne manuelle Überarbeitung oder Kodierung, in das System eingegeben.

Zwei Arten von Indexen wurden erstellt: zunächst ein »inverted file« für das On-line-Retrieval, für die Wiedergabe des Inhalts der beiden Formblätter und für Häufigkeitszählungen von Fällen oder Fallauflistungen in Tabellenformat. Suchmerkmale sind dabei die Identifikationsdaten von Patienten und Operationsmaterial, das Datum der Operation, der Name des Klinikers bzw. des Pathologen usw. Die Art des operativen Eingriffs, des klinischen Befundes und der pathologischen Diagnosen können durch logische Kombination von Schlüsselwörtern aufgefunden werden.

Der zweite Index-Typ waren Kataloge. Drei Kataloge, nämlich »Operation«, »Klinik« und »Pathologie« wurden im KWIC-Index-Verfahren mittels Rotation der Schlagwörter hergestellt. Diese Schlagwörter wurden automatisch ausgezogen und durch die linguistische Analyse standardisiert. Die entsprechenden Satzteile wurden aus jedem Satz jedes eingegebenen Dokuments herausgezogen. Mehr als 2500 Formblattpaare wurden verarbeitet und werden zur Zeit für Zwecke der medizinischen Ausbildung benutzt.

*) This work is supported by the Norval Pierce Research Fund, Abraham Lincoln School of Medicine, University of Illinois, Chicago, Illinois.




Publication History

Publication Date:
09 February 2018 (online)

Schattauer GmbH

 
  • References

  • 1 Salton G. Automated Language Processing. Annual Review of Information Science and Technology 03 1968; 169-199.
  • 2 Bobrow D. G, Fraser J. B, Quillian M. R. Automated Language Processing. Annual Review of Information Science and Technology 02 1967; 161-186.
  • 3 Bross I DJ, Priore R. L, Shapiro P. A, Stermole D. F, Anderson B. B. Feasibility of Automated Information Systems in the Users’ Natural Language. American Scientist 57 1969; 193-205.
  • 4 DeLand E. C, Waxman B. D. Review of Hospital Information System. Special publication of Rand Corporation; Santa Monica, California: June 1970
  • 5 Lamson B. B, Dimsdale B. Natural Language Retrieval System, Pathology Thesaurus, UCLA Hospital - IBM. Oct. 1, 1970
  • 6 Lamson B. B, Russell W. S, Fullmore J, Nix W. E. The First Decade of Effort: Progress Toward a Hospital Information System at the UCLA Hospital, Los Angeles, California. Meth. Inform. Med 09 1970; 73-80.
  • 7 Minsky M. (Edit.): Semantic Information Proceeding. The M.I.T. Press; 1968
  • 8 Montgomery C. A. Automated Language Processing. Annual Review of Information Science and Technology 04 1969; 145-174.
  • 9 Röttger P, Reul H, Klein I, Sunkel H. The Automated Handling and Statistical Evaluation of Pathologic-Anatomical Findings. Meth. Inform. Med 08 1969; 19-26.
  • 10 Röttger P, Reul H, Sunkel H, Klein I. New Possibilities of Statistical Evaluation of Autopsy Records. Computer Free Text Analysis. Meth. Inform. Med 09 1970; 35-44.
  • 11 Salton G. Automated Language Processing. Annual Review of Information Science and Technology 03 1968; 169-199.
  • 12 Seed J. C. Restricted Data Formats. Ann. N.Y. Acad. Sei 161 1969; 484-526.
  • 13 SHAPiRO P. A, Bross I DJ, Priore R. L, Anderson B. B. »Information in Natural Languages: A New Approach,«. J. Amer. med. Ass 207 1969; 2080-2084.
  • 14 Simmons R. F. Automated Language Processing. Annual Review of Information Science and Technology 01 1966; 137-169.
  • 15 Wells A. H. The Conversion of SNOP to the Computer Language of Medicine. Pathologist, Bull. Coll. Amer. Pathol 25 1971; 371-378.
  • 16 White D. Information Proceeding of Medical Records - State of Art: Report on the IFIP - TC4 Working Conference, Lyon, April 6-10 1970. Meth. Inform. Med 09 1970; 189-193.
  • 17 Wong R. L, Gaynon P. An Automated Parsing Routine for Diagnostic Statements of Surgical Pathology Reports. Meth. Inform. Med 10 1971; 169-175.
  • 18 Yngve V. H. The Feasibility of Machine Searching of English Texts. Proc. of the Int. Conf. on Sei. Inf 02 1959; 975-996.