Methods Inf Med 1972; 11(02): 104-113
DOI: 10.1055/s-0038-1636068
Original Article
Schattauer GmbH

Improved Statistical Methods for Automatic Construction of a Medical Thesaurus

VERBESSERTE STATISTISCHE METHODEN ZUR AUTOMATISCHEN ERSTELLUNG EINES MEDIZINISCHEN THESAURUS
M. WOLFF-TEHROINE
,
D. RIMBERT
,
B. ROUAULT
Further Information

Publication History

Publication Date:
10 February 2018 (online)

The building up of a metalanguage for the automatic processing of medical data (records or literature) requires, after a selection stage, a structuration stage. For this purpose, various clustering techniques were investigated out of a range of similarity criteria.

The interest in these criteria and their importance are discussed from a theoretical and a practical point of view.

The role played by similarity criteria in obtaining the environment of each term and the use of this environment for the retrieval are discussed.

Der Aufbau einer Metasprache zur automatischen Verarbeitung medizinischer Daten (medizinische Un-terlagen oder Literatur) erfordert nach einer Selektionsstufe eine Stufe der strukturellen Entwicklung.

Zu diesem Zweck wurden diverse Cluster-Techniken aus einer Reihe von Ähnlichkeitsmaßen unter-sucht.

Das Interesse an diesen Maßen und ihre Bedeutung werden vom theoretischen und praktischen Stand-punkt erörtert.

Die Rolle der Ähnlichkeitsmaße bei der Auffindung der »Umgebung« jedes Begriffes und die Verwen-dung dieses Kontextes für das Retrieval werden diskutiert.

 
  • References

  • 1 Auguston J. G, Minker J. Deriving term relations for a corpus by graph theoretical clusters. J. Amer. Soc. Inf. Sci 21 1970; 101-111.
  • 2 Broustet J. P. Les possibilites du recueil et du traitement de l’information dans un service de cardiologie en vue de son exploitation par ordinateur. Difficultés rencontrées. Solutions proposees.. Thèse Med; Bordeaux: 1966
  • 3 Doyle L. B. The microstatistics of text. Inform. Stor. Retr 01 1963; 189-214.
  • 4 Gardin J. C. Recherche sur 1’indexation automatique des documents scientifiques. Rev. franc. Inf. Rech. Oper 01 1967; 27-46.
  • 5 Korein J, Tick L. J, Woodbury M. A. et al. Computer processing of medical data by variable-field-length format. J. Amer. med. Ass 186 1963; 132-138.
  • 6 Korein J, Goodgold A. L, Randt C. T. Computer processing of medical data by variable-field-length format. II. Progress and application to narrative documents. J. Amer. med. Ass 196 1966; 950-963.
  • 7 Lamson B. G, Dimsdale B. A natural language information retrieval system. Proc. IEEE 54 1966; 1636-1640.
  • 8 Pratt A. W, Thomas L. B. An information processing system for pathology data. Path. Ann.. Appleton; New York: 1966
  • 9 Sables H, Gardin J. C. et al. Principes d’un système descriptif de signes medicaux pour l’étude de la pathologie digestive sur ordinateurs. CNRS; Paris: 1967
  • 10 Sparck K.Jones, Jackson D. M. The use of automatically obtained keyword classification for information retrieval. Inform. Stor. Retr 05 1970; 175-201.
  • 11 Wolff-Terroine M. Sabir: un systeme automatique de bibliographie, d’information et de recherche en carcinologie. Bull. Bibl. France. 35 1970: 169-176.
  • 12 Wolff-Terroine M, Rimbert D. Computer-aided automatic generation of a structured documentary language: preliminary study. J. Document 27 1971; 111-124.