Definitionen für die Spezifikation der Tabellen

In einem relationalen Datenmodell existieren folgende Schlüsselarten

Kandidatenschlüssel:

kennzeichnet eine Spalte oder Spaltengruppe einer Tabelle.

Primaerschlüssel:

ein Bezeichner einer Tabelle einer relationalen Datenbank,

der jede Reihe der Tabelle eindeutig definiert

(einer der Kandidatenschluessel einer Tabelle).

Fremdschlüssel :

eine Spalte oder Spaltengruppe einer Tabelle, die Primaerschluessel

einer anderen Tabelle ist.


Intention und Motivation für die Datenstruktur eines Wissensbasierten Information Retrieval Systems

Der Informationsspeicher Text ist eine semantische Interpretation einer syntaktischen Struktur. Ziel ist es die Begriffsverknüpfungen eines Textes durch die synkatische Struktur einer Phrasenstrukturgrammatik eines Textes, statt der gängigen klassischen Methode diese durch die Boolesche Operatoren, zu erfassen.

Die semantische Interpretation einer syntaktischen Struktur ist allein dem Menschen vorbehalten und stellt den Informationsgehalt des Textes dar. Dieser muß entweder durch den Indexierer neu, durch die Interpretation der syntaktischen Struktur, erschlossen werden, oder kann direkt durch den Autor vorgenommen werden, wenn der Autor in den Dokumentationsvorgang mit eingeschlossen wird.

Damit bildet die syntaktische Struktur und deren Interpretation die Informationsstruktur eines Dokuments.

Aus dieser Grundlage heraus ergibt sich die Forderung nach eindeutiger Information durch deren Strukturbildung, so daß der Verfasser nun gezwungen wird, allein der "Publikativität" wegen, zu seinem Text seine Interpretation zu liefern, d.h. eine Einordnung seiner Information in den vorhandenen Wissensbereich.

Dieses hat wiederum weitere Vorteile für die Dokumentation:

a) Der Autor kann damit schon selbst feststellen, inwieweit seine Information neu in dem öffentlichen Wissensbereich ist, und damit eine Dokumentationswürdigkeit besitzt.

b) Eine Fehlinterpretation durch einen Indexierer ist damit ausgeschlossen.

c) Eine Überinterpretation der Information wird vermindert.

Doch schon jetzt läßt sich vermuten, daß der Forderung nach eindeutiger Information nicht immer gerecht werden kann. Doch Ausnahmen sind nicht immer die Regeln.

In der Ausarbeitung "Das Expertensystem Information-Retrieval" wurde die Notwendigkeit unterschiedlicher Deskriptoren aufgezeigt. Aus dieser Betrachtung entstand eine vorläufige Spezifikation des Datenbankmodels für das Retrieval-System, welche nach weiteren Diskussionen zwischen den Interessenten anderer Gruppen nun teilweise überholt ist.

Die wichtigsten Kritikpunkte waren:

Aus diesen Kritikpunkten und einer ca. 7 Stunden langen Diskussion entstand nun ein erweitertes Konzept für die Datenstruktur.

Prinzip der unabhängiger Speicher

Prinzip der Informationsspeicher (Meta-Speicher)

Prinzip der Vorwärtsverkettung der terminalen Begriffe bei der Recherche

Beispiel

Prinzip der Rückwärtsverkettung der syntaktischen Struktur beim Indexieren

Beispiel

Prinzip der Hyperlinks auf syntaktische Strukturen bei Volltexten

s. Beispiel o.

Bemerkungen:

zum Deskriptorenspeicher : wie gehabt -sind die im Text vorkommenden relevanten Begriffe.

zum Relationenspecheicher : der Relationenspeicher beinhaltet nur noch eine bestimmte kontrollierte Anzahl von Relationsbezeichnern, welche nur durch eine autorisierte Person (Systemverwalter) nach Vorschlägen des Benutzers, bei nicht hinreichender Relationsgenauigkeit erweitert werden können. Neben dem Relationsspeicher wird eine zusätzliche Tabelle (syn_relationen) mit weiteren Relationsbezeichungen für eine Relation, die vom Benutzer als Synonym ausgezeichnet werden können, geführt, die jedoch nicht zum Indexieren dient.

zum Begriffsspeicher : wie gehabt - sind die lokalen Terminalbegriffe des Begriffsnetezes, welche durch Normen "globalisiert" werden können.

zum Funktionspeicher : Da alle Relationen nun zweistellig sind, kann nicht mehr zwischen den Deskriptoren, die in Relation stehen unterschieden werden. Daher wird ein Eintrag benötigt, welcher den Speicher des Deskriptors kennzeichnet. Außerdem wird vom Indexierungsprogramm verlang, daß jeder Deskriptor zu einem terminal Begriff aus dem Begriffsspeicher in Beziehung gebracht wird. Weiterhin existiert eine Tabelle (interpretation), welche angibt wie die Relation zu verstehen ist.


Spezifikation

Auf eine formale Spezifikation wird vorerst verzichtet und statt dessen soll die folgende Grafik als Spezifikation dienen:

Erklärung der Grafik

Der Recherchespeicher stellt die Beziehung zwischen Dokumentenspeicher über (DOC_ID) und Funktionsspeicher über (FNK_ID) her.

In diesem Speicher wird die Information über die Dokumente gesammelt, die eine bestimmte Funktion besitzen, die ihnen mittels des Indexierungssystems vergeben wurde.

Der Fuktionsspeicher stellt die Beziehung zwischen dem Relationsspeicher über (REL_ID) Argumentenspeicher über (ARG_ID) her. In diesem Speicher werden alle möglichen Relationen des Recherchessystems gebildet.

Die Einführung des Argumentenspeicher ist nur aus Gründen der Generatisierung notwendig. Im Funktionsspeicher sind die beiden Spalten (ARG_ID) Fremschlüssel und sollen, damit eine beliebig komplexe Relation gebildet werden kann, sich auf beliebige Tabellen mit einem Primärschlüssel beziehen können. Die mit diesem Schlüssel referentierte Tabelle (TABELLE) ist im Argumentenspeicher gespeichert. Im abgebildeten Model werden folgende Tallelen im Argumentenspeicher referenziert.

Im Prinzip können noch beliebige Erweiterungen vorgenommen werden. Denkbar hierbei ist eine Referenz auf eine Tabelle die Informationen speichert aus welchem Textabschnitt eine zusammengesetzter Deskriptor bzw. ein Begriff konstruiert wurde (s. Beispiel).

Der Relationsspeicher beinhaltet die Namen der kontrollierten Relationen.

Damit die Relationen beim Indexieren eindeutig aufgestellt werden, werden deren Definition in der Tabelle Relationdefinition in der Spalte Definition festgehalten (s.Beispiel) .

Um die Motivation einer bestimmten Relation zu erhöhen, werden zu den kontrollierten Relationen Relationsnamen gespeichert, welche der Indexierer als Synonym interpretiert hat. Da ein Synonym nur für ein bestimmtes Dokument gilt, wird in der Tabelle Synonymrelation mittels der Spalte (DOC_ID) auf das entsprechende Dokument verwiesen.

Literatur