Potthast


Stand der Arbeiten an der Potthast-Datenbank - 2017-11-22

Diese Datenbank enthält die Empfänger aus Potthasts Regesta Pontificum Romanorum in einer ersten Normalisierungsstufe, d.h. möglichst auf Lateinisch, im Nominvativ und nach Strukturen der Identifikation aufgegliedert. Als Strukturen kommen zur Anwendung: Ortsangabe, nähere Ortsbestimmung, Institution, nähere Bestimmung der Institution insbesondere Ordenszugehörigkeiten, Patrozinium, Funktion, Name, Verweis auf eine ältere Urkunde ('repetit'). Pro Regest kann die Datenbank mehrere Empfänger enthalten.

Diese Angaben sind nach der Ersterfassung einmal mit dem Druck der Regesta Pontificum daraufhin verglichen worden, daß kein Empfänger übersehen wurde.

Die Datenbank hat insgesamt 58779 Einträge für 26779 Regesten.

Um die Datenbankeinträge in der Form eines traditionellen Registers benutzen zu können, sind sie zu lemmatisieren, d.h. eindeutig einer Institution oder einer Person zuzordnen.

Zeige einen Auszug der Lemmata geordnet nach Regestennummern von Nummer bis an.

Ortsidentifikation

Als primäres Identifikationsmerkmal sind zunächst die Ortsangaben herangezogen worden, an denen eine Institution angesiedelt ist, oder die das Amt einer Person beschreiben.

50445 Datenbankeinträge enthalten Angaben zu Orten oder Patrozinien und können also möglicherweise geographisch genau identifiziert werden.

Dazu wurde versucht, zunächst zu allen Ortsangaben in der Datenbank mit den folgenden Hilfsmitteln moderne Ortsangaben zu finden und in der Datenbank zu speichern:

Aus diesen Daten und den strukturierten Daten der Regesten konnten viele Lemmata automatisch generiert werden. Die automatische Lemmatisierung scheiterte natürlich an uneindeutigen Ortsbezeichnungen. Diese und mit den genannten Hilfsmitteln nicht klar zu identifizierende Angaben müssen von Hand lemmatisiert werden. Diese Arbeit ist noch nicht abgeschlossen.

Derzeit sind 3432 Datenbankeinträge mit Angabe eines Ortes oder eines Patroziniums noch nicht genau identifiziert. Das sind 6.8% der einschlägigen Einträge.

Als Hilfsmittel zu diesen unidentifizierten Angaben enthält die Datenbank auch die Quelle, die Potthast für sein Regest angibt, in rohem OCR. (vgl. http://www.cei.lmu.de/potthast/intern/quellenliste.php)

Die noch nicht identifizierten Datenbankeinträge mit Ort oder Patrozinium findet man unter http://www.cei.lmu.de/potthast/intern/unidentifizierte.php?erschoepfte=true&modus=MGH.

Personenidentifikation

Als nächster Schritt sind Personen eindeutig zu identifizieren und Verweise zwischen Lemmata zu erstellen, die eine Person als Amtsträger an einem Ort bezeichnen, und den Lemmata, die eine Person über ihren Namen identifizieren.


Aktuelle Ausschnitte aus einer möglichen Registeransicht:

A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z


Die Daten dieser Datenbank sind erfaßt worden von Georg Vogeler, Benedikt Hotz, Julian Schulz, Veronika Bischel, Carl Philipp Emanuel Nothaft, Carlo Daniel Pangerl, Katharina Gutermuth u. Martin Jäger unter der Leitung von Georg Vogeler.