Grundlagen der Suche im Zeitungsportal

Das Suchziel sind einzelne Tagesausgaben, nicht die Zeitung in ihrer Gesamtheit und nicht die Einzelseite. Die Suchtreffer werden chronologisch nach Tagesausgaben gelistet und lassen sich über die Facetten auf der rechten Seite nach Orten und Zeiträumen filtern.

Sie können nach einzelnen Wörtern, nach mehreren Suchbegriffen oder nach Phrasen suchen; Groß- oder Kleinschreibung der Wörter wird nicht berücksichtigt.

Exakte Suche

Bei einer exakten Suche werden Stemming und Rechtstrunkierung nicht angewendet (zu diesen Begriffen siehe weiter unten den Abschnitt "Erläuterungen"). Soll nach genau einem Wort in dieser Form gesucht werden, wird es in doppelte Anführungszeichen gesetzt: Die Suche nach "Gott" findet nur Gott. Auch Umlaute werden berücksichtigt: Die Suche nach "schwul" findet genau dieses Wort und keine Treffer für schwül, Schwüle oder schwulstig.

Bei der Suche z. B. nach (Personen-)Namen läßt sich das Stemming der Phrasensuche mit einem Ausrufezeichen unterdrücken: Soll der exakte Name Maria Eck gefunden werden, wird so gesucht: "Maria Eck"!

Auch längere Phrasen werden so gefunden: "auf eine Rede Bismarcks"! findet ausschließlich diese Phrase.

Unscharfe Suche

Eine unscharfe Suche ist eine Suche mit einem oder mehreren Wörtern, die nicht in doppelte Anführungszeichen gesetzt werden. Bei dieser Suche erhalten Sie aufgrund des Stemmings und der Rechtstrunkierung alle Suchtreffer angezeigt, die das gesuchte Wort und seine Varianten umfassen.

Die Suche nach Salz findet auf unterschiedlichen Seiten der gleichen Tagesausgabe z. B.: Salz, Salzmann, Salzderhelden, Salzmagazinstraße.

Unscharfe Suche mit mehreren Suchbegriffen

Werden mehrere Suchbegriffe als unscharfe Suche – also ohne doppelte Anführungszeichen – eingegeben, enthalten die Suchtreffer zu einer Tagesausgabe einen oder alle gesuchten Begriffe (je nachdem, wieviele der gewählten Suchbegriffe in der Ausgabe gefunden werden).

Die Suche nach Sonne Mond findet auf unterschiedlichen Seiten der gleichen Tagesausgabe z. B.: Sonnenaufgang, Mond, Sonne, Mondkrater.

Da Stoppwörter nicht berücksichtigt werden, findet eine einfache Suche nach Anna und Elisabeth auf verschiedenen Seiten einer Tagesausgabe z. B.: Elisabeth, Anna, Annahme, Annäherung – aber nicht die exakte Phrase Anna und Elisabeth.

Phrasensuche

Die Suche nach einer Phrase sucht nach Wörtern in unmittelbarer Nachbarschaft: Sie wird mit doppelten Anführungszeichen durchgeführt. Auch hier ist das Stemming aktiviert. Im Unterschied zur unscharfen Suche werden Stoppwörter (siehe dazu weiter unten den Abschnitt "Erläuterungen") bei der Suche nicht ignoriert sondern einbezogen und es wird nur nach der eingegebenen Wortfolge gesucht.

Die Suche nach "Maria Eck" findet genau diese Wortfolge und ergibt aufgrund des Stemmings Treffer für Maria Eck, Maria Ecke und Maria Ecker. Die Suche nach "Anna und Elisabeth" ergibt genau diese Phrase.

Unscharfe Suche und Phrasensuche lassen sich kombinieren: Mit der Suche "Erzherzog Karl Ludwig" Wallfahrtsort können z. B. Artikel gefunden werden, die über den Besuch eines Wallfahrtsortes durch den Erzherzog berichten.

Die Suche nach mehreren Phrasen ist ebenfalls möglich: "auf gut Glück" "englische Schiffe" findet Tagesausgaben in denen beide Phrasen in unterschiedlichen Artikeln vorkommen; aber auch Tagesausgaben in denen beide Phrasen im gleichen Artikel enthalten sind.

Abstandssuche

Mit der Abstandssuche läßt sich die Anzahl der gefundenen Treffer eingrenzen.

Sollen z. B. Artikel gefunden werden, die das Fischgrät(en)-Muster von Kleidung erwähnen, kann der Abstand definiert werden, der zwei oder mehr Wörter maximal trennen darf. Die Eingabe des Abstands erfolgt hinter der Phrase mit einer Tilde, z. B. "Fischgräten Muster"~10 (findet Muster, Fischgrät(s), Fischgrat- und Fischgräten-Muster), der Mindestabstand für die Suche beträgt 1.

 

Erläuterungen

Stemming

Die Suche nach einem Suchterm wie z. B. Wortes findet nicht nur diesen Suchterm selbst, sondern auch Varianten dieses Begriffs, die sich aus dessen Stemming ergeben (vgl.: Stemming).

Stemming heißt: Die Varianten eines Wortes werden auf ihren gemeinsamen Wortstamm zurückgeführt; im Fall der Suche nach Wortes werden u. a. gefunden: Wort, Worten, Wörter oder Wortes.

Rechtstrunkierung

Die Rechtstrunkierung ersetzt beliebig viele Zeichen am Ende des Wortes.

Bei der Suche nach Hose wird nicht nur der Suchterm Hose gefunden, sondern u.a. auch die Begriffe Hosen, Hosenröhren, Hosenmatz, Hosenträger, Hosengasse.

Stoppwörter

Bei der unscharfen Suche werden Stoppwörter nicht berücksichtigt (vgl.: Stoppwort).

Stoppwörter sind z. B. bestimmte Artikel ('der', 'die', 'das'), unbestimmte Artikel ('einer', 'eine', 'ein'), Konjunktionen (z. B. 'und', 'oder', 'doch', 'weil') und häufig gebrauchte Präpositionen (z. B. 'an', 'in', 'von') sowie die Negation 'nicht'.

Hinweise zur OCR/Texterkennung

Eine optische Zeichenerkennung (OCR) vor allem historischer Druckschriften wird kein zu 100% korrektes Ergebnis erbringen. Dies hat unterschiedliche Gründe: die Graphie des Textes (Antiqua oder Fraktur) spielt eine Rolle; die Qualität der Vorlage von der gescannt wurde (historische Zeitungsseiten können schlecht erhalten, schadhaft, faltig oder wellig sein); die Verfilmung des Originals war von keiner optimalen Qualität ... Alle diese Faktoren können dazu führen, dass einzelne oder mehrere Buchstaben von der OCR falsch gelesen und interpretiert werden – und dann in dieser falschen Erkennung im durchsuchbaren Volltext erscheinen.

Das OCR-Ergebnis des Textes links weist zahlreiche OCR-Lesefehler auf:

Fehlerhafte OCR

Besonvere Anzeigen.

1) Die 58te Ziehung der Hochs. Wied=Neu-
wiedischen privilegirt. Zahlenlotterie ist Sams-
tag den ruten Jänner 1704 in Gegenwart der
Furstl. Intendance und ubrigen dazu verord-
neten Personen mit den gewohnlichen Solem-
nitäten vollzogen, und nachstehende Nummern
aus dem Glucksrade gehoben worden:
76. 39. J. 84. 18.
Die sote ziehung geschiehet den 18ten Jänner
1794, und so fort von 8 zu 8 Tagen." (aus: Welt- und Staatsboth zu Köln vom 16. Januar 1794)