Suchmaschinen
1. Wie arbeiten Suchmaschinen
- Suche der Dokumente im Internet
- Suchmaschinen erstellen Abbilder von WWW-Seiten und legen sie in einer Datenbank
ab. Die Inhalte kommen entweder von (automatischen) Robots
(Volltext- oder Roboter-Suchmaschinen) oder werden von Redakteueren
(Kataloge) gewählt.
- Indizierung
- Aus den Web-Seiten wird nun in der Datenbank des Suchmaschinenbetreibers
ein Index erstellt, d.h. die gefundenen Inhalte werden Schlagwörtern
zugewiesen und in die Datenbank aufgenommen. Die Datenbank ist eine Art riesige
Tabelle: In den waagrechten Reihen stehen die Dokumente, in den senkrechten
Spalten die Wörter.
- Retrieval-Systeme
- Das ist die Software, die für das Wiederauffinden der gespeicherten
Daten in einer Datenbank sorgt. Um festzustellen, in welchem Dokument ein
bestimmtes Stichwort vorkommt, durchsucht der Computer einfach die entsprechende
Spalte.
- Suchwerkzeug
- Das Suchwerkzeug ist die Benutzerschnittstelle, über die der Internetuser
seine Suchbegriffe eingeben kann und Informationen suchen kann.
Wenn man einen Suchauftrag abschickt, erreicht man in Wirklichkeit nur einen
kleinen Teil vom Index, somit gehen Frage und Antwort sehr schnell.
2.
Inhalte und Typen von Suchmaschinen
Inhalte und Typen
- Webkataloge, Register
- z.B. Yahoo,
Web.de
Webkataloge entsprechen Inhaltsverzeichnis in einem Buch.
Hier werden die Seiten von Menschen (Redakteuren) durchgesehen und den passenden
Kategorien zugewiesen.
Die Redakteure erfassen die Inhalte und nicht einzelne Wörter!
Eignen sich besonders als Einstiegsseiten zu einem größeren Gebiet, z.B. "Snowboard",
"Psychologie" etc. Kataloge sind Verzeichnisse, die von Redakteuren
zusammengestellt sind. Hier kann man mit Schlagworten bzw. Überbegriffen arbeiten.
- Volltext-Suchmaschinen (Roboter-Suchmaschinen, WWW-Searchengines)
- Suchmaschinen entsprechen dem Stichwortindex in einem Buch.
Dafür werden sogenannte Spider oder Robots eingesetzt. Diese
fordern alle ihnen bekannten Dokumente anhand einer Adressliste aus dem Web
an. Diese Dokumente durchsuchen sie nach neuen Adressen (Links), die sie dann
ebenfalls abrufen und ihrer Liste hinzufügen. Sie durchforsten das Web Tag
und Nacht nach neuen oder geänderten Web-Seiten, dabei können sie tausend
Web-Seiten gleichzeitig abfragen.
Die Robots aller Suchmaschinen liefern auf jeden Fall die Adresse und den
Titel einer Web-Seite an die Datenbank.
Die Robots merken sich vor allem spezielle Wörter aus
dem Quellcode der Seite (erste Wörter, Titel, Schlüsselwörter)
Volltext-Suchmaschinen eignen sich besonders für die Suche nach Eigennamen,
ausgefallenen Begriffen oder speziellen Begriffkombinationen.
Beispiele: Google, Bing,
AltaVista
- Meta-Suchmaschinen
- schicken die Suchanfrage an andere Suchmaschinen weiter. Die Suche dauert
etwas länger.
"Doubletten" (doppelte Treffer) können bei
manchen Meta-Suchmaschinen ausgeschaltet werden.
"Sammelsucher" sind Suchmaschinen, die Suchergebnisse
mehrerer Suchmaschinen hintereinander anzeigen.
Ranking
Ergebnisse einer Suche werden in Trefferlisten ausgegeben. Diese Liste muss
nach bestimmten Kriterien gereiht werden ("ranking"). Jede Suchmaschine
verwendet einen anderen Algorithmus (Rechenmethode)
Beispiele:
- nach der Häufigkeit, mit der Suchbegriffe in den Seiten
vorkommen. Je öfter ein Begriff in einer Seite vorkommt, umso weiter
oben in der Trefferliste wird die Seite gezeigt
- je mehr Links von anderen Seiten auf eine Seite
verweisen, desto weiter oben wird diese Seite gezeigt
- die ersten Plätze im Ranking können gekauft
werden. Man bezahlt dafür, dass man bei bestimmten Suchbegriffen
auf den ersten Plätzen angezeigt wird.
3.
Suchlogik und Suchstrategien
Kriterien für Suchmaschinen
- Usability
- Benutzerfreundlichkeit und Benützbarkeit
- Performance
- Dauer der Bearbeitung von Suchanfrage bis Trefferliste
- Aktualität
- Funktionieren die Links in der Trefferliste?
- Tiefe der Indizierung
- Wie viel Prozent der Inhalte von Websites werden indiziert - und dann auch
gefunden?
Suchparameter
- Boole'sche Suchlogik (kann meist über 'erweiterte Suche' angewendet werden)
- zur Verknüpfung von mehreren Suchbegriffen.
- Einschränkung der Ergebnisse: AND, +; bzw.
NOT, -
AND (+): alle Suchbegriffe müssen im Suchergebnis vorkommen.
Viele Suchmaschinen haben diese Verknüpfung als Standard, d.h. auf das +
kann verzichtet werden.
NOT (-) der dem NOT folgende Begriff darf nicht im Suchergebnis
vorkommen.
- es gilt die Regel "Punktrechnung vor Strichrechnung", d.h. durch
Klammerung können verschiedene Operatoren verknüpft werden:
Beispiel: Suche nach Roggen- oder Weizenbrot ohne Kümmel
+Brot +(Roggen Weizen) -Kümmel
- Erweiterung der Suchergebnisse: OR bzw. Leerzeichen
- NEAR - hier müssen die Suchbegriffe im gefundenen Dokument in unmittelbarer
Nähe zueinander stehen (meist nicht mehr als 10 Wörter auseinander)
- FAR - Suchbegriffe können mehr als 10 Worte entfernt
sein
- ADJ - Suchbegriffe müssen unmittelbar nebeneinander
stehen
- BEFORE - Das Wort soll vor dem Suchbegriff vorkommen
- Phrasensuche (Zitat): Bestimmte exakte Wortfolgen ("Wachauer
Marille") können durch Setzen von Anführungszeichen gesucht werden.
- erweiterte Suche
- erweiterte Suche: hier kann nicht nur im Inhalt der Dokumente gesucht
werden, sondern auch im Titel, in Links, in der URL, in Metafeldern etc.;
außerdem kann man Dateiformate, Datum, Sprache etc. einschränken.
Beispiel:
Erweiterte Suche mit Google

Joker und Wildcards (* )
- können gesetzt werden. So kann man beliebige Wortteile ersetzen. Anwendung
für beliebige Endungen(z.B. Rasen* für Rasenmäher,
Rasendünger, Rasensamen usw.) oder Beachtung verschiedener Schreibweisen
(z.B. Gra*ik für Grafik oder Graphik)
- Weitere Einschränkungen:
- image: Suche von Bildern mit Suchbegriff
(z.B. image: Biene)
- title: Suche im Titel
von Dokumenten
- url: der Suchbegriff bezieht sich
auf Inhalte einer URL
- domain: Suchbegriff bezieht sich
auf einen Domänennamen
Suchstrategien
- Je mehr man die Informationen eingrenzen kann, desto einfacher und schnelle
kann die Information gefunden werden (Achtung: zu starkes Eingrenzen kann
kann sinnvolle Treffer ausschließen!)
- erweiterte Suchoptionen verwenden!
- es gibt keine "Allround-Suchmaschine" - wenn eine Suchmaschine
nicht das gewünschte Ergebnis bringt, sollte man es bei einer anderen
versuchen
- klare Vorstellungen --> eher Volltext-Suchmaschinen
- unklare Vorstellungen --> eher Kataloge
4.
Suchmaschinen
Hier werden beispielhaft einige Suchmaschinen aufgezählt. Mischformen
der folgenden Typen sind anzutreffen, d.h. Volltext-Suchdienste bieten auch
Kataloge (z.B. Google --> Verzeichnis)
Volltextsuchmaschinen
Sie suchen nach Suchbegriffen in Dokumenten
- Google (www.google.at)
- Bing (von Microsoft)
- AltaVista (www.altavista.at)
- Abacho (www.abacho.at)
- Lycos (www.lycos.at)
- AllTheWeb (www.alltheweb.com)
- Fireball (www.fireball.de)
- MSN (search.msn.at)
Web-Kataloge
Kataloge bieten Inhalte nach Themen geordnet und von Redakteuren
zusammengestellt.
- Yahoo (www.yahoo.de)
- Web.de (www.web.de)
- AllesKlar (www.allesklar.de)
Meta-Suchmaschinen
Metasuchmaschinen leiten die Anfrage an andere Suchmaschinen
weiter. Sie ermöglichen damit das Suchen in mehreren Suchmaschinen gleichzeitig.
- Profusion (www.profusion.com)
- Metager (www.metager.de)
- Metaspinner (www.metaspinner.de)
- avana.de (www.avana.de)
- Klug Suchen! (www.klug-suchen.de)
- Suchfibel (www.suchfibel.de) - Wissenswertes über
Suche und Suchmaschinen!
Spezielle Suchmaschinen
mit einem eingegrenzten Themenbereich
- Telefonbuch (www.etb.at) (Herold)
- Fahrplanabfrage der ÖBB (fahrplan.oebb.at)
- Wörterbücher und Lexika (z.B. www.wissen.de)
