Sandra Peters: Suchdienste
Webkataloge
- viele Suchmaschinen bieten zusätzlich Webkataloge an, in denen man Webseiten gegliedert nach Themen und Inhalten suchen kann
- im Gegensatz zur Suchmaschine unterliegt der Inhalt des Web-Kataloges einer redaktionellen Kontrolle, nicht alle Seiten die vorgeschlagen werden, kommen in das Verzeichnis
- dadurch ist die Qualität der Suchergebnisse wesentlich höher als bei Suchmaschinen
- listen inhaltlich zusammengehörige Internatangebote gesammelt auf, ideal, wenn zunächst nur Überblick des Themengebiets notwendig ist
- Ergebnisse sind viel strukturierter und sinnvoller als bei Suchmaschinen
- Finanzierung erfolgt hauptsächlich durch Werbung und andere Zusatzdienste
- Problem: einen Katalog aktuell zu halten, ist bei dem expansiven Wachstum des Internet sehr schwierig, darunter leidet die Aktualität und Vollständigkeit eines Katalogs
- manche, die in der Frühphase des Internets erfolgreich waren, konnten sich nicht mehr behaupten, gelingt nur den größten Anbietern
Bsp. : Rohrleitungselement
www.allesklar.de
- umfangreichster, deutscher Webkatalog
- das Besondere bei Allesklar ist die regionale Suche: Die Suchanfragen können mit Orts- und Stadtnamen verknüpft werden
- Partner: Fireball
- Treffer: 0
www.web.de
- mehr als 270.000 Einträge
- Postkarten
- Stiftung Warentest: 2,7 (Platz 6)
- Treffer: 12
www.dino-online.de
- deutschsprachiger, manuell erstellter Katalog
- 200.000 Links zu deutschsprachigen Seiten werden verwaltet
- Dino Surf-Tip, eine ausführliche Site mit einer Sammlung internationaler TOP-Links, den Worlds Best Sites, einen Reuters Nachrichtenbereich und einige redaktionelle Themen, seit neustem einen daily cartoon
- Treffer: 3
www.dmoz.org
- europäischer Katalog
- Open Directory Projekts (OPD) - Katalog
- mit über 3 Mio. Einträgen in mehr als 450 000 Kategorien der größte und umfassendste Webkatalog
- handelt sich nicht um eine Firma, sondern um über 30.000 freiwillige Editoren, die ihren Dienst kostenlos zur Verfügung stellen
- Treffer: 0
www.yahoo.de
- älteste, meistgenutzte und populärste Webkatalog
- Begründer: David Filo und Jerry Yang (Methode zum Sammeln ihrer Lieblings-Links, 1994, seit 96 in Deutschland)
- steht für: "Yet Another Hierarchical Officious Oracle" Wortwörtlich übersetzt klingt das etwa so: "Jetzt noch ein anderes, hierarchisches, aufdringliches Orakel"
- Eine andere Geschichte ist, daß Jerry Yang immer, wenn er einen guten Link fand, "Juhu" gerufen hätte, englisch "Yahoo"
- hat über 1,5 Mio. Einträge
- wird im Monat von mehr als 200 Mio. Personen in 24 Ländern und 12 Sprachen genutzt
- Suche in Yahoo wird vorrangig im Yahoo-Katalog durchgeführt, konnte im Katalog kein Ergebnis erzielt werden, liefert Google die Ergebnisse
- Anmeldezeit extrem lang, darunter leidet die Qualität
- Stiftung Warentest: 2,6 (Platz 5)
- Treffer: 6
Suchmaschinen allgemein
- auch Spider, Crawler oder Robot genannt
- ein Software-Paket für das Internet, dient dazu, möglichst viele Web-Seiten zu durchsuchen
- die meisten Suchmaschinen bestehen aus 2 Komponenten:
- die erste Komponente verbindet den Benutzer mit der Suchmaschine, er kann die Suchanfrage über eine Schnittstelle stellen
- diese wird dann an ein Verarbeitungsprogramm weitergeleitet, das die Ergebnisse aus der Datenbank (bei Suchmaschinen Index genannt) aufbereitet zurückliefert
- die zweite Komponente dient zur Erstellung der Datenbank, die aus 2 automatisierten Programmen besteht:
dem Crawler (auf dt. Spinne) und
dem Indexer (nimmt die neuen Dokumente im Index auf)
www.fireball.de
- neue Version, überarbeitetes Layout
- eine der leistungsfähigsten Suchmaschinen im deutschsprachigen Raum
- durchsucht auch deutschsprachige Seiten auf ausländischen Servern, die nicht auf einer .de - Domain liegen
- Stiftung Warentest: 3,6 (Platz 14)
- Treffer: 1
www.abacho.de
- seit März 2000 online
- früher aladin.de
- etwas mit Werbung überladen
- verschiedene Suchmöglichkeiten, wie z.B. "Live-Suche", hier kann man live sehen, was gerade auf Abacho gesucht wird, oder Bildersuche, Reeves eingeben ...
- Treffer : 123
www.altavista.de
- Bei der Namensfindung stand auf einer nicht richtig gewischten Tafel: Alto - der zweite Teil des Ortsnamen Palo Alto in Kalifornien-USA. Daraus wurde über Alto Vista der Begriff Alta Vista das bedeutet: Blick von oben
- lange Zeit die bekannteste Suchmaschine
- Anfang 2001 einen geplanten Börsengang ab und entließ Hunderte von Mitarbeitern
- im letzten Jahr vier Monate lang versäumt ihren Index zu aktualisieren
- 42 Mio Seiten im deutschsprachigen Web
- jetzt versuchen sie, gegenüber Google wieder aufzuholen
- arbeiten mit LookSmart zusammen, ein Webkatalog, der nur gegen Bezahlung listet
- Ranking
- Worte, die am Textanfang stehen haben mehr Gewicht als Worte am Textende
- Mehrfachnennung von Worten
- Keywords in Meta-Tags
- Link-Popularität
- Treffer : 7
www.msn.de
- da von den MSN Mitgliedern offenbar jugendgefährdendes Material auf deren Webseiten gestellt wurde, machte man das gesamte Mitgliederverzeichnis, auf dem die Homepages veröffentlich werden können, dicht
- dazu wurden in der MSN Suche die vermeintlich jugendgefährdenden Wörter gesperrt. Wer einen verdächtigen Begriff wie "sex" eingibt, bekommt die Meldung, dass solcherlei Begriff nur für Erwachsene sei und derzeit nicht angezeigt würde
- Stiftung Warentest: 2,9 (Platz 7)
- Treffer : 120
www.excite.de
- besteht seit 1995 und ist eine der größten Internet-Suchmaschinen
- deutsche Portalsite wurde 2001 vom ursprünglichen Betreiber aufgegeben
- 2002 erwarb Tiscali die Rechte, der Katalog wird von OPD geliefert
- täglich werden 3 Millionen Seiten bearbeitet
- Partner: FindWhat, nur bezahlte Listings
- 2000 angeklagt, weil sie bei den Suchbegriffen Playboy und Playmate Banner von Hardcoreporno-Anbietern eingeblendet hatten
- Klage von Playboy abgelehnt --> wenn man Werbebanner Dritter einblendet, verstößt das nicht gegen das Wettbewerbsrecht
- Ranking
- Schlüsselwörter im Title haben mehr Gewicht als Schlüsselwörter im Text
- Mehrfachnennungen von Schlüsselw&puml;rtern im Text verbessern das Ranking
- Link-Popularität
- Treffer: 3
www.google.de
- die Geschichte von Google begann im Januar 1996
- damals machten sich die beiden Studenten Larry Page und Sergey Brin daran, eine Suchmaschine mit dem Namen BackRub zu programmieren
- da sich aber keiner der großen Portale wie Yahoo! für die Suchtechnologie interessierten, bemühte man sich um ein wenig Startkapital und gründete die Firma Google
- 1998 war es dann soweit, Google ging online
- der Name Google leitet sich übrigens von dem Wort "Googol" ab. Mit Googol wird die Zahl 1 gefolgt von 100 Nullen bezeichnet
- heute gibt es Google in 84 Sprachen und man beantwortet täglich mehr als 100 Millionen Suchanfragen
- durchsucht auch PDF-Dateien und findet Word-, Exel- und Powerpoint-Dokumente
- Ranking
- Link-Popularität
- Stiftung Warentest: 2,1 (Platz 1)
- Treffer: 12
Fabian Schaffner: Suchdienste – Funktionsweise
- grundsätzlich: automatische und manuelle Datenaquisition
- Datenbanken werden durch sog. Softwareroboter (Softbots) informiert
- Diese bestehen aus:
- Informationssammmlern
– robots, crawler, spiders, wanderers, gatherers, harvesters etc.
– ~ durchsuchen Hypertextstruktur des Netzes
– folgen Links in HTML-docs
– folgen Wörtern in Texten/Überschriften usw.
– * robots exclusion standard: robots.txt im root- Verzeichnis, auf freiwilliger Basis, hält crawler von best. Teilen einer Seite fern ( im Aufbau o.ä.)
- Indizierungsoftware
– Ergebnis geht an Indexdatenbank (Repository, Lexikon)
- Schnittstelle für Suchanfragen
– klassische Suchmaske, Eingabefelder etc. (u.ä. boolsche Operatoren)
– Sucherfolge verschieden: von 3% bis 34%
– "page-rank" (Google): Anzahl der Links, die auf eine Seite verweisen
– andere Arbeitsweisen: Aktualität, Übereinstimmung mit Wörtern in Überschrift, Metatext usw. (Beeinflussbarkeit?)
Links: avaris-webdesign.de/suchmaschinen
zurück zum seminarprogramm
|