'Datenablage' für Strukturierte Daten
am 01.11.2009 - 11:04 Uhr in
Hallo,
momentan arbeite ich gerade an einer Webseite, die mit Drupal laufen soll.
Konkret arbeite ich gerade an verschiedenen Modulen. Eines davon soll eine
Terminliste sein, welches ein wenig mehr felder als nur Datum/Uhrzeit und Beschreibung
enthalten soll. Nun soll diese Liste der Daten, wie auch alle anderen Seiten
"durchsuchbar" sein. Daher stellt sich für mich die folgenden Fragen:
a) Werden beim Index-lauf die Webseiten selbst durchsucht (also die, die generiert
wurden) oder durchsucht der Indexer die Datenbank selbst?
b) Wenn ich die Daten erfasse, wo soll ich sie speichern? Eine eigene
Tabelle ginge ja oder gibt es eine zentrale Datensenke für strukturierte
Daten. (Gerade im Hinblick auf a ist die Speicherung für mich wichtig).
Danke schonmal für eure Hilfe!
Marc
- Anmelden oder Registrieren um Kommentare zu schreiben
Re: 'Datenablage' für Strukturierte Daten
am 01.11.2009 - 12:51 Uhr
a) Werden beim Index-lauf die Webseiten selbst durchsucht (also die, die generiert
wurden) oder durchsucht der Indexer die Datenbank selbst?
Weder noch. Es werden PHP-Objekte indiziert. Bei Nodes passiert das indem der Node geladen und gerendert (in HTML übersetzt) wird. Das HTML wird dann analysiert und die entsprechenden Indexeinträge werden angelegt.
Das hat einen entscheidenden Vorteil gegenüber der Indizierung der eigentlichen Webseiten: Blöcke und sonstige Angaben, die zufälligerweise auf der Node-Seite auftauchen, werden nicht als Bestandteil des Nodes indiziert.
Der Nachteil gegnüber der Durchsuchung der Datenbank: Die Relevanz von Suchergebnissen hängt von dem Theme ab. Nicht alle HTML-Tags haben das gleiche Gewicht bei der Berechnung der Relevanz. Man kann also die Relevanz von Suchergebnissen beeinflussen indem man am Theme rumdoktort.
Natürlich können Zusatzmodule zusätzliche Daten als Teil des Nodes indizieren lassen (
hook_nodeapi($op = 'update index')
), auch wenn diese Daten bei der Darstellung des Nodes nicht angezeigt werden.b) ... gibt es eine zentrale Datensenke für strukturierte
Daten.
Ich verwende meistens das Content Construction Kit.
--