search_index - Indizierung
Eingetragen von AliceD (32)
am 09.05.2008 - 15:52 Uhr in
am 09.05.2008 - 15:52 Uhr in
Hi,
ich beschäftige mich gerade mit dem optional core modul "search" und hab diesbezüglich noch ein paar Fragen.
1. Wie ich bis jetzt gelesen habe, wird bei einer reindexierung der index nicht gelöscht sondern nur aktualisiert, aber was genau wird da aktualisiert?
2. Wenn Beiträge (nodes) gelöscht werden, werden dabei auch die dazugehörenden Wörter aus dem Index gelöscht?
3. Beim Ausführen des Crons werden nur neue Wörter dem Index hinzugefügt oder wird dann alles aktualisiert?
4. Welcher intervall ist für den cronjob ratsam?
Ihr merkt also, mir ist noch einiges unklar :) Danke für eure Hilfe.
- Anmelden oder Registrieren um Kommentare zu schreiben
Hallo AliceD, 1) Zuerst
am 15.05.2008 - 09:08 Uhr
Hallo AliceD,
1)
Zuerst werden alle nodes zum reindizieren markiert. Bei einem Cronlauf werden immer nur eine begrenzte Anzahl an nodes indiziert, um einen Abbruch durch zu lange Laufzeit zu verhindern.
Beim nächsten Cronlauf werden dann alle neuen, aktualisierten und zum reindizieren markierten nodes gesucht und die festgelegte Anzahl pro Conjob indiziert.
Zum reinidizieren markierte nodes werden hier neu erstellten oder aktualisierten nodes vorgezogen.
Beim reinindizieren werden die alten Daten erst gelöscht, wenn diese neu reindiziert werden. Lediglich die Verweise anderer Seiten auf diese Seite werden nicht gelöscht.
Aktualisiert werden die enthaltenen Wörter (der Inhalt der Seite) und das Scoring der einzelnen wörter anhand ihrer Häufigkeit, evtl HTML Tags sowie durch module geänderte Bewertungen bestimmter Wörter/HTML Tags.
2)
ja
3)
Es werden nur neu erstellte oder aktualisierte nodes/comments hinzugefügt/aktualisiert.
4)
Dies kommt darauf an wie groß/frequentiert deine Seite ist.
In Bezug auf die Suche: Wenn oft und viel neuer Content/Comments erstellt werden und dieser Zeitnah per Suchfunktion auffindbar sein soll, sollte man den Cronjob stündlich/alle paar Stunden laufen lassen, ansonsten reicht es auch dies einmal am Tag oder noch seltener zu tun.
Grüße,
Robin
Filter auf Indizierung für Suche
am 18.01.2012 - 03:07 Uhr
mich würde interessieren ob ich die art der nodes welche für die suche indiziert werden, vorher festlegen kann. -> also quasi bedingungen stellen an die nodes welche indiziert werden sollen -> quasi ein Filter.
Hat jemand ne Idee wie man da vorgehen könnte?
also einfacher wäre wahrscheinlich wenn man einfach bestimmten 'types' rausfiltern könnte.
noch toller bzw. für mich hilfreicher wenn ich nach bestimmten 'term_nodes' eingrenzen könnte.
Weiss jemand welche funktionen man da manipulieren könnte?
thx n greetz
mb
Vielleicht einfach nur die
am 18.01.2012 - 10:10 Uhr
Vielleicht einfach nur die Ausgabe eingrenzen etwa mit [do:search_config].
Beste Grüße
Werner
thx für die Antwort aber das
am 18.01.2012 - 12:57 Uhr
thx für die Antwort aber das bringt es für uns nicht -> weil uns der indizierungsprozess eher zu schaffen macht -> wir generieren so viel content dass die indiziererei einfach nicht hinterherkommt.
deshalb wärs toll wenn wir beim inidzieren schon sagen könnten dass er nur bestimmte nodes indiziert.