path-auto und i18n Modul sorgen für duplicate content
am 09.08.2011 - 13:10 Uhr in
Hallo Leute,
ich betreibe einen ubercart Shop, den ich zu Beginn in deutsch aufgebaut habe. Nun nach einer Weile wollte ich den Shop auf Englisch übersetzen und auch das war bisher alles gut zu realisieren.
Die Seitenstruktur ist so:
node/60 -> www.url.de/katalog/marke/produkt - da ich von anfang an mit der deutschen SPrache gearbeitet habe, gibt es da kein Sprachen Präfix
die englische Übersetzung der node/60 ist node/145 und sieht so aus:
www.url.de/en/catalogue/brand/product
Nun stoße ich jedoch auf folgendes Problem:
Meine Pfad Aliase sind auf "Sprache: deutsch" gestellt als Folge dessen gibt es nun
www.url.de/en/node/60 - das unangenehme dabei ist, dass das Interface wie Warenkorb, Mengenfeld etc nun auf Englisch angezeigt werden, node/60 ist aber wie man oben sieht eine deutsche Seite
Wenn ich das Pfad Alias für node/60 auf "alle Sprachen" umstelle wird aus: www.url.de/en/node/60 -> www.url.de/en/katalog/marke/produkt -> das EN dürfte da nicht sein
Nicht nur dass das Interface in Englisch ist und nun die beiden Sprachen vermischt sind, habe ich auch noch duplicate content und das ist mein tatsächliches problem, google mag das nicht und ich will meinen ersten Platz nicht verlieren.
Grundsätzlich stelle ich mir nun die Frage welchen Lösungsansatz ich überhaupt verfolgen soll, mein Ziel ist das der Zugriff auf deutschen content mit dem /en/ präfix gar nicht möglich ist bzw korrekt umgeleitet wird. Denn jeglicher deutscher content ist im Moment per www.url.de/en/node/xxx verfügbar - also einen Haufen duplicate content und vermischte Sprachen.
Habe ich das Problem weil ich bei der Spracherkennung Pfad Präfix mit Rückfallsprache (also deutsch) gewählt habe?
Einen Teil des Problems kann ich in den Griff bekommen in dem ich alle Pfad Aliase auf "alle Sprachen" stelle, aber das hilft mir mit dem duplicate content nicht weiter. Es darf einfach nicht sein, dass eine deutsche Seite auch mit dem /EN/ Präfix verfügbar ist.
Ich könnte wirklich Hilfe gebrauchen, ein paar Ideen, Input eben :)
Danke & Grüße
- Anmelden oder Registrieren um Kommentare zu schreiben
Zuerst würde ich einmal alle
am 09.08.2011 - 14:23 Uhr
Zuerst würde ich einmal alle /node* pfade in der robots.txt ausschließen, dann kann es mal keine Probleme mit duplicated content geben.
Wenn alles passt sollte es aber gar nicht passieren können dass ein /node/xx pfad indexiert oder aufgerufen wird, weil ja immer die Node in der richtigen Sprache angezeigt/gelistet wird.
Eine deutsche Seite mit dem en präfix aufrufbar zu haben hat den Vorteil dass beim Erstellen oder Editieren nicht immer die Sprache gewechselt werden muss...
Um ganz sicher zu gehen kann
am 09.08.2011 - 14:47 Uhr
Um ganz sicher zu gehen kann man dann noch einen cannonical url angegeben: http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=139394
Das nodewords Modul zB unterstützt das.