Skocz do zawartości

Zdjęcie
* * * * * 1 głosy

.htaccess jak skutecznie zablokować indeksowanie strony

blokada botów indeksujących boty przeglądarek robot google blokada robotów

4 odpowiedzi w tym temacie
  • Zaloguj się, aby dodać odpowiedź
zonic

    WT Elite

  • 2 911 postów
    • Czas spędzony online: 134d 2h 28m 23s
472
Znakomita!
  • LocationToruń

Napisano 09 lutego 2014 - 18:02

#1

Hej, 
jak powinien wyglądać plik .htaccess żeby skutecznie zablokować indeksację stron przez najpopularniejsze roboty?


  • 0

Michał

    Stary wyjadacz

  • 301 postów
    • Czas spędzony online: 16d 7h 11m 3s
95
Znakomita!

Napisano 09 lutego 2014 - 23:32

#2

Zablokuj IP(jeśli znany), albo zablokuj user_agenta:

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|Jakieś_Coś) [NC]
RewriteRule .* - [R=403,L]

[źródło
 


Możesz praktycznie to samo zrobić w PHP:

if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
    exit;
}

 

Nie możesz po prostu wykluczyć robota z pliku robots.txt? ;) No chyba że jest nieposłuszny.

 

Swoją drogą czemu nie chcesz indeksować strony?


  • 0

zonic

    WT Elite

  • 2 911 postów
    • Czas spędzony online: 134d 2h 28m 23s
472
Znakomita!
  • LocationToruń

Napisano 10 lutego 2014 - 19:31

#3

Zablokuj IP(jeśli znany), albo zablokuj user_agenta:

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|Jakieś_Coś) [NC]
RewriteRule .* - [R=403,L]

[źródło
 


Możesz praktycznie to samo zrobić w PHP:

if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
    exit;
}

 

Nie możesz po prostu wykluczyć robota z pliku robots.txt? ;) No chyba że jest nieposłuszny.

 

Swoją drogą czemu nie chcesz indeksować strony?

Dzięki :)

A strony nie chcę indeksować, bo na razie jest tylko testowana itd ;) Nie chcę żadnych śmieci zapamiętanych przez google


  • 0

kontownik

    Nowy użytkownik

  • 33 postów
    • Czas spędzony online: 58m 57s
2
Neutralna

Napisano 17 lutego 2014 - 11:13

#4

A co jest lepsze do zablokowania indeksowania .htaccess czy robots.txt wystarczy?


  • 0

unbreak

    WT Elite

  • 1 937 postów
    • Czas spędzony online: 27d 8h 43m 36s
506
Znakomita!
  • Location/home/unbreak

Napisano 17 lutego 2014 - 11:33

#5

Myślę że htaccess, możesz poczytać o robots.txt - to jest tylko wskazówka dla botów (zdarza się że jej nie słuchają).


  • 0

webDeveloper






Podone tematy Collapse

Użytkownicy przeglądający ten temat: 0

0 użytkowników, 0 gości, 0 anonimowych