Jump to content

Photo
* * * * * 1 votes

.htaccess jak skutecznie zablokować indeksowanie strony

blokada botów indeksujących boty przeglądarek robot google blokada robotów

4 replies to this topic
  • Please log in to reply
zonic

    WT Elite

  • 2911 posts
    • Czas spędzony online: 134d 2h 28m 23s
472
Znakomita!
  • LocationToruń

Posted 09 February 2014 - 18:02

#1

Hej, 
jak powinien wyglądać plik .htaccess żeby skutecznie zablokować indeksację stron przez najpopularniejsze roboty?


  • 0

Michał

    Stary wyjadacz

  • 301 posts
    • Czas spędzony online: 16d 7h 11m 3s
95
Znakomita!

Posted 09 February 2014 - 23:32

#2

Zablokuj IP(jeśli znany), albo zablokuj user_agenta:

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|Jakieś_Coś) [NC]
RewriteRule .* - [R=403,L]

[źródło
 


Możesz praktycznie to samo zrobić w PHP:

if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
    exit;
}

 

Nie możesz po prostu wykluczyć robota z pliku robots.txt? ;) No chyba że jest nieposłuszny.

 

Swoją drogą czemu nie chcesz indeksować strony?


  • 0

zonic

    WT Elite

  • 2911 posts
    • Czas spędzony online: 134d 2h 28m 23s
472
Znakomita!
  • LocationToruń

Posted 10 February 2014 - 19:31

#3

Zablokuj IP(jeśli znany), albo zablokuj user_agenta:

RewriteEngine On
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|Jakieś_Coś) [NC]
RewriteRule .* - [R=403,L]

[źródło
 


Możesz praktycznie to samo zrobić w PHP:

if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
    exit;
}

 

Nie możesz po prostu wykluczyć robota z pliku robots.txt? ;) No chyba że jest nieposłuszny.

 

Swoją drogą czemu nie chcesz indeksować strony?

Dzięki :)

A strony nie chcę indeksować, bo na razie jest tylko testowana itd ;) Nie chcę żadnych śmieci zapamiętanych przez google


  • 0

kontownik

    Nowy użytkownik

  • 33 posts
    • Czas spędzony online: 58m 57s
2
Neutralna

Posted 17 February 2014 - 11:13

#4

A co jest lepsze do zablokowania indeksowania .htaccess czy robots.txt wystarczy?


  • 0

unbreak

    WT Elite

  • 1937 posts
    • Czas spędzony online: 27d 8h 43m 36s
506
Znakomita!
  • Location/home/unbreak

Posted 17 February 2014 - 11:33

#5

Myślę że htaccess, możesz poczytać o robots.txt - to jest tylko wskazówka dla botów (zdarza się że jej nie słuchają).


  • 0

webDeveloper






Podone tematy Collapse

0 user(s) are reading this topic

0 members, 0 guests, 0 anonymous users