Twoja strefa:

login: hasło:
Z Wikipedii, wolnej encyklopedii
(Przekierowano z Robots.txt)
Skocz do: nawigacji, szukaj

Robots Exclusion Protocol – mechanizm informowania automatów o tym, czego nie powinny robić na stronie WWW.

Dotyczy to przede wszystkim działających automatycznie programów indeksujących serwisy WWW dla wyszukiwarek, które podążając za hiperłączami indeksują całą zawartość danego serwisu do katalogu wyszukiwarki, ale również programów innego typu, np. automatycznych mirrorów.

Robots Exclusion Protocol jest systemem honorowym i jedynie informuje o odpowiednim zachowaniu, nie wymusza go zaś w żaden sposób. System ten jest generalnie przestrzegany, gdyż w niczyim interesie nie leży łamanie jego zasad.

Spis treści

Powody stosowania

  • Czasem pobranie jakiejś strony powoduje wywołanie jakiejś akcji, np. oddanie głosu w sondażu (ściśle interpretując standardy, wszystkie tego typu akcje powinny odbywać się za pomocą formularzy i metody POST, nie linków i GET, nie jest to jednak powszechnie przestrzegane).
  • Niechęć autora do tego, żeby dana strona była indeksowana w wyszukiwarkach, gdyż nie wnosi ona żadnej nowej treści do ich bazy. Tak jest m.in. ze stronami edycji na Wikipedii, np.:
http://pl.wikipedia.org/w/wiki.phtml?title=Robots_Exclusion_Protocol&action=edit
  • Duże obciążenie serwera w związku z generacją strony oraz zwykłą niechęć do tego, żeby była ona w bazach wyszukiwarek. Niektóre strony internetowe z różnych przyczyn wolą pozostać poza wyszukiwarkami, lub pozwalają na indeksowanie tylko swojej strony głównej.

Mechanizmy

Istnieją dwa mechanizmy Robots Exclusion Protocol: robots.txt i znaczniki meta.

robots.txt

Najważniejszym mechanizmem jest plik robots.txt umieszczony w katalogu głównym serwera. Zgodnie ze standardem Robots Exclusion Protocol, robots.txt to plik składający się z:

  • komentarzy zaczętych od #
  • rekordów oddzielonych pustymi liniami
    • rekord składa się z pól Nazwa: Wartość
      • jednego pola User-agent
      • pól Disallow

Pole User-agent oznacza jakich programów dany rekord dotyczy. Pola Disallow to prefiksy URL-i, których ściągać nie wolno.

Pole User-agent: * dotyczy wszystkich nie wymienionych w innych rekordach programów.

Niektóre boty rozumieją też inne pola, np. ograniczające ilość pobrań ze strony na minutę.

Przykłady

Cała witryna będzie indeksowana przez roboty (tak jakby nie było pliku robots.txt):

User-agent: *
Disallow:

Cała witryna nie będzie indeksowana:

User-agent: *
Disallow: /

Indeksowane nie będą tylko foldery "images" i "private" w katalogu głównym strony:

User-agent: *
Disallow: /images/
Disallow: /private/

Indeksowany nie będzie tylko plik "file" w katalogu "directory":

User-agent: *
Disallow: /directory/file.html

Znaczniki meta

Jest też możliwe podawanie dyrektyw dla robotów w znacznikach HTML: <meta name="robots" content="X">, gdzie X to:

  • noindex – nie indeksuj strony
  • nofollow – nie podążaj za linkami na stronie
  • noarchive – nie archiwizuj strony w cache

X może być złożone z jednego, dwóch lub trzech powyższych słów rozdzielonych przecinkiem (np. noindex,nofollow,noarchive), przy czym dopuszczalne jest też użycie słowa none jako odpowiednika noindex,nofollow.

Znaczniki meta wymagają analizy HTML-a, więc są uznawane o wiele rzadziej niż robots.txt

slowniki Utlenienie Gryzonie studium Biblioteka Słońca i Księżyca szczepienia szczecin zadania prawa oswiatowego adwokat łódź gabinet imprezy integracyjne

Co nowego?


 SŁOWACKI RAJ - PODLESOK - BIESZCZADY Opis naszego tygodniowego wyjazdu do Słowackiego Raju i w Bieszczady. DZIEŃ I Do słowackiego Raju dojechaliśmy ok godz.14.00 dokładnie do PODLESOKA na ATC PODLESOK (jest to jedno z najlepszych miejsc by wyruszyć na szlaki). Pole namiotowe bardzo miłe, dużo miejsca i różnych zakątków,zaplecze sanitarne (tzn prysznice niezbyt czyste ale są) i prąd. Jeżeli chcecie się umyć w miare dobrych warunkach i mieć zawsze ciepłą wodę, polecamy iść na recepcję i zapłacić 20 koron i wziąść ciepły prysznic. Na polu panuje bardzo miła atmosfera dla ludzi którzy przyjeżdżaja w góry a nie na imprezy. W pierwszy dzień się trochę zdziwiliśmy dlaczego o godz 21.00 pole namiotowe prawie wymarło tylko nieliczni (w tym my) grilujemy i popijamy piwko opraci o samchód z którego płynie muzyka MANU CHAO. Autor: kotiz data dodania: 21.08.2010 Dbaj zatem o zdrowie swoje i swojej rodziny Słownik wybranych terminów lotniskowych Poradnik dla wszystkich zaczynających swoją przygodę z lataniem. Warto nauczyć się znaczenia niektórych terminów. To może zaoszczędzić nam sporo czasu i nerwów ;) PASAŻER – zwierzę... Rodos z dzieckiem hotel Delfinia Kolymbia (Kolympia) Rodos z dzieckiem (czerwiec 2010) Wyspa Rodos jako miejsce do zwiedzania i wypoczynku interesowały mnie od dłuższego czasu – niemniej w poprzednich latach jakoś nie mogliśmy znaleźć nic... Nadbużańskie impresje Pogranicze wzdłuż Bugu to kraina niezwykła z racji nagromadzonych tu pamiątek przeszłości Przejazd trasą od Horodła do Terespola to wyprawa najbardziej polecana dla miłośników historii i architektury.Wystarczy przypomnieć unię horodelską,bitwę pod Dubienką czy zabytki po wielonarodowej I RP.Są tu przepiękne świątynie rzymskokatolickie,cerkwie prawosławne i unickie ,tatarskie mizary i judaika Autor: Markowski data dodania: 16.08.2010 Higieniczny niezbędnik podróżnika Wakacje to okres, gdy bakterie i wirusy są szczególnie aktywne, a codzienna higiena niejednokrotnie schodzi na drugi plan. Aby uniknąć nieprzyjemnych niespodzianek w trakcie wymarzonego urlopu zachęcamy do zapoznania się z poniższym niezbędnikiem podróżnika. Więcej na http://www.otopr.pl/pr/higieniczny-niezbednik-podroznika,art,16276.html 2010-08-09 15:57:00.00 Jak podrywać latem? Amerykańskie badania potwierdzają, że nasza atrakcyjność latem wzrasta aż o 22,6 %. Okazuje się, że za wszystkim stoją feromony, które, wraz z nadejściem wysokich temperatur, ludzkie ciało wydziela intensywniej. Więcej na http://www.otopr.pl/pr/jak-podrywac-latem,art,16282.html 2010-08-09 22:26:00.00 Po prostu Koninki Koninki. Pierwsza myśl: Kurcze gdzie to jest? Na końcu świata a może dalej? Okazało się, że Koninki położone są marne 45 minut od domu. Wstyd nie wiedzieć. Padło hasło - jedziemy na weekend.... Ustka noclegi Wybrałem się pewnego ciepłego lipcowego dnia na wycieczkę rowerową wzdłuż wybrzeża morskiego z Darłowa do Ustki przez Jarosławiec. Piękna trasa wzdłuż morskiego brzegu. Chciałem poznać słynne miasto portowe jakim jest Ustka. Jakież było moje zdziwienie, gdy chcąc przejechać zaznaczoną na mapie trasą rowerową przez poligon w Wicku Morskim zostałem zawrócony przez wartownika pilnującego szlabanu w Jarosławcu. Musiałem pojechać okrężną drogą, co wydłużyło podróż. Zmuszony zostałem do poszukania taniego noclegu w kwaterach prywatnych. A tu środek sezonu... Autor: Ustka data dodania: 31.08.2010 Osada Naryjski Młyn – wypoczynek i mazurska tradycja Naryjski Młyn to miejscowość położona w malowniczej zachodniej części Pojezierza Mazurskiego, nad jednym z najczystszych jezior w Polsce – Jeziorem Narie. Wkrótce powstanie tam osiedle noszące nazwę Osada Naryjski Młyn. Według projektu całość ma łączyć tradycyjne lokalne rozwiązania urbanistyczne oraz architektoniczne z komfortem i nowoczesnością. Sprzedaż działek już się rozpoczęła, kilkanaście z nich zostało sprzedanych, duża część jest już zarezerwowana. Więcej na http://www.otopr.pl/pr/osada-naryjski-mlyn--wypoczynek-i-mazurska-tradycja-,art,16292.html 2010-08-10 11:30:00.00