Twoja strefa:

login: hasło:
Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, szukaj

Wyszukiwarka internetowa (ang. search engine) to program lub strona internetowa, której zadaniem jest ułatwienie użytkownikom znalezienie informacji w sieci.

Określenie wyszukiwarka stosujemy do:

  • Stron internetowych serwisów wyszukujących - czyli implementacji oprogramowania wyszukującego działającego z interfejsem WWW ogólnodostępnym dla internautów
  • Oprogramowania przeznaczonego do indeksowania i wyszukiwania informacji w sieciach komputerowych: internecie, intranecie.

Gromadzą w sposób automatyczny informacje o dokumentach tekstowych oraz plikach zgromadzonych w sieci (obszarze wyznaczonym dla wyszukiwarki do indeksowania).

Spis treści

Historia wyszukiwarek

Historia wyszukiwarek na świecie

Historia wyszukiwarek w Polsce

Podział wyszukiwarek

Wyszukiwarki oparte na analizie treści strony

Ponieważ Internet rośnie znacznie szybciej niż jakakolwiek grupa ludzi może go katalogować, oraz z powodu wad katalogów (np. pod danym hasłem może znajdować się tysiące stron), powstały wyszukiwarki, które przeszukują Internet analizując zawartość stron. Kiedy użytkownik poda wyszukiwarce zapytanie, ona odpowie mu łączami do stron, które uzna, w zależności od użytego algorytmu, za najbardziej odpowiednie.

Wyszukiwarki oparte na tej zasadzie mogą objąć znacznie większą część sieci niż katalogi. Niestety są one bardzo podatne na nadużycia, przez co użytkownik zamiast użytecznych informacji dostaje linki na strony nie mające nic wspólnego z jego zapytaniem. Szczególnie wyspecjalizowały się w tym strony pornograficzne.

Wyszukiwarki oparte na analizie topologii sieci

Żeby przeciwdziałać temu, wyszukiwarki zaczęły stosować analizę topologii sieci. Tak więc stronę uważa się za odpowiadającą zapytaniu "britney spears", jeśli wiele stron na temat "britney spears" do niej linkuje. Strona porno z nagimi zdjęciami Britney, niezależnie od własnej treści, i niezależnie od całkowitej liczby linków (głównie z innych stron porno) na nią, nie będzie w ten sposób uznana za związaną z tematem. Natomiast jeśli zada się zapytanie "britney spears nude", strona ta zostanie uznana za istotną, ponieważ linkuje na nią wiele stron o tematyce "nude".

Początkową istotność na podstawie prostej heurystyki, po czym zwykle używa się algorytmu losowego skakania po linkach.

Pierwszą wyszukiwarką, która zastosowała zaawansowane algorytmy analizy topologii sieci był Google.

Wyszukiwarki oparte na analizie topologicznej są często uważane za bardzo odporne na nadużycia. W rzeczywistości stosunkowo czestym atakiem są spam-systemy automatycznej wymiany linków. Inną formą ataku jest stworzenie dużej ilości gęsto linkowanych stron, z czego wszystkie na ten sam temat. Jest to jednak zadanie trudne i wymagające dużego nakładu pracy, a modyfikując heurystykę wartości początkowych można znacznie ograniczyć ten proceder, którego skala na razie jest minimalna.

Wyszukiwarki oparte na zasadzie aukcji miejsc

Osobnym pomysłem jest wprowadzony przez Overture ( ) system, gdzie strony płacą wyszukiwarce kilka centów za każde kliknięcie, przy czym miejsca są licytowane - strona która daje więcej za kliknięcie znajdzie się wyżej na liście rezultatów. Pozycje płatne są oznaczone jako takie, razem z ceną. System ten jest korzystny dla właścicieli stron - płacą oni tylko za wejścia nie za wyświetlenia.

Twórcy twierdzą, że jest on również korzystny dla użytkownika, gdyż tylko strony, które oferują coś użytecznego z danej dziedziny mogą sobie pozwolić na taką reklamę. Z drugiej jednak strony wiele użytecznych stron jest niekomercyjnych, a nawet przy stronach komercyjnych wyniki będą często nieoptymalne - np. na taką reklamę nie mogą sobie pozwolić strony, które mają niskie marże i oferują produkty po niskich cenach, a jedynie te, które mają wysokie marże i oferują produkty drożej.

Reklamy w wyszukiwarkach

Wyszukiwarki stanowią wymarzony cel reklamodawców, ponieważ mają oni praktycznie pełną gwarancję, że osoba wyszukująca dane hasło jest nim zainteresowana. Tak więc większość wyszukiwarek oferuje reklamy zależne od treści zapytań (np. AdWords oferowany przez Google). Nie zawsze są one właściwie oddzielone od wyników poszukiwań, co stało się źródłem protestów grup ochrony praw konsumentów oraz kilku do dziś nierozstrzygniętych spraw sądowych. Ze względu na szeroką krytykę procederu nieoddzielania reklam od wyników, większość wyszukiwarek z niego zrezygnowała i wyraźnie zaznacza teraz reklamy.

Oprogramowanie wyszukiwarek

Oprogramowanie wyszukiwarek to zestaw programów, modułów, z których każdy ma oddzielne zadanie. W skład zestawu wchodzą takie elementy jak:

  • Crawler, Robot, Pająk, Spider, Bot - modułów pobierających dokumenty z sieci
  • Indeksera - moduł analizujących i oceniających
  • Searchera - interfejsu wyszukującego wyszukiwarki/podsystem odpowiadający na zapytania/analizator zapytań oraz moduł prezentacji wyników

Oraz dochodzą do tego:

  • programy konwersji dokumentów (np. PDF)
  • programy archiwizujące repozytorium (najczęściej w postaci skompresowanej)
  • programy analizy i wykrywania technik nieporządanych (spam)
  • moduły administracyjne

Współczesne oprogramowanie wyszukiwarek jest wysoce skomplikowanym systemem rozproszonym uruchamianym zwykle w wielu oddzielnych etapach na tysiącach oddzielnych komputerów - zarówno ze względu na rozmiar i skalę przeszukiwanej sieci, jak i ze względów na poprawienie dostępności usługi w wypadku awarii poszczególnych komponentów.

Algorytmy stosowane w wyszukiwarkach

Algorytmy oceny istotności (tzw. relewancji) dokumentu względem szukanej frazy - algorytmy oceny zawartości strony

Poprawa istotności oraz jakości wyników wyszukiwania

  • grupowanie (klasteryzacja oraz automatyczne łączenie wyników w łatwo przeszukiwalne kategorie)]]
  • dostosowanie wyniku do osoby (personalizacja)
  • tezaurus (użycie synonimów), podpowiedzi, weryfikacja pisowni, odmiana przez przypadki, wyszukiwanie słów o podobnym rdzeniu lub z pomyłkami
  • stop-words (ignorowanie krótkich powszechnie występujących słów, takich jak spójniki i zaimki, np. "i", "z").

Pozycjonowanie stron w wyszukiwarkach

Zobacz też

Linki zewnętrzne

Flipczart nobo Ekran nobo elektryczny Dzwonki szkolne Activboard Clasus - zestaw mobilny Białe acco Biurko nauczycielskie Akcesoria do tablic interaktywnych Akumulatorowy system nagłaśniający nauka jazdy łódź

Co nowego?


 SŁOWACKI RAJ - PODLESOK - BIESZCZADY Opis naszego tygodniowego wyjazdu do Słowackiego Raju i w Bieszczady. DZIEŃ I Do słowackiego Raju dojechaliśmy ok godz.14.00 dokładnie do PODLESOKA na ATC PODLESOK (jest to jedno z najlepszych miejsc by wyruszyć na szlaki). Pole namiotowe bardzo miłe, dużo miejsca i różnych zakątków,zaplecze sanitarne (tzn prysznice niezbyt czyste ale są) i prąd. Jeżeli chcecie się umyć w miare dobrych warunkach i mieć zawsze ciepłą wodę, polecamy iść na recepcję i zapłacić 20 koron i wziąść ciepły prysznic. Na polu panuje bardzo miła atmosfera dla ludzi którzy przyjeżdżaja w góry a nie na imprezy. W pierwszy dzień się trochę zdziwiliśmy dlaczego o godz 21.00 pole namiotowe prawie wymarło tylko nieliczni (w tym my) grilujemy i popijamy piwko opraci o samchód z którego płynie muzyka MANU CHAO. Autor: kotiz data dodania: 21.08.2010 Nadbużańskie impresje Pogranicze wzdłuż Bugu to kraina niezwykła z racji nagromadzonych tu pamiątek przeszłości Przejazd trasą od Horodła do Terespola to wyprawa najbardziej polecana dla miłośników historii i architektury.Wystarczy przypomnieć unię horodelską,bitwę pod Dubienką czy zabytki po wielonarodowej I RP.Są tu przepiękne świątynie rzymskokatolickie,cerkwie prawosławne i unickie ,tatarskie mizary i judaika Autor: Markowski data dodania: 16.08.2010 Osada Naryjski Młyn – wypoczynek i mazurska tradycja Naryjski Młyn to miejscowość położona w malowniczej zachodniej części Pojezierza Mazurskiego, nad jednym z najczystszych jezior w Polsce – Jeziorem Narie. Wkrótce powstanie tam osiedle noszące nazwę Osada Naryjski Młyn. Według projektu całość ma łączyć tradycyjne lokalne rozwiązania urbanistyczne oraz architektoniczne z komfortem i nowoczesnością. Sprzedaż działek już się rozpoczęła, kilkanaście z nich zostało sprzedanych, duża część jest już zarezerwowana. Więcej na http://www.otopr.pl/pr/osada-naryjski-mlyn--wypoczynek-i-mazurska-tradycja-,art,16292.html 2010-08-10 11:30:00.00 Ustka noclegi Wybrałem się pewnego ciepłego lipcowego dnia na wycieczkę rowerową wzdłuż wybrzeża morskiego z Darłowa do Ustki przez Jarosławiec. Piękna trasa wzdłuż morskiego brzegu. Chciałem poznać słynne miasto portowe jakim jest Ustka. Jakież było moje zdziwienie, gdy chcąc przejechać zaznaczoną na mapie trasą rowerową przez poligon w Wicku Morskim zostałem zawrócony przez wartownika pilnującego szlabanu w Jarosławcu. Musiałem pojechać okrężną drogą, co wydłużyło podróż. Zmuszony zostałem do poszukania taniego noclegu w kwaterach prywatnych. A tu środek sezonu... Autor: Ustka data dodania: 31.08.2010 Hotel, Chorwacja, Biograd na Moru, Hotel Adria*** od 181zł/os/dzień Higieniczny niezbędnik podróżnika Wakacje to okres, gdy bakterie i wirusy są szczególnie aktywne, a codzienna higiena niejednokrotnie schodzi na drugi plan. Aby uniknąć nieprzyjemnych niespodzianek w trakcie wymarzonego urlopu zachęcamy do zapoznania się z poniższym niezbędnikiem podróżnika. Więcej na http://www.otopr.pl/pr/higieniczny-niezbednik-podroznika,art,16276.html 2010-08-09 15:57:00.00 W każdej rodzinie znajdzie się czarna owca Hotel, Chorwacja, Hvar, Hotel Adriana**** od 575zł/os/dzień Hotel, Chorwacja, Biograd na Moru, Hotel Adriatic*** od 192zł/os/dzień Jak podrywać latem? Amerykańskie badania potwierdzają, że nasza atrakcyjność latem wzrasta aż o 22,6 %. Okazuje się, że za wszystkim stoją feromony, które, wraz z nadejściem wysokich temperatur, ludzkie ciało wydziela intensywniej. Więcej na http://www.otopr.pl/pr/jak-podrywac-latem,art,16282.html 2010-08-09 22:26:00.00