Rozmiar: 263 bajtów

PoprzedniPowrót do strony głównej Następny

Rozmiar: 271 bajtów    

 
Rozmiar: 1033 bajtów Rozmiar: 1016 bajtów
 

Lidia Derfert-Wolf

Biblioteka Główna
Akademii Techniczno-Rolniczej w Bydgoszczy
lidka@atr.bydgoszcz.pl

Wyszukiwanie informacji w World Wide Web


 

World Wide Web, podobnie jak cała sieć Internet, nie posiada wewnętrznej struktury, a dokumenty w niej zawarte nie są indeksowane w żaden standardowy sposób. Wobec tego odnalezienie właściwej informacji może okazać się trudne. Wyszukiwanie informacji w Internecie (i tym samym w WWW) może się odbywać w dwojaki sposób. Po pierwsze można przeszukiwać znane bazy danych pod określonymi adresami. Przykładem mogą tu być wyszukiwania w bibliotecznych katalogach OPAC, serwisach online (np. DIALOG), serwisach bibliograficznych (np. Uncover), serwisach oferujących dostęp do czasopism elektronicznych, bazach o producentach, produktach, wydawnictwach, adresach itp. Pomocą w odnalezieniu takiej bazy jest najczęściej własne doświadczenie, bookmarki, listy podręcznych adresów na rozmaitych stronach WWW itp. Ogólnie rzecz ujmując, mamy tu do czynienia z przeszukiwaniem określonych fragmentów sieci. Po drugie można poszukiwać informacji w całej sieci WWW (a niekiedy w całym Internecie). W takim przypadku sieć staje się jedną wielką bazą online o bardzo wszechstronnej zawartości. WWW, w rozumieniu takiej właśnie bazy danych, daje do dyspozycji swoim użytkownikom wiele narzędzi do lokalizowania dokumentów (search tools). Ponieważ istnieje obecnie wiele serwisów, które indeksują setki milionów stron WWW, pomyślne wyszukiwanie informacji wymaga:
- wiedzy na temat narzędzi wyszukiwawczych: jak działają, jak indeksują dokumenty, czym się różnią, jak z nich korzystać,
- wiedzy na temat ogólnych zasad strategii wyszukiwania.

 

Narzędzia wyszukiwawcze - charakterystyka, podział

Narzędzia wyszukiwawcze składają się z bazy danych (indeksu, katalogu) oraz programu do wyszukiwania w niej dokumentów. Informacje do baz są gromadzone w różny sposób - automatycznie (ang. robot, spider, crawler) lub w tradycyjny sposób - dane gromadzą ludzie (ang. human). Niekiedy system prosi użytkownika o podanie znanych ciekawych adresów (ang. submission). Wielkość baz danych jest różna, od ułamków procent zasobów sieci do ok. 55%. Programy przeszukujące są także elementem różnicującym wszystkie narzędzia wyszukiwawcze. Dysponują przede wszystkim zróżnicowanymi możliwościami wyszukiwawczymi. Niektóre wymagają podania słów kluczowych w najprostszy sposób, inne natomiast umożliwiają tworzenie rozbudowanych charakterystyk wyszukiwawczych.

Wynik wyszukiwania (ang. search raport, search results) jest listą składającą się z różnych elementów w zależności od narzędzia. Zazwyczaj są to : tytuły dokumentów, adresy URL, krótkie streszczenia, pierwsze zdania z dokumentów, poszukiwane słowa w kontekście, wielkość dokumentu, data itp. Bardzo cenne jest to, że lista zawsze zawiera pewne elementy w postaci hiperłączy, które bezpośrednio odsyłają do danego dokumentu. Wyniki są prawie zawsze uszeregowane wg określonego wskaźnika trafności. Może to być np. ilość wystąpień poszukiwanego słowa w dokumencie.

Narzędzia wyszukiwawcze dzieli się w zależności od sposobu gromadzenia informacji na:
1. wyszukiwarki (ang. search engine, searchable indexes),
2. katalogi tematyczne (ang. subject catalogs, general listing, subject hierarchies),
3. multiwyszukiwarki (ang. multiple search engines).

Dla niewprawnego "internauty" różnice pomiędzy tymi narzędziami są niewielkie. Coraz częściej wyszukiwarkom towarzyszą własne katalogi, obejmujące na ogół ok. 5% najczęściej odwiedzanych zasobów zawartych w danej bazie. Z kolei katalogi, posiadające coraz głębszą strukturę hierarchiczną, są dodatkowo zaopatrywane w mechanizm wyszukiwawczy. Dalsze charakterystyki i zestawienia pozwolą dokładnie je odróżnić. Jest to niezwykle ważne przy wyborze odpowiedniego narzędzia do wyszukiwania.

 

Wyszukiwarki

Wyszukiwarki gromadzą informacje automatycznie i składają się z:
 1) programu penetrującego zasoby sieci - program "przeglądający" sieć, wczytujący dokumenty, indeksujący ich zawartość oraz wszystkie linki, aktualizujący informacje co jakiś czas,
 2) indeksu tych zasobów - wszystkie dokumenty i hiperłącza odnalezione przez ww. program,
 3) programu przeszukującego indeks z wbudowanym interfejsem dla użytkownika - program pozwalający na sformułowanie zapytania, wyszukanie odpowiednich dokumentów (przeglądanie zawartości całego indeksu w poszukiwaniu zadanych słów i zwrotów) i przedstawienie ich w charakterystyczny dla danego systemu sposób.

Zadawanie pytań odbywa się poprzez specjalne interfejsy - zazwyczaj są to formularze z okienkami do wpisywania terminów wyszukiwawczych lub/i okienka z odpowiednimi opcjami do wyboru (np. operatory, język dokumentu, data). W zależności od wyszukiwarki formularze pozwalają na stosowanie operatorów Boole'a (wpisanie z klawiatury lub wybranie z "okienka"), operatorów bliskości, "maskowania" końcówek słów. Niektóre wyszukiwarki oferują wyszukiwanie wg całych wyrażeń (fraz). Użytkownik może również określić, czy informacja ma być wyszukiwana w pełnych tekstach dokumentów, czy tylko tytułach, URL, itp., we wszystkich serwerach świata czy tylko np. europejskich. Można określić maksymalną liczbę rezultatów i formę ich prezentacji. Techniki wyszukiwania są dla każdej wyszukiwarki opisane na specjalnych stronach (np. search options, help). Wiele serwisów podaje przykłady charakterystyk wyszukiwawczych.

 

Katalogi tematyczne

Katalogi są formą tematycznego dostępu do zasobów WWW. Pozwalają na "wertowanie" ich zawartości, uporządkowanych hierarchicznie wg różnych dziedzin. Prezentują ogólną listę tematów - kategorii tematycznych, odsyłających do wielu podkategorii, tematów, podtematów, aż do listy dokumentów z bardzo wąskiej dziedziny.

Katalogi tematyczne, podobnie jak wyszukiwarki, składają się z bazy danych oraz programu wyszukiwawczego. Różnica polega jednak na sposobie gromadzenia informacji do bazy. Katalogi tematyczne są zarządzane przez zespoły ludzkie, decydujące o umieszczeniu określonych informacji w danej grupie tematycznej. Bazy danych są więc tworzone przez ludzi, a nie "robots".

Dla ułatwienia przeszukiwania katalogów tematycznych, wiele z nich ma wbudowany interfejs do przeszukiwania wszystkich lub kilku kategorii tematycznych jednocześnie. Umożliwia on wyszukiwanie wg słów kluczowych, poprzez wypełnianie prostych formularzy. Należy pamiętać, że w efekcie tych wyszukiwań otrzymamy tylko takie informacje, które "zasilają" bazę danych konkretnego katalogu.

 

Multiwyszukiwarki

Istota tych narzędzi polega na tym, że przy pomocy specjalnego oprogramowania system przeszukuje jednocześnie wiele z opisanych powyżej wyszukiwarek i "scala" rezultaty wyszukiwania lub prezentuje je wg indeksów. Multiwyszukiwarki różnią się od pozostałych tym, że nie posiadają żadnej wewnętrznej bazy danych. Posługują się natomiast zasobami wyszukiwarek i katalogów tematycznych (np. Altavista, Fast, Google, Yahoo). Procedura wyszukiwania polega na "przesłaniu" zapytania użytkownika do kolejnych wyszukiwarek oraz uporządkowaniu rezultatów wyszukiwania. Ponieważ nie wszystkie wyszukiwarki działają tak samo, przeszukując je jednocześnie przy użyciu więcej niż jednego słowa kluczowego, można czasem uzyskać mało precyzyjne rezultaty.

Tab. 1. Zestawienie cech charakterystycznych narzędzi wyszukiwawczych i przykłady poszczególnych wyszukiwarek, katalogów tematycznych i multiwyszukiwarek

  Wyszukiwarki Katalogi tematyczne Multiwyszukiwarki
Baza danych - tworzona automatycznie,
- dużo stron WWW
- tworzona przez ludzi,
- niewielki rozmiar bazy
- nie posiadają bazy danych,
- korzystają z innych zasobów
Kiedy korzystać? - wyszukiwanie bardzo specyficznych,
szczegółowych informacji np. konkretnych osób,
instytucji albo tematów
- wyszukiwanie ogólnych zagadnień np. biblioteki w Polsce,
- zawierają mniej informacji niż wyszukiwarki, ale są to informacje lepszej jakości, prawie zawsze związane z poszukiwanym tematem
-wyszukiwania, w których spodziewana jest bardzo duża liczba dokumentów
Plusy - baza danych jest większa i bardziej aktualna - łatwe do korzystania,
- informacje zamieszczone w bazie są recenzowane i indeksowane w celu zagwarantowania wysokiej jakości
- akceptują nieścisłe zapytania
Minusy - niedokładne sposoby indeksowania i wyszukiwania informacji,
- utrudnione wyszukiwanie relewantnych dokumentów
- ograniczona liczba dokumentów , ponieważ recenzowanie i indeksowanie zabiera dużo czasu,
- niezadowalająca aktualizacja
- niska efektywność w przypadku złożonych zapytań
Wyszukiwanie 1) formularz (jeden lub dwa poziomy zaawansowania),
2) podręczny katalog tematyczny
1) kategorie tematyczne,
2) pomocniczy formularz do wyszukiwania wg słów kluczowych
1) formularz (jeden lub dwa poziomy zaawansowania),
2) podręczny katalog tematyczny
Przykładowe narzędzia AltaVista
FastSearch
Google
NorthernLight.com
HotBot
GO (dawniej Infoseek)
Lycos
Excite
polskie:
Arena.pl (polski Infoseek)
Onet.pl
Yahoo!
LookSmart
Open Directory
WWW Virtual Library
Argus Clearinghouse
polskie:
Wirtualna Polska
WOW
MetaCrawler
SavvySearch
polska:
Emulti
 

Strategia wyszukiwania

Zanim przystąpimy do wyboru odpowiedniej wyszukiwarki/katalogu, należy przygotować plan wyszukiwania, który obejmuje:
1) określenie tematu lub konkretnego terminu,
2) określenie pojęć zawartych w temacie oraz pojęć szerszych (w przypadku wyszukiwania w katalogach tematycznych),
3) wybór słów kluczowych i synonimów, różnych form pisowni, form gramatycznych itp.,
4) opracowanie strategii wyszukiwania.

Pierwsze trzy etapy nie wymagają specjalnych umiejętności i wiedzy. Natomiast opracowanie strategii wyszukiwania może okazać się skomplikowane przy różnych możliwościach wyszukiwawczych oferowanych przez wyszukiwarki/katalogi. Filozofia wyszukiwania jest nieco zbliżona do metod wykorzystywanych w bibliograficznych bazach danych na CD-ROM czy komputerowych katalogach bibliotecznych. Ma jednak specyficzne formy zapisu oraz opcje do wyboru. Poniżej zostaną opisane ogólne metody i techniki. Ich występowanie i zapis w poszczególnych wyszukiwarkach podano w tabelach 3-5.

Najważniejsze metody i techniki wyszukiwawcze

1) Symbole + i - przed poszukiwanymi słowami.
Zastosowanie znaku + przed słowem oznacza, że musi ono wystąpić w dokumencie. Zastosowanie znaku - oznacza, że nie może w nim wystąpić. Np. na zapytanie +drukarki -Canon otrzymamy dokumenty na temat wszystkich drukarek, ale nie typu Canon. Posługując się znakami +/- nie należy używać spacji.

2) Wyszukiwanie całych zdań/wyrażeń
Najczęściej spotykaną metodą jest ujęcie wyrażenia w cudzysłów np. "biblioteki w Polsce". Otrzymamy w takim przypadku dokumenty, w których poszukiwane wyrażenie wystąpi dokładnie w takiej formie. Niektóre narzędzia oferują opcje do wyboru np. "as a phrase", "exact phrase".

3) Wielkie litery
Zazwyczaj zaleca się używanie małych liter w większości poszukiwań. Niektóre wyszukiwarki rozróżniają wielkie i małe litery, co znacznie ogranicza listę rezultatów.

4) Maskowanie końcówek
Wyszukując różnych wariantów danego terminu należy używać symbolu maskowania o ile jest dostępny. Najczęściej są to: *, ?, %. Np. wyszukiwanie terminu econ* da w rezultacie dokumenty zawierające economics, economy, economic, econometric.

5) Operatory Boole'a
Wiele wyszukiwarek daje możliwość tworzenia złożonych zapytań przy pomocy operatorów Boole'a lub ich odpowiedników. Niektóre pozwalają na bezpośrednie wpisywanie operatorów AND, OR, NOT (ANDNOT, AND NOT) wielkimi albo małymi literami. Inne oferują formularze z opcjami do wyboru np. "All words" i "Any words", "Should include", "Must include" i "Must not include" albo "Must Have", "Good To Have", " Must Not Have". Możliwości te mogą jednak wystąpić na zaawansowanych poziomach wyszukiwania ("Advanced search"). Należy to zawsze sprawdzić w "helpach". Zdarza się też, że system domyślnie umieszcza operator AND albo OR pomiędzy terminami.

6) Operatory bliskości
Pozwalają na odszukanie dokumentów, w których pomiędzy dwoma terminami powinno znaleźć się nie więcej niż np. 10 słów. Jest to rzadko spotykana możliwość. AltaVista pozwala na stosowanie operatora bliskości NEAR.

7) Wyszukiwanie wg określonych pól dokumentu
Większość dokumentów WWW ma określoną strukturę: adres URL, tytuł, tekst, linki, pliki graficzne. Dla podwyższenia precyzji wyszukiwania lub zadawania specyficznych pytań, większość wyszukiwarek pozwala ograniczyć poszukiwanie do określonych pól. Stosuje się bezpośrednie umieszczanie nazwy (skrótu) pola przed poszukiwanym terminem np. na zapytanie title:biblioteka otrzymamy dokumenty z terminem biblioteka w tytule, na zapytanie link:www.bg.atr.bydgoszcz.pl otrzymamy dokumenty, w których zamieszczono link do strony http:// www.bg.atr.bydgoszcz.pl. Niekiedy mamy do wyboru kilka opcji w formularzu np. "in the text", "in the title", "in the link name", "in the URL", "in the link to URL".

8) Ograniczanie liczby wyszukanych dokumentów
Istnieje kilka metod ograniczania liczby rezultatów. Może to być ponowne wyszukiwanie z otrzymanej listy np. opcje "Refining your search", "Search within these results". Niekiedy mamy możliwość wyboru dodatkowych warunków np. daty, języka dokumentu, typu domeny, regionu itp.

Wybór narzędzia do wyszukiwania

Przy podejmowaniu decyzji o tym, jakich użyć wyszukiwarek/katalogów należy kierować się przede wszystkim cechami wymienionymi w Tab. 1, a zwłaszcza zakresem indeksowania dokumentów: cały obszar WWW czy wybór tematów. Na tym etapie dokonujemy wyboru pomiędzy rodzajami narzędzia: wyszukiwarki czy katalogami. Na pytanie którą konkretną wyszukiwarkę/katalog wybrać pomoże odpowiedzieć przegląd innych ważnych cech, takich jak:
1) wielkość bazy danych (liczba dokumentów indeksowanych),
2) aktualność informacji (częstotliwość aktualizacji),
3) liczba dokumentów wyszukanych,
4) interfejs do wyszukiwania,
5) dostępność i jakość ekranów pomocy,
6) możliwości wyszukiwawcze,
7) możliwości wyświetlania rezultatów,
8) szybkość wyszukiwania,
9) inne możliwości (udogodnienia).

W poniższych tabelach zestawiono najważniejsze dane statystyczne dotyczące wybranych wyszukiwarek i katalogów tematycznych oraz stosowane metody i techniki wyszukiwawcze. Dokonano również porównania liczby wyszukanych dokumentów.

Tab. 2. Dane statystyczne

Wyszukiwarka Ilość indeksowanych stron WWW
(w mln)*
Procent wszystkich stron WWW** Procent błędnych rezultatów
na 100 wyszukanych rekordów***
Google 560 (1060)**** 56 4,3
AltaVista 350 35 13,7
FastSearch 340 34 2,3
NorthernLight.com 265 27 5,7
Excite 250 25 8,7
GO (dawniej Infoseek) 50 5 b.d.
Lycos 50 5 b.d.
Yahoo! 1,2 0,12 b.d.
LookSmart 1,2 0,12 b.d.
Open Directory 1,9 0,19 b.d.

* wg danych z 7 lipca 2000 r. http://searchenginewatch.com/reports/sizes.html
** w lutym 2000 w materiale opublikowanym przez Intkomi i NEC Research Institute wykazano, że w całym WWW jest ponad 1 bilion stron (dokumentów).
*** wg danych z listopada 1999 r.
**** Google indeksuje 560 mln stron, ale ponieważ korzysta również z "link data", liczba indeksowanych dokumentów w rzeczywistości jest większa.

Tab. 3. Zestawienie możliwości wyszukiwawczych: poziomy wyszukiwania, wyszukiwanie całych wyrażeń, stosowanie operatorów "+" (termin musi wystąpić) i "-" (termin nie może wystąpić), operatorów Boole'a

Nazwa Poziomy wyszukiwania Wyszukiwanie fraz wyrażeniowych Operatory + / - Operatory Boole'a
AltaVista 1) prosty "Search"
2) "Advanced Search"
tak, "", na 2 poziomie automatycznie dodaje "" tak na 1 poziomie automatycznie AND,
na 2 poziomie AND, OR, AND NOT
FastSearch 1) "Simple Search"
2) "Advanced Search"
tak - wybór opcji

"the exact phrase"
tak na 1 poziomie opcje "All words", "Any words", na 2 poziomie opcje "Should include", "Must include", "Must not include"
NorthernLight.com 1) "Simple"
2) "Power"
tak, "" tak AND, OR, NOT
Google 1 poziom tak, automatycznie tak automatycznie dodaje AND,
nie ma możliwości wysz. z OR
Excite 1) "Search"
2) "Advanced Search" (należy kliknąć w "More")
tak, "" tak na 1 poziomie AND, OR, AND NOT
na 2 poziomie "Must Have", "Good To Have", " Must Not Have"
GO (dawniej Infoseek) 1) "Basic"
2) "Advanced" (należy wybrać "Search options")
tak, "" lub wybór "Phrase" w wysz. "Advanced" tak na 1 poziomie AND, OR, NOT, na 2 poziomie "Should", "Must", "Should not"
Lycos 1) "Search"
2) "Advanced search"
tak, "" lub wybór opcji "Exact phrase" na 2 poziomie tak na 1 poziomie automatycznie dodaje AND, na 2 poziomie wybór opcji: "all words" (AND), "any words" (OR),
HotBot 1) "Basic search"
2) "Advanced search"
tak, "" lub wybór opcji "exact phrase" z "Look for" tak AND, OR, NOT przez wybór z opcji "Look for": all the words, any of the words
Webcrawler 1 poziom tak "" tak AND, OR, NOT
Yahoo! 1) "Search"
2) "Advanced Search"
tak "" lub wybór "An exact phrase match" na 2 poziomie tak na 2 poziomie: "Matches on all words" (AND), "Matches on any word" (OR)
LookSmart 1 poziom nie nie automatycznie AND
Open Directory 1) prosty
2) "Advanced"
tak "" tak and (automatycznie), or, andnot
MetaCrawler 1) prosty
2) "Power search"
wybór opcji "Phrase" tak wybór z menu: "all" (AND), "any" (OR)
SavvySearch 1) prosty
2) "Advanced"
tak, "" tak and, or, not
Arena.pl 1 poziom tak, "" tak nie
Onet.pl 1) prosty
2) zaawansowany
tak, "" tak na 2 poziomie wybór z opcji: "musi zawierać", "powinien zawierać", "nie może zawierać"
Wirtualna Polska 1) prosty
2) zaawansowany
tak, "" tak na 2 poziomie wybór z opcji: "musi zawierać", "może zawierać", "nie może zawierać"
Emulti 1 poziom tak, "" nie automatycznie AND
 

Tab. 4. Zestawienie możliwości wyszukiwawczych: maskowanie końcówek terminów, przeszukiwanie zadanych pól dokumentu, ograniczanie liczby rezultatów

Nazwa Maskowanie
końcówek
Wyszukiwanie wg zawartości pól,
linków i domen
Ograniczanie liczby
wyszukanych dokumentów
Ograniczanie wyszukiwania
wg daty, języka itp.
AltaVista * title:, text:,url:, link:, host:, image: nie data, języki (25)
FastSearch automatyczne opcje w wysz. "Advanced": "in the text", "in the title", "in the link name", "in the URL", "in the link to URL" nie języki (31) domena
NorthernLight.com * (kilka znaków) lub % (1 znak) title:, url:, text:, company:, sort:date "Narrow Your Search with Custom Search Folders" data, języki ( 5)obszar - "All countries" albo 25 krajów
Google nie link: "Search within results" języki
Excite nie nie nie języki (11) kraj/domena
GO (dawniej Infoseek) automatyczne title:, url:, link:, site:lub wybór z menu w wysz. Zaawansowanym "Refining your search" nie
Lycos nie poprzez menu w "Advanced search": title, URL, host/domain "Search within these results" języki (25)
HotBot * (kilka znaków) lub ? (1 znak) "Look for": the page title, the person, links to this URL "Search within these results" data, języki ( 9), lokalizacja /domena
Webcrawler nie nie nie nie
Yahoo! * t:tytuł, u:url, nie data (dodania do bazy Yahoo)
LookSmart * nie nie nie
Open Directory * nie nie nie
MetaCrawler nie nie "Refining your query" domena, region, kraj
SavvySearch nie nie nie nie
Arena.pl nie link:, site:, url:, title: "Szukaj w znalezionych" nie
Onet.pl nie link:,site:, url:, title: "Szukaj wśród znalezionych" data
Wirtualna Polska nie nie nie nie
Emulti nie nie nie nie
 

Tab. 5. Inne możliwości wyszukiwawcze charakterystyczne tylko dla niektórych wyszukiwarek

AltaVista- możliwość stosowania operatora NEAR na 2 poziomie wyszukiwania (dane wyrażenia powinny wystąpić obok siebie w odległości co najwyżej 10 słów)
NorthernLight.com- sortuje wyniki wyszukiwania w foldery "Custom folders" i umożliwia przeszukiwanie poprzednich rezultatów,
- możliwość wyszukiwania w całym WWW albo w bazie "Special collection" (5800 tytułów czasopism "journals and newspapers"
Google- przechowuje strony WWW i można ich używać jeśli strona już nie istnieje lub nie "ładuje się" ze źródła "Show matches (Cache)",
- sortuje wyniki wg algorytmu jakości i authority na podstawie liczby logowań do danej strony (na wzór analizy cytowań),
- "I'm Feeling Lucky"- wyszukuje od razu pierwsza stronę ze wszystkich rezultatów,
- opcja"E-mail these results"
Excite- automatyczne wyszukiwanie synonimów
GO (dawniej Infoseek)- wyszukuje różne warianty wyrażeń np. mice/mouse-
- opcja "Translate this page",
- "Search the Web", "Search images"
Lycos- wysz. grafiki i dźwięki
HotBot- opcja w wyszukiwaniu zaawansowanym "Page Depth" - możliwość wyboru typu strony do wyszukiwania: Any Page, Top Page, Personal Page,
- Word Stemming - wyszukiwanie różnych form gramatycznych
Onet.pl- uwzględnia różne formy gramatyczne wyrazów,
- wyszukuje wyrażenia bliskoznaczne
 

Tab. 6. Rezultaty wyszukiwań* w wybranych wyszukiwarkach/katalogach

Wyszukiwany termin "akademia techniczno-rolnicza"
w całym tekście dokumentu
"ministerstwo edukacji narodowej"
w tytule dokumentu
AltaVista 426 9
FastSearch 604 12
Northern Light 475 8
Google 509 niedostępne wysz. wg tytułu
Excite 6 niedostępne wysz. wg tytułu
GO (Infoseek) 33 1
Lycos 603 12
HotBot 159 5
Webcrawler 2 niedostępne wysz. wg tytułu
Yahoo! 10 0
LookSmart 9 0
Open Directory 1 niedostępne wysz. wg tytułu
Metacrawler 30 niedostępne wysz. wg tytułu
SavvySearch 17 niedostępne wysz. wg tytułu
Onet.pl 780 25
Arena.pl (polski Infoseek) 701 21
Wirtualna Polska 471 niedostępne wysz. wg tytułu
Emulti 90 niedostępne wysz. wg tytułu

* Pytania formułowano zgodnie z zasadami obowiązującymi w danej wyszukiwarce/katalogu

 

Podsumowanie

Wyszukiwanie informacji w WWW stało się dużo łatwiejsze dzięki powstaniu i ciągłemu rozwojowi największych wyszukiwarek. Ich coraz doskonalsze programy do wyszukiwania zwiększają szansę odnalezienia potrzebnych dokumentów. Rezultaty wyszukiwania są szeregowane również w taki sposób, że najbardziej trafne odpowiedzi znajdujemy na początku listy. Pewną wadą są niekiedy niedoskonałe instrukcje wyszukiwania. Różnorodność odpowiedników operatorów Boole'a może też wprowadzić w błąd niewprawnego użytkownika. Brak częstej aktualizacji bazy powoduje wyszukiwanie adresów, pod którymi nie są już zlokalizowane dane dokumenty. Z tych powodów warto zadawać to samo pytanie kilku różnym wyszukiwarkom, zwłaszcza w poszukiwaniu specjalistycznej informacji. Natomiast w poszukiwaniu bardzo rozpowszechnionej informacji lepiej skorzystać z wyszukiwarek regionalnych (dokumentów krajowych należy szukać w polskich wyszukiwarkach). Wyniki poszukiwań zamieszczone w Tab. 6. potwierdzają ten pogląd.

 

Bibliografia

Search Engine Watch www.searchenginewatch.com
Search Engine Guide www.searchengineguide.com
Search Engine Showdown www.searchengineshowdown.com

  
Rozmiar: 1017 bajtów 
 
Rozmiar: 1012 bajtów

 
Rozmiar: 263 bajtów

EBIB 7/2000 (15)
Derfert-Wolf, L.: Wyszukiwanie informacji w World Wide Web
http://www.oss.wroc.pl/biuletyn/ebib15/derfert.html

Rozmiar: 271 bajtów