Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.
| Property | Value |
| dbpprop:abstract
|
- Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.
- Harvest - jest to kompletne rozwiązanie systemu indeksowania stron. Obecnie następcą Harvesta został silnik o nazwie Glimpse zapewniający wyszukiwanie pełnotekstowe. System obsługuje wyszukiwanie boolowskie oraz zapytania złożone. Harvest powstał w wyniku pracy doktorskiej w 1995 na Uniwersytecie w Arizonie. Generalnie składał się z dwóch komponentów: broker i gatherers. Gatherers przeszukiwał zdalne lub lokalne pliki dając informacje o kolekcji lub o pojedynczym adresie URL. Pobierając informacje o dokumentach tworzy strukturę plików przechowującą informacje o nich zwaną SOIF oraz GDBM. Broker to element indeksujący zbiory otrzymane w wyniku działania modułu pierwszego. Względnie broker mógł filtrować informacje i przesyłać go do swoich kopii w celu przyspieszenia procesu indeksowania. Architektura ta jest wariantem architektury crawler–indexer, zaproponowanej w celu zmniejszenia obciążenia serwerów oraz sieci przez podział zadań i czasu pomiędzy crawler'ów – nazywanych tu zbieraczami i brokerów – odpowiedzialnych za dystrybucję danych. Jest to architektura zorientowana zadaniowo.
|
| dbpprop:hasPhotoCollection
| |
| dbpprop:reference
| |
| rdfs:comment
|
- Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.
- Harvest - jest to kompletne rozwiązanie systemu indeksowania stron. Obecnie następcą Harvesta został silnik o nazwie Glimpse zapewniający wyszukiwanie pełnotekstowe. System obsługuje wyszukiwanie boolowskie oraz zapytania złożone. Harvest powstał w wyniku pracy doktorskiej w 1995 na Uniwersytecie w Arizonie. Generalnie składał się z dwóch komponentów: broker i gatherers. Gatherers przeszukiwał zdalne lub lokalne pliki dając informacje o kolekcji lub o pojedynczym adresie URL.
|
| rdfs:label
| |
| owl:sameAs
| |
| skos:subject
| |
| foaf:page
| |
| is dbpprop:disambiguates
of | |
| is dbpprop:redirect
of | |