Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.

PropertyValue
dbpprop:abstract
  • Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.
  • Harvest - jest to kompletne rozwiązanie systemu indeksowania stron. Obecnie następcą Harvesta został silnik o nazwie Glimpse zapewniający wyszukiwanie pełnotekstowe. System obsługuje wyszukiwanie boolowskie oraz zapytania złożone. Harvest powstał w wyniku pracy doktorskiej w 1995 na Uniwersytecie w Arizonie. Generalnie składał się z dwóch komponentów: broker i gatherers. Gatherers przeszukiwał zdalne lub lokalne pliki dając informacje o kolekcji lub o pojedynczym adresie URL. Pobierając informacje o dokumentach tworzy strukturę plików przechowującą informacje o nich zwaną SOIF oraz GDBM. Broker to element indeksujący zbiory otrzymane w wyniku działania modułu pierwszego. Względnie broker mógł filtrować informacje i przesyłać go do swoich kopii w celu przyspieszenia procesu indeksowania. Architektura ta jest wariantem architektury crawler–indexer, zaproponowanej w celu zmniejszenia obciążenia serwerów oraz sieci przez podział zadań i czasu pomiędzy crawler'ów – nazywanych tu zbieraczami i brokerów – odpowiedzialnych za dystrybucję danych. Jest to architektura zorientowana zadaniowo.
dbpprop:hasPhotoCollection
dbpprop:reference
rdfs:comment
  • Web harvesting is an implementation of a Web crawler that uses human expertise or machine guidance to direct the crawler to URLs which compose a specialized collection or set of knowledge. Web harvesting can be thought of as focused or directed Web crawling.
  • Harvest - jest to kompletne rozwiązanie systemu indeksowania stron. Obecnie następcą Harvesta został silnik o nazwie Glimpse zapewniający wyszukiwanie pełnotekstowe. System obsługuje wyszukiwanie boolowskie oraz zapytania złożone. Harvest powstał w wyniku pracy doktorskiej w 1995 na Uniwersytecie w Arizonie. Generalnie składał się z dwóch komponentów: broker i gatherers. Gatherers przeszukiwał zdalne lub lokalne pliki dając informacje o kolekcji lub o pojedynczym adresie URL.
rdfs:label
  • Web harvesting
  • Harvest
owl:sameAs
skos:subject
foaf:page
is dbpprop:disambiguates of
is dbpprop:redirect of