Heritrix is the Internet Archive’s web crawler, which was specially designed for web archiving. It is open-source and written in Java. The main interface is accessible using a web browser, and there is a command-line tool that can optionally be used to initiate crawls. Heritrix was developed jointly by Internet Archive and the Nordic national libraries on specifications written in early 2003.

PropertyValue
dbpedia-owl:abstract
  • [editar] Heritrix Heritrix es un rastreador (o crawler) de ficheros web a través de internet. Su licencia es open-source y esta escrito completamente en JAVA. Su interfaz de configuración es accesible usando un navegador web, haciéndolo muy versátil y cómodo de usar, aunque también puede ser lanzando desde línea de comandos. Heritrix fue desarrollado conjuntamente por "Internet Archive" y "Nordic National Libraries" a principios de 2003. La primera versión fue publicada en enero de 2004 y ha sido continuamente actualizado por los miembros de "Internet Archive" y terceras partes.
  • Heritrix is the Internet Archive’s web crawler, which was specially designed for web archiving. It is open-source and written in Java. The main interface is accessible using a web browser, and there is a command-line tool that can optionally be used to initiate crawls. Heritrix was developed jointly by Internet Archive and the Nordic national libraries on specifications written in early 2003. The first official release was in January 2004, and it has been continually improved by employees of the Internet Archive and other interested parties.
  • Heritrix on pääasiassa Internet Archiven kehittämä hakurobotti verkkoaineistojen keräämiseen. Kehitystyössä on mukana myös muita IIPC:n jäseniä eli pääasiassa kansalliskirjastoja. Hakurobotti on toteutettu Javalla ja sisältää laajan valikoiman asetuksia, joilla erilaisia keruutoimintoja voidaan toteuttaa. Keruurobottia on käytetty onnistuneesti useissa hyvin laajoissa verkkoaineistojen haravointiprojekteissa ja sen tekninen toteutus osaa kiertää monet yleisesti keräyksissä vastaantulevat tekniset ongelmat. Heritrixiä käyttävät yleensä kansalliskirjastot tai muut toimijat, joiden tehtäviin kuuluu verkkoaineistojen kerääminen ja säilyttäminen jälkipolville. Heritrix:iä voidaan käyttää myös erilaisten vähemmän teknisten käyttöliittymien kautta kuten NetArchiveSuite tai Web Curator Tool. Suomen Kansalliskirjasto kerää Suomea koskevia Internetin aineistoja kulttuuriaineistojen tallettamista ja säilyttämistä koskevan lain (28.12.2007/1433) mukaisesti. Myös muiden maiden kansalliskirjastojen toiminta perustuu samankaltaisiin lakeihin.
  • Heritrix est un robot d'indexation conçu et utilisé par Internet Archive pour l'archivage du web. C'est un logiciel libre programmé en langage Java. Son interface principale est accessible depuis un navigateur web, mais un outil en interpréteur de commandes peut aussi être optionnellement utilisé pour lancer l'indexation. Heritrix a été développé conjointement par Internet Archive et les Bibliothèques Nationales Nordiques en 2003. Sa première publication officielle a eu lieu en janvier 2004, et il a depuis été continuellement amélioré par les membres d'Internet Archive et par des tiers intéressés.
dbpedia-owl:genre
dbpedia-owl:latestReleaseVersion
  • 3.0.0
dbpedia-owl:license
dbpedia-owl:thumbnail
dbpedia-owl:wikiPageExternalLink
dbpprop:caption
  • Screenshot of Heritrix Admin Console.
dbpprop:genre
dbpprop:latestReleaseVersion
  • 3 (xsd:integer)
dbpprop:license
dbpprop:name
  • Heritrix
dbpprop:operatingSystem
dbpprop:programmingLanguage
dbpprop:screenshot
  • 250 (xsd:integer)
dbpprop:website
dbpprop:wikiPageUsesTemplate
dbpprop:wordnet_type
dcterms:subject
rdf:type
rdfs:comment
  • [editar] Heritrix Heritrix es un rastreador (o crawler) de ficheros web a través de internet. Su licencia es open-source y esta escrito completamente en JAVA. Su interfaz de configuración es accesible usando un navegador web, haciéndolo muy versátil y cómodo de usar, aunque también puede ser lanzando desde línea de comandos. Heritrix fue desarrollado conjuntamente por "Internet Archive" y "Nordic National Libraries" a principios de 2003.
  • Heritrix on pääasiassa Internet Archiven kehittämä hakurobotti verkkoaineistojen keräämiseen. Kehitystyössä on mukana myös muita IIPC:n jäseniä eli pääasiassa kansalliskirjastoja. Hakurobotti on toteutettu Javalla ja sisältää laajan valikoiman asetuksia, joilla erilaisia keruutoimintoja voidaan toteuttaa.
  • Heritrix is the Internet Archive’s web crawler, which was specially designed for web archiving. It is open-source and written in Java. The main interface is accessible using a web browser, and there is a command-line tool that can optionally be used to initiate crawls. Heritrix was developed jointly by Internet Archive and the Nordic national libraries on specifications written in early 2003.
  • Heritrix est un robot d'indexation conçu et utilisé par Internet Archive pour l'archivage du web. C'est un logiciel libre programmé en langage Java. Son interface principale est accessible depuis un navigateur web, mais un outil en interpréteur de commandes peut aussi être optionnellement utilisé pour lancer l'indexation. Heritrix a été développé conjointement par Internet Archive et les Bibliothèques Nationales Nordiques en 2003.
rdfs:label
  • Heritrix
  • Heritrix
  • Heritrix
  • Heritrix
owl:sameAs
foaf:depiction
foaf:homepage
foaf:name
  • Heritrix
foaf:page
is owl:sameAs of
is foaf:primaryTopic of