About: Common Crawl

Property	Value
dbo:description	некомерційна організація, що займається сканування вебмережі (uk) és una organització sense ànim de lucre que rastreja el web i proporciona lliurement els seus arxius i conjunts de dades al públic. (ca) nonprofit organization eponym of a large web periodic and open crawl (en) یادنام یک سازمان غیرانتفاعی که کار خزیدن دوره ای و باز وب را انجام میدهد (fa) Fondation sans but lucratif éponyme d'un moissonnage périodique et ouvert du web (fr)
dbo:foundedBy	dbr:Gil_Elbaz
dbo:keyPerson	dbr:Eva_Ho dbr:Peter_Norvig dbr:Rich_Skrenta
dbo:location	dbr:Los_Angeles dbr:San_Francisco
dbo:thumbnail	wiki-commons:Special:FilePath/Common_Crawl_logo.svg?width=300
dbo:type	dbr:501(c)(3)_organization
dbo:wikiPageExternalLink	http://commoncrawl.org/ https://commoncrawl.org/connect/blog/ https://github.com/commoncrawl/ https://groups.google.com/forum/%3Ffromgroups%23!forum/common-crawl
dbo:wikiPageWikiLink	dbr:Gil_Elbaz dbr:English_language dbr:Amazon_Web_Services dbr:Nonprofit_organization dbr:Fair_use dbr:Kurt_Bollacker dbr:Timnit_Gebru dbr:Benelux dbr:501(c)_organization dbr:Nofollow dbr:Jurisdiction dbr:Web_crawler dbr:Metadata dbr:Search_engine_optimization dbr:Joi_Ito dbr:ARC_(file_format) dbr:Web_archiving dbr:Peter_Norvig dbr:Blekko dbr:Carl_Malamud dbr:Nova_Spivack dbr:GPT-3 dbc:Internet-related_organizations dbc:Web_archiving_initiatives dbc:Web_archiving dbr:Nutch dbr:501(c)(3) dbr:Apache_Software_Foundation dbr:Los_Angeles,_California dbr:San_Francisco,_California dbr:Web_ARChive dbr:SURFsara dbr:Robot_exclusion_standard
dbp:companyType	501 (xsd:integer)
dbp:foundation	2007 (xsd:integer)
dbp:founder	dbr:Gil_Elbaz
dbp:keyPeople	dbr:Eva_Ho dbr:Peter_Norvig dbr:Rich_Skrenta
dbp:license	Apache 2.0 (en)
dbp:location	San Francisco, California; Los Angeles, California, United States (en)
dbp:logo	Common Crawl logo.svg (en)
dbp:name	Common Crawl (en)
dbp:wikiPageUsesTemplate	dbt:Clarify dbt:Reflist dbt:Short_description dbt:Url dbt:Infobox_dot-com_company
dct:subject	dbc:Internet-related_organizations dbc:Web_archiving_initiatives dbc:Web_archiving
gold:hypernym	dbr:Organization
rdf:type	owl:Thing dbo:Company dbo:Company dbo:Company dul:Agent dul:SocialPerson wikidata:Q24229398 wikidata:Q43229 wikidata:Q4830453 dbo:Agent dbo:Agent dbo:Non-ProfitOrganisation dbo:Organisation dbo:Organisation schema:Organization
rdfs:label	Common Crawl (en) Common Crawl (es) コモン・クロール (ja) Common Crawl (sv)
owl:sameAs	freebase:Common Crawl yago-res:Common Crawl wikidata:Common Crawl dbpedia-es:Common Crawl dbpedia-tr:Common Crawl dbpedia-ja:Common Crawl dbpedia-sv:Common Crawl dbpedia-global:Common Crawl
prov:wasDerivedFrom	wikipedia-en:Common_Crawl?oldid=1296764368&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Common_Crawl_logo.svg
foaf:isPrimaryTopicOf	wikipedia-en:Common_Crawl
foaf:name	Common Crawl (en)
is dbo:knownFor of	dbr:Joi_Ito
is dbo:wikiPageRedirects of	dbr:CommonCrawl dbr:Commoncrawl.org
is dbo:wikiPageWikiLink of	dbr:LAION dbr:Stable_Diffusion dbr:Gil_Elbaz dbr:James_Hendler dbr:Wayback_Machine dbr:Kurt_Bollacker dbr:Web_archiving dbr:StormCrawler dbr:Global_Multimedia_Protocols_Group dbr:Nova_Spivack dbr:Apache_Nutch dbr:GPT-3 dbr:Transformer_(machine_learning_model) dbr:CommonCrawl dbr:Commoncrawl.org
is dbp:knownFor of	dbr:Joi_Ito
is foaf:primaryTopic of	wikipedia-en:Common_Crawl