This HTML5 document contains 173 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Namespace Prefixes

PrefixIRI
dbthttp://dbpedia.org/resource/Template:
n38https://data.fivethirtyeight.com/
n32https://www.data.gov/
dbpedia-nohttp://no.dbpedia.org/resource/
wikipedia-enhttp://en.wikipedia.org/wiki/
dbrhttp://dbpedia.org/resource/
n11http://lib.stat.cmu.edu/jasadata/
dbpedia-hrhttp://hr.dbpedia.org/resource/
dbpedia-arhttp://ar.dbpedia.org/resource/
n54https://web.archive.org/web/20171023174701/http:/ftp.ics.uci.edu:80/pub/machine-learning-databases/liver-disorders/
n16https://github.com/aik84from/datasets/
dbpedia-frhttp://fr.dbpedia.org/resource/
dctermshttp://purl.org/dc/terms/
dbpedia-cshttp://cs.dbpedia.org/resource/
rdfshttp://www.w3.org/2000/01/rdf-schema#
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
n10http://si.dbpedia.org/resource/
dbphttp://dbpedia.org/property/
dbpedia-euhttp://eu.dbpedia.org/resource/
n49https://web.archive.org/web/20060910161517/http:/homes.stat.unipd.it/coles/public_html/ismev/
n20https://www.workwithdata.com/
xsdhhttp://www.w3.org/2001/XMLSchema#
dbpedia-ukhttp://uk.dbpedia.org/resource/
n18https://earthdata.nasa.gov/
n28http://data.wordlift.io/wl0216/entity/
n44http://linked-web-apis.fit.cvut.cz/resource/
dbohttp://dbpedia.org/ontology/
n14https://books.google.com/
n12http://www.uni-koeln.de/themen/statistik/data/rousseeuw/
dbpedia-pthttp://pt.dbpedia.org/resource/
n35http://lib.stat.cmu.edu/modules.php%3Fop=modload&name=PostWrap&file=index&page=datasets/
n45https://data.worldbank.org/
dbpedia-sqhttp://sq.dbpedia.org/resource/
n50https://opendata.cityofnewyork.us/
dbpedia-jahttp://ja.dbpedia.org/resource/
n21http://www.stat.columbia.edu/~gelman/book/data/
n61https://ourworldindata.org/
dbchttp://dbpedia.org/resource/Category:
dbpedia-dehttp://de.dbpedia.org/resource/
dbpedia-plhttp://pl.dbpedia.org/resource/
n64https://archive.ics.uci.edu/
dbpedia-thhttp://th.dbpedia.org/resource/
n39https://data.gov/
n31https://data.humdata.org/
n52https://data.gov.uk/
yagohttp://dbpedia.org/class/yago/
n58http://ta.dbpedia.org/resource/
wikidatahttp://www.wikidata.org/entity/
goldhttp://purl.org/linguistics/gold/
dbpedia-nlhttp://nl.dbpedia.org/resource/
n47https://global.dbpedia.org/id/
yago-reshttp://yago-knowledge.org/resource/
n36https://datahub.io/
dbpedia-ithttp://it.dbpedia.org/resource/
n41https://data.world/
provhttp://www.w3.org/ns/prov#
foafhttp://xmlns.com/foaf/0.1/
n53http://su.dbpedia.org/resource/
n29https://relational.fit.cvut.cz/
n43https://web.archive.org/web/20190214051201/http:/www.researchpipeline.com/mediawiki/
dbpedia-zhhttp://zh.dbpedia.org/resource/
dbpedia-kohttp://ko.dbpedia.org/resource/
dbpedia-fahttp://fa.dbpedia.org/resource/
dbpedia-eshttp://es.dbpedia.org/resource/
freebasehttp://rdf.freebase.com/ns/
owlhttp://www.w3.org/2002/07/owl#

Statements

Subject Item
dbr:Data_set
rdf:type
yago:Collection107951464 yago:WikicatStatisticalDataSets yago:Abstraction100002137 yago:Structure105726345 yago:PsychologicalFeature100023100 yago:Arrangement105726596 yago:Information105816287 yago:Set107996689 yago:Group100031264 yago:Cognition100023271 yago:WikicatComputerData dbo:Book yago:Datum105816622 yago:DataStructure105728493 yago:WikicatDataStructures
rdfs:label
Набір даних データセット Dataset Data set Zbiór danych Dataset Datenbasis 자료 집합 Datu-multzo Conjunto de datos Jeu de données 数据集 Dataset مجموعة بيانات Conjunto de dados
rdfs:comment
Un insieme di dati o dataset (anche data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En el caso de datos tabulados, un conjunto de datos contiene los valores para cada una de las variables organizadas como columnas, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos, que están organizados en filas. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos también puede consistir en una colección de documentos o de archivos. 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs « organisées » ou « contextualisées » (alias « données »), où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). データセット(英: data set, dataset)は、データの集合のこと。表形式のデータの場合、テーブルの各列が特定の変数を表し、各行が特定のレコードに対応するような1つ以上のデータベーステーブルをデータセットという。データセットには、各オブジェクトの高さや重量といった変数の値が並べられている。データセットは、ドキュメントやファイルの集合で構成することもできる。 オープンデータの分野では、データセットはパブリックなオープンデータリポジトリで公表された情報量を測定するための単位でもある。例えばは、50万以上のデータセットを集約している。データセットの定義は複数提案されているが、2020年現在公式の定義といえるものはない。データセットの中にはリアルタイムデータソースなども存在しており、そうしたデータの存在もまた、データセットの定義について合意することを困難にしている。 مجموعة البيانات هي تشكيلة من البيانات تُمثّل عادةً على شكل جدول كل عامود في الجدول يمثل متغير معين وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر فمثلًا يمكن أن يحدد الطول والعرض لمجسم معين و يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. 数据集是指数据的集合,而且数据集應該能被计算机处理。數據集中的值可以是数字,例如实数或整数,比如用厘米表示人的身高,但也可以是标称数据(即並非数值的數據),例如人的种族信息。數據集中的數據也可能存在缺失值,此時必须以某种方式指出數據存在缺失。 Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji, w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. De dataset representeert dan een verzameling rijen (ook records genoemd), elk voor één object (in de ruime zin van het woord, het kunnen bijvoorbeeld ook personen zijn). Een rij bevat de waarden voor elk van de variabelen, of attributen, voor het betreffende object, bijvoorbeeld lengte en gewicht. Een gegevensverzameling niet in tabelvorm kan de vorm hebben van een karakterstring, zoals een XML-bestand. Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. Eine Datenbasis (englisch dataset) ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as for example height and weight of an object, for each member of the data set. Data sets can also consist of a collection of documents or files.
dcterms:subject
dbc:Statistical_data_sets dbc:Computer_data
dbo:wikiPageID
8495
dbo:wikiPageRevisionID
1116780885
dbo:wikiPageWikiLink
dbr:Robust_statistics dbr:Statistical dbr:Kurtosis dbr:Time_series dbr:Column_(database) dbr:NoSQL dbr:Integer dbr:Robust_Regression_and_Outlier_Detection dbr:Variable_(computer_science) dbr:Statistical_population dbr:SPSS dbr:Imputation_(statistics) dbr:Real-time_data dbr:World_Bank dbr:Data_sharing dbr:Data_store dbr:Data.europa.eu dbr:MNIST_database dbc:Statistical_data_sets dbr:Statistical_measure dbr:Algorithms dbr:Row_(database) dbr:Anscombe's_quartet dbr:Andrew_Gelman dbr:Data_blending dbr:Data dbr:Missing_values dbr:Standard_deviation dbr:Level_of_measurement dbr:Categorical_data_analysis dbr:Interoperability dbr:Number dbr:Iris_flower_data_set dbr:Real_number dbr:Data_(computing) dbc:Computer_data dbr:Nominal_data dbr:Table_(database) dbr:Ronald_Fisher dbr:Sampling_(statistics) dbr:United_Nations_Office_for_the_Coordination_of_Humanitarian_Affairs dbr:Open_data dbr:Data_collection_system dbr:Statistics dbr:Peter_Rousseeuw dbr:Record_(computer_science) dbr:Data_samples dbr:Software
dbo:wikiPageExternalLink
n11: n12: n14:books%3Fid=uTzeRZFmaBgC&pg=PA100 n16: n18:gcmd n20: n21: n29: n31: n32: n35: n36: n38: n39: n41: n43:index.php%3Ftitle=Main_Page n45: n49:ismev.dat n50: n52: n54: n61: n64:
owl:sameAs
dbpedia-th:ชุดข้อมูล dbpedia-eu:Datu-multzo n10:දත්ත_කට්ටල dbpedia-pl:Zbiór_danych dbpedia-fa:مجموعه_داده dbpedia-nl:Dataset dbpedia-zh:数据集 dbpedia-no:Datasett wikidata:Q1172284 n28:dataset dbpedia-pt:Conjunto_de_dados yago-res:Data_set dbpedia-cs:Dataset dbpedia-sq:Grup_i_të_dhënave n44:dataset_format dbpedia-ja:データセット n47:EGXj dbpedia-it:Dataset dbpedia-ko:자료_집합 n53:Susunan_data dbpedia-uk:Набір_даних dbpedia-fr:Jeu_de_données dbpedia-ar:مجموعة_بيانات n58:தரவுக்கணம் dbpedia-de:Datenbasis freebase:m.02cck dbpedia-es:Conjunto_de_datos dbpedia-hr:Skup_podataka
dbp:wikiPageUsesTemplate
dbt:Clear dbt:For_multi dbt:Cite_book dbt:Reflist dbt:Wiktionary dbt:Short_description
dbo:abstract
Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Термін набір даних також використовується при визначенні даних в сукупності тісно пов'язаних таблиць, зображень тощо, що описують результати конкретного експерименту або подію. Прикладом такого типу є набори даних, зібрані космічними агентствами, що виконують експерименти з приладами на борту космічного зонда, або світлини, передані з космосу. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. Окремі набори даних є відкритими для використання, інші надаються за, звичайно символічну, плату. مجموعة البيانات هي تشكيلة من البيانات تُمثّل عادةً على شكل جدول كل عامود في الجدول يمثل متغير معين وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر فمثلًا يمكن أن يحدد الطول والعرض لمجسم معين و يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. من منطلق البيانات المفتوحة يُشير مفهوم مجموعة البيانات إلى البيانات التي يتم إطلاقها في مستودع البيانات المفتوحة. فمثلاً تعداد مجاميع البيانات في البوابة الأوربية للبيانات المفتوحة هو نصف مليون مجموعة بيانات. Un insieme di dati o dataset (anche data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. La dimensione del dataset è data dal numero dei membri presenti, che formano le righe, e dal numero delle variabili di cui si compone, che formano le colonne. Il termine dataset può essere usato anche più genericamente, per indicare i dati in un insieme di tabelle strettamente connesse, relative ad un particolare esperimento o evento. Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En el caso de datos tabulados, un conjunto de datos contiene los valores para cada una de las variables organizadas como columnas, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos, que están organizados en filas. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos también puede consistir en una colección de documentos o de archivos. Conjuntos de datos tan grandes que aplicaciones tradicionales de procesamiento de datos no los pueden tratar se llaman big data.​ Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. Datu multzotik bertatik informazio adierazgarria atera nahi bada, datu kopurua oso handia denean batik bat, komeni da datu multzoa taularatzea delako batean biltzea. Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. De dataset representeert dan een verzameling rijen (ook records genoemd), elk voor één object (in de ruime zin van het woord, het kunnen bijvoorbeeld ook personen zijn). Een rij bevat de waarden voor elk van de variabelen, of attributen, voor het betreffende object, bijvoorbeeld lengte en gewicht. Een verzameling rijen is op zichzelf niet geordend. Een weergave met de rijen in een andere volgorde is dan niet de weergave van een andere dataset. Ordening kan op basis van de waarde van een variabele. De rijen kunnen ook geordend zijn, los van de waarden van de variabelen. Als de datatabel van de al of niet geordende dataset maar één kolom heeft wordt deze wel vereenzelvigd met de betreffende (respectievelijk niet of wel) geordende multiset (die eventueel een verzameling is). Een gegevensverzameling niet in tabelvorm kan de vorm hebben van een karakterstring, zoals een XML-bestand. Eine Datenbasis (englisch dataset) ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. Je nach der verwendeten Datenverwaltungssoftware, zum Beispiel bei relationalen Datenbanken, werden unter „Datenbasis“ (begrifflich abgrenzend zum Verwaltungssystem DBMS) die Daten verstanden, die dort zu Datensätzen gleicher Art (Tabellen) zusammengefasst sind, je Datensatz aus mehreren Datenfeldern bestehend. Der Ausdruck „Datenbasis“ bezeichnet meist eine nicht exakt spezifizierte Datenmenge (wie „die Unternehmens-Datenbasis“). Im Sprachgebrauch wird er häufig auch als Synonym für Datenbestand, Datenbank oder Datei verwendet; jedoch beziehen sich diese Ausdrücke meist auf konkret bestimmte Daten (wie „Kundendatenbank“, „Auftragsdatei“). データセット(英: data set, dataset)は、データの集合のこと。表形式のデータの場合、テーブルの各列が特定の変数を表し、各行が特定のレコードに対応するような1つ以上のデータベーステーブルをデータセットという。データセットには、各オブジェクトの高さや重量といった変数の値が並べられている。データセットは、ドキュメントやファイルの集合で構成することもできる。 オープンデータの分野では、データセットはパブリックなオープンデータリポジトリで公表された情報量を測定するための単位でもある。例えばは、50万以上のデータセットを集約している。データセットの定義は複数提案されているが、2020年現在公式の定義といえるものはない。データセットの中にはリアルタイムデータソースなども存在しており、そうしたデータの存在もまた、データセットの定義について合意することを困難にしている。 Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs « organisées » ou « contextualisées » (alias « données »), où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. Quase todos os conjuntos de dados, embora eles muitas vezes possam ser escritos usando linguagens de programação de alto nível e números em base decimal, terminam escritos em código de máquina uma vez que o processamento por computador é envolvido. Assim, por toda a sua diversidade semântica e formas tabular ou não tabular, a maioria dos conjuntos de dados pode ser expressa em código binário como uma longa seqüência de zeros e uns. 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji, w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. Kolumny reprezentujące zmienne na skali interwałowej lub przedziałowej zawierają liczby rzeczywiste, natomiast kolumny opisujące zmienne na skali nominalnej i porządkowej mogą również zawierać liczby, ale także np. etykiety tekstowe. Ponadto w dowolnej komórce może także wystąpić przypadek braku danych, który musi być w jakiś sposób możliwy do zidentyfikowania – niekiedy rezerwuje się dla niego specjalną wartość liczbową lub znakową. Historycznie, termin powstał w świecie komputerów IBM mainframe, gdzie miał dobrze zdefiniowane znaczenie, bliskie współczesnym plikom. Dzisiaj w świecie komputerów najbardziej zbliżonym pojęciem do zbioru danych jest tabela w bazie danych. W statystyce zbiory danych zwykle stanowią wyniki obserwacji pewnej próby statystycznej. W statystyce teoretycznej niekiedy tworzy się zbiory danych sztucznie (np. w celu sprawdzenia jak dana metoda statystyczna reaguje na różne rozkłady w populacji). Istnieją też zaawansowane metody obliczania istotności statystycznej, które wymagają usuwania lub powielania obserwacji w zbiorze (np. bootstrap, walidacja krzyżowa). Chociaż termin „zbiór danych” sugeruje związek ze zbiorami w sensie matematycznej teorii mnogości,to jednak analogia ta nie sięga daleko. Elementy zbioru danych mogą się powtarzać, w przeciwieństwie do elementów zbioru matematycznego. A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as for example height and weight of an object, for each member of the data set. Data sets can also consist of a collection of documents or files. In the open data discipline, data set is the unit to measure the information released in a public open data repository. The European data.europa.eu portal aggregates more than a million data sets. Some other issues (real-time data sources, non-relational data sets, etc.) increases the difficulty to reach a consensus about it. 数据集是指数据的集合,而且数据集應該能被计算机处理。數據集中的值可以是数字,例如实数或整数,比如用厘米表示人的身高,但也可以是标称数据(即並非数值的數據),例如人的种族信息。數據集中的數據也可能存在缺失值,此時必须以某种方式指出數據存在缺失。
gold:hypernym
dbr:Collection
prov:wasDerivedFrom
wikipedia-en:Data_set?oldid=1116780885&ns=0
dbo:wikiPageLength
8342
foaf:isPrimaryTopicOf
wikipedia-en:Data_set