About: Data set

An Entity of Type: book, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as for example height and weight of an object, for each member of the data set. Data sets can also consist of a collection of documents or files.

Property Value
dbo:abstract
  • مجموعة البيانات هي تشكيلة من البيانات تُمثّل عادةً على شكل جدول كل عامود في الجدول يمثل متغير معين وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر فمثلًا يمكن أن يحدد الطول والعرض لمجسم معين و يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. من منطلق البيانات المفتوحة يُشير مفهوم مجموعة البيانات إلى البيانات التي يتم إطلاقها في مستودع البيانات المفتوحة. فمثلاً تعداد مجاميع البيانات في البوابة الأوربية للبيانات المفتوحة هو نصف مليون مجموعة بيانات. (ar)
  • Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. (cs)
  • Eine Datenbasis (englisch dataset) ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. Je nach der verwendeten Datenverwaltungssoftware, zum Beispiel bei relationalen Datenbanken, werden unter „Datenbasis“ (begrifflich abgrenzend zum Verwaltungssystem DBMS) die Daten verstanden, die dort zu Datensätzen gleicher Art (Tabellen) zusammengefasst sind, je Datensatz aus mehreren Datenfeldern bestehend. Der Ausdruck „Datenbasis“ bezeichnet meist eine nicht exakt spezifizierte Datenmenge (wie „die Unternehmens-Datenbasis“). Im Sprachgebrauch wird er häufig auch als Synonym für Datenbestand, Datenbank oder Datei verwendet; jedoch beziehen sich diese Ausdrücke meist auf konkret bestimmte Daten (wie „Kundendatenbank“, „Auftragsdatei“). (de)
  • A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as for example height and weight of an object, for each member of the data set. Data sets can also consist of a collection of documents or files. In the open data discipline, data set is the unit to measure the information released in a public open data repository. The European data.europa.eu portal aggregates more than a million data sets. Some other issues (real-time data sources, non-relational data sets, etc.) increases the difficulty to reach a consensus about it. (en)
  • Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. Datu multzotik bertatik informazio adierazgarria atera nahi bada, datu kopurua oso handia denean batik bat, komeni da datu multzoa taularatzea delako batean biltzea. (eu)
  • Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En el caso de datos tabulados, un conjunto de datos contiene los valores para cada una de las variables organizadas como columnas, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos, que están organizados en filas. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos también puede consistir en una colección de documentos o de archivos. Conjuntos de datos tan grandes que aplicaciones tradicionales de procesamiento de datos no los pueden tratar se llaman big data.​ (es)
  • Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs « organisées » ou « contextualisées » (alias « données »), où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). (fr)
  • 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. (ko)
  • Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. De dataset representeert dan een verzameling rijen (ook records genoemd), elk voor één object (in de ruime zin van het woord, het kunnen bijvoorbeeld ook personen zijn). Een rij bevat de waarden voor elk van de variabelen, of attributen, voor het betreffende object, bijvoorbeeld lengte en gewicht. Een verzameling rijen is op zichzelf niet geordend. Een weergave met de rijen in een andere volgorde is dan niet de weergave van een andere dataset. Ordening kan op basis van de waarde van een variabele. De rijen kunnen ook geordend zijn, los van de waarden van de variabelen. Als de datatabel van de al of niet geordende dataset maar één kolom heeft wordt deze wel vereenzelvigd met de betreffende (respectievelijk niet of wel) geordende multiset (die eventueel een verzameling is). Een gegevensverzameling niet in tabelvorm kan de vorm hebben van een karakterstring, zoals een XML-bestand. (nl)
  • Un insieme di dati o dataset (anche data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. La dimensione del dataset è data dal numero dei membri presenti, che formano le righe, e dal numero delle variabili di cui si compone, che formano le colonne. Il termine dataset può essere usato anche più genericamente, per indicare i dati in un insieme di tabelle strettamente connesse, relative ad un particolare esperimento o evento. (it)
  • データセット(英: data set, dataset)は、データの集合のこと。表形式のデータの場合、テーブルの各列が特定の変数を表し、各行が特定のレコードに対応するような1つ以上のデータベーステーブルをデータセットという。データセットには、各オブジェクトの高さや重量といった変数の値が並べられている。データセットは、ドキュメントやファイルの集合で構成することもできる。 オープンデータの分野では、データセットはパブリックなオープンデータリポジトリで公表された情報量を測定するための単位でもある。例えばは、50万以上のデータセットを集約している。データセットの定義は複数提案されているが、2020年現在公式の定義といえるものはない。データセットの中にはリアルタイムデータソースなども存在しており、そうしたデータの存在もまた、データセットの定義について合意することを困難にしている。 (ja)
  • Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji, w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. Kolumny reprezentujące zmienne na skali interwałowej lub przedziałowej zawierają liczby rzeczywiste, natomiast kolumny opisujące zmienne na skali nominalnej i porządkowej mogą również zawierać liczby, ale także np. etykiety tekstowe. Ponadto w dowolnej komórce może także wystąpić przypadek braku danych, który musi być w jakiś sposób możliwy do zidentyfikowania – niekiedy rezerwuje się dla niego specjalną wartość liczbową lub znakową. Historycznie, termin powstał w świecie komputerów IBM mainframe, gdzie miał dobrze zdefiniowane znaczenie, bliskie współczesnym plikom. Dzisiaj w świecie komputerów najbardziej zbliżonym pojęciem do zbioru danych jest tabela w bazie danych. W statystyce zbiory danych zwykle stanowią wyniki obserwacji pewnej próby statystycznej. W statystyce teoretycznej niekiedy tworzy się zbiory danych sztucznie (np. w celu sprawdzenia jak dana metoda statystyczna reaguje na różne rozkłady w populacji). Istnieją też zaawansowane metody obliczania istotności statystycznej, które wymagają usuwania lub powielania obserwacji w zbiorze (np. bootstrap, walidacja krzyżowa). Chociaż termin „zbiór danych” sugeruje związek ze zbiorami w sensie matematycznej teorii mnogości,to jednak analogia ta nie sięga daleko. Elementy zbioru danych mogą się powtarzać, w przeciwieństwie do elementów zbioru matematycznego. (pl)
  • Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. Quase todos os conjuntos de dados, embora eles muitas vezes possam ser escritos usando linguagens de programação de alto nível e números em base decimal, terminam escritos em código de máquina uma vez que o processamento por computador é envolvido. Assim, por toda a sua diversidade semântica e formas tabular ou não tabular, a maioria dos conjuntos de dados pode ser expressa em código binário como uma longa seqüência de zeros e uns. (pt)
  • Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Термін набір даних також використовується при визначенні даних в сукупності тісно пов'язаних таблиць, зображень тощо, що описують результати конкретного експерименту або подію. Прикладом такого типу є набори даних, зібрані космічними агентствами, що виконують експерименти з приладами на борту космічного зонда, або світлини, передані з космосу. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. Окремі набори даних є відкритими для використання, інші надаються за, звичайно символічну, плату. (uk)
  • 数据集是指数据的集合,而且数据集應該能被计算机处理。數據集中的值可以是数字,例如实数或整数,比如用厘米表示人的身高,但也可以是标称数据(即並非数值的數據),例如人的种族信息。數據集中的數據也可能存在缺失值,此時必须以某种方式指出數據存在缺失。 (zh)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 8495 (xsd:integer)
dbo:wikiPageLength
  • 8342 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID
  • 1116780885 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dcterms:subject
gold:hypernym
rdf:type
rdfs:comment
  • Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. (cs)
  • Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs « organisées » ou « contextualisées » (alias « données »), où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). (fr)
  • 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. (ko)
  • データセット(英: data set, dataset)は、データの集合のこと。表形式のデータの場合、テーブルの各列が特定の変数を表し、各行が特定のレコードに対応するような1つ以上のデータベーステーブルをデータセットという。データセットには、各オブジェクトの高さや重量といった変数の値が並べられている。データセットは、ドキュメントやファイルの集合で構成することもできる。 オープンデータの分野では、データセットはパブリックなオープンデータリポジトリで公表された情報量を測定するための単位でもある。例えばは、50万以上のデータセットを集約している。データセットの定義は複数提案されているが、2020年現在公式の定義といえるものはない。データセットの中にはリアルタイムデータソースなども存在しており、そうしたデータの存在もまた、データセットの定義について合意することを困難にしている。 (ja)
  • 数据集是指数据的集合,而且数据集應該能被计算机处理。數據集中的值可以是数字,例如实数或整数,比如用厘米表示人的身高,但也可以是标称数据(即並非数值的數據),例如人的种族信息。數據集中的數據也可能存在缺失值,此時必须以某种方式指出數據存在缺失。 (zh)
  • مجموعة البيانات هي تشكيلة من البيانات تُمثّل عادةً على شكل جدول كل عامود في الجدول يمثل متغير معين وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر فمثلًا يمكن أن يحدد الطول والعرض لمجسم معين و يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. (ar)
  • Eine Datenbasis (englisch dataset) ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. (de)
  • A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as for example height and weight of an object, for each member of the data set. Data sets can also consist of a collection of documents or files. (en)
  • Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En el caso de datos tabulados, un conjunto de datos contiene los valores para cada una de las variables organizadas como columnas, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos, que están organizados en filas. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos también puede consistir en una colección de documentos o de archivos. (es)
  • Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. (eu)
  • Un insieme di dati o dataset (anche data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. (it)
  • Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. (pt)
  • Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. De dataset representeert dan een verzameling rijen (ook records genoemd), elk voor één object (in de ruime zin van het woord, het kunnen bijvoorbeeld ook personen zijn). Een rij bevat de waarden voor elk van de variabelen, of attributen, voor het betreffende object, bijvoorbeeld lengte en gewicht. Een gegevensverzameling niet in tabelvorm kan de vorm hebben van een karakterstring, zoals een XML-bestand. (nl)
  • Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji, w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. (pl)
  • Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. (uk)
rdfs:label
  • مجموعة بيانات (ar)
  • Dataset (cs)
  • Datenbasis (de)
  • Conjunto de datos (es)
  • Data set (en)
  • Datu-multzo (eu)
  • Jeu de données (fr)
  • Dataset (it)
  • 자료 집합 (ko)
  • データセット (ja)
  • Dataset (nl)
  • Zbiór danych (pl)
  • Conjunto de dados (pt)
  • Набір даних (uk)
  • 数据集 (zh)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:type of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:type of
is foaf:primaryTopic of
Powered by OpenLink Virtuoso    This material is Open Knowledge     W3C Semantic Web Technology     This material is Open Knowledge    Valid XHTML + RDFa
This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License