A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as height and weight of an object, for each member of the data set. Each value is known as a datum. Data sets can also consist of a collection of documents or files.

Property Value
dbo:abstract
  • مجموعة البيانات هي تشكيلة من البيانات وتُمثّل عادة على شكل جدول. كل عامود في الجدول يمثل متغير معين، وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر. مثلا، يمكن أن يحدد الطول والعرض لمجسم معين. يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. من منطلق البيانات المفتوحة يُشير مفهوم مجموعة البيانات إلى البيانات التي يتم إطلاقها في مستودع البيانات المفتوحة. فمثلاً تعداد مجاميع البيانات في البوابة الأوربية للبيانات المفتوحة هو نصف مليون مجموعة بيانات. (ar)
  • Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. (cs)
  • A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as height and weight of an object, for each member of the data set. Each value is known as a datum. Data sets can also consist of a collection of documents or files. In the open data discipline, data set is the unit to measure the information released in a public open data repository. The European Open Data portal aggregates more than half a million data sets. In this field other definitions have been proposed, but currently there is not an official one. Some other issues (real-time data sources, non-relational data sets, etc.) increases the difficulty to reach a consensus about it. (en)
  • Eine Datenbasis ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. Je nach der verwendeten Datenverwaltungssoftware, zum Beispiel bei relationalen Datenbanken, werden unter „Datenbasis“ (begrifflich abgrenzend zum Verwaltungssystem DBMS) die Daten verstanden, die dort zu Datensätzen gleicher Art (Tabellen) zusammengefasst sind, je Datensatz aus mehreren Datenfeldern bestehend. Der Ausdruck „Datenbasis“ bezeichnet meist eine nicht exakt spezifizierte Datenmenge (wie „die Unternehmens-Datenbasis“). Im Sprachgebrauch wird er häufig auch als Synonym für Datenbestand, Datenbank oder Datei verwendet; jedoch beziehen sich diese Ausdrücke meist auf konkret bestimmte Daten (wie „Kundendatenbank“, „Auftragsdatei“). (de)
  • Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En general, y en su versión más simple, un conjunto de datos corresponde a los contenidos de una única tabla de base de datos o una única matriz de datos estadística, donde cada columna de la tabla representa una variable en particular, y cada fila representa a un miembro determinado del conjunto de datos en cuestión. Un conjunto de datos contiene los valores para cada una de las variables, como por ejemplo la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos puede incluir datos para uno o más miembros en función de su número de filas. Conjuntos de datos tan grandes que aplicaciones tradicionales de procesamiento de datos no los pueden tratar se llaman big data.​ (es)
  • Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. Datu multzotik bertatik informazio adierazgarria atera nahi bada, datu kopurua oso handia denean batik bat, komeni da datu multzoa taularatzea delako batean biltzea. (eu)
  • Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs (ou données) où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). (fr)
  • Un dataset (o data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. La dimensione del dataset è data dal numero dei membri presenti, che formano le righe, e dal numero delle variabili di cui si compone, che formano le colonne. Il termine dataset può essere usato anche più genericamente, per indicare i dati in un insieme di tabelle strettamente connesse, relative ad un particolare esperimento o evento. (it)
  • 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. (ko)
  • Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji (), w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. Kolumny reprezentujące zmienne na skali interwałowej lub przedziałowej zawierają liczby rzeczywiste, natomiast kolumny opisujące zmienne na skali nominalnej i porządkowej mogą również zawierać liczby, ale także np. etykiety tekstowe. Ponadto w dowolnej komórce może także wystąpić przypadek braku danych, który musi być w jakiś sposób możliwy do zidentyfikowania – niekiedy rezerwuje się dla niego specjalną wartość liczbową lub znakową. Historycznie, termin powstał w świecie komputerów IBM mainframe, gdzie miał dobrze zdefiniowane znaczenie, bliskie współczesnym plikom. Dzisiaj w świecie komputerów najbardziej zbliżonym pojęciem do zbioru danych jest tabela w bazie danych. W statystyce zbiory danych zwykle stanowią wyniki obserwacji pewnej próby statystycznej. W statystyce teoretycznej niekiedy tworzy się zbiory danych sztucznie (np. w celu sprawdzenia jak dana metoda statystyczna reaguje na różne rozkłady w populacji). Istnieją też zaawansowane metody obliczania istotności statystycznej, które wymagają usuwania lub powielania obserwacji w zbiorze (np. bootstrap, walidacja krzyżowa). Chociaż termin „zbiór danych” sugeruje związek ze zbiorami w sensie matematycznej teorii mnogości,to jednak analogia ta nie sięga daleko. Elementy zbioru danych mogą się powtarzać, w przeciwieństwie do elementów zbioru matematycznego. (pl)
  • Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. Elke rij komt overeen met een bepaald lid van de gegevensverzameling in kwestie. Deze rij bevat de waarden voor elk van de variabelen, of attributen, voor dit lid, bijvoorbeeld lengte en gewicht of ook willekeurige getallen. Elke waarde staat bekend als een datum. De gegevensverzameling kan gegevens voor een of meer leden bevatten, overeenkomend met het aantal rijen. Een gegevensverzameling niet in tabelvorm kan de vorm hebben van een karakterstring, zoals een XML-bestand. (nl)
  • Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. Quase todos os conjuntos de dados, embora eles muitas vezes possam ser escritos usando linguagens de programação de alto nível e números em base decimal, terminam escritos em código de máquina uma vez que o processamento por computador é envolvido. Assim, por toda a sua diversidade semântica e formas tabular ou não tabular, a maioria dos conjuntos de dados pode ser expressa em código binário como uma longa seqüência de zeros e uns. (pt)
  • Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Термін набір даних також використовується при визначенні даних в сукупності тісно пов'язаних таблиць, зображень тощо, що описують результати конкретного експерименту або подію. Прикладом такого типу є набори даних, зібрані космічними агентствами, що виконують експерименти з приладами на борту космічного зонда, або світлини, передані з космосу. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. Окремі набори даних є відкритими для використання, інші надаються за, звичайно символічну, плату. (uk)
dbo:wikiPageExternalLink
dbo:wikiPageID
  • 8495 (xsd:integer)
dbo:wikiPageLength
  • 7947 (xsd:integer)
dbo:wikiPageRevisionID
  • 978302659 (xsd:integer)
dbo:wikiPageWikiLink
dbp:wikiPageUsesTemplate
dct:subject
rdf:type
rdfs:comment
  • Dataset je kolekce (shluk) dat. Nejčastěji dataset odpovídá obsahu jedné databázové tabulky nebo jedné statistické datové matici (např. v CSV), kde každý sloupec tabulky reprezentuje hodnoty jedné proměnné (atributu) a každý řádek odpovídá jedné položce příslušné kolekce dat. Dataset udává hodnoty pro všechny proměnné pro všechny položky v kolekci dat. Dataset poskytuje data pro jednu nebo několik položek, jejichž počet odpovídá počtu řádků. Volněji se termín dataset používá pro kolekci vzájemně propojených tabulek nebo souborů, které se vztahují k určitému experimentu nebo události. (cs)
  • Un jeu de données (en anglais dataset ou data set) est un ensemble de valeurs (ou données) où chaque valeur est associée à une variable (ou attribut) et à une observation. Une variable décrit l'ensemble des valeurs décrivant le même attribut et une observation contient l'ensemble des valeurs décrivant les attributs d'une unité (ou individu statistique). (fr)
  • 자료 집합 또는 데이터 세트(data set)는 자료의 모임이다. 일반적으로 자료 집합은 하나의 데이터베이스 테이블의 내용이나 하나의 통계적 자료 행렬과 일치하며 여기에서 테이블의 모든 컬럼은 특정한 변수를 대표하며 각 로우는 제기된 자료 집합의 주어진 멤버와 일치한다. 이 자료 집합은 변수 개개의 값들을 나열하는데, 이를테면 자료 집합의 각 멤버에 대한 물체의 높이와 무게를 들 수 있다. 각각의 값은 자료라고 부른다. 자료 집합은 하나 이상의 멤버에 대한 데이터를 이루며, 로우의 수와 일치한다. 자료 집합이라는 용어는 또한 특정한 실험이나 이벤트에 상응하는, 밀접히 관계된 테이블의 모임 안의 데이터를 가리킬 수도 있다. 이러한 종류의 예는 우주 탐사체의 장비로 실험을 수행하는 항공 우주국에 의해 수집된 데이터 집합을 들 수 있다. (ko)
  • مجموعة البيانات هي تشكيلة من البيانات وتُمثّل عادة على شكل جدول. كل عامود في الجدول يمثل متغير معين، وكل صف يعود إلى أحد عناصر مجموعة البيانات. يحدد هذا الجدول قيماً لكل متغير لهذا العنصر. مثلا، يمكن أن يحدد الطول والعرض لمجسم معين. يمكن أن تحتوي مجموعة البيانات على عنصر واحد أو أكثر بحسب عدد الصفوف. يستخدم مصطلح مجموعة البيانات على نحو فضفاض أحياناً، فهي تشير في أحيان كثيرة إلى مجموعة بيانات في جداول مترابطة فيما بينها بعلاقات، مُشيرةً إلى تجربة أو حدث معين. (ar)
  • Eine Datenbasis ist eine Menge von Daten, die in einem bestimmten Zusammenhang oder für einen bestimmten Zweck erhoben oder verwaltet werden. Die Daten können in unterschiedlichen Formen gespeichert sein, beispielsweise in Datenbanken oder Dateien, meist als Inhalte elektronischer Datenträger. (de)
  • A data set (or dataset) is a collection of data. In the case of tabular data, a data set corresponds to one or more database tables, where every column of a table represents a particular variable, and each row corresponds to a given record of the data set in question. The data set lists values for each of the variables, such as height and weight of an object, for each member of the data set. Each value is known as a datum. Data sets can also consist of a collection of documents or files. (en)
  • Estatistikan, datu multzoa datu bilduma bat da, erregistrotzat edukitzeko edo datuen beraien azterketa sakonagoa egiteko, datu multzo barneko erregulartasunak eta joerak antzematearren, datuek erakusten duten aldakortasunaren gainetik estatistika erabiliz. Datu multzoak erabilgarriak izan daitezen, kalkuluak eta azterketak behar bezala egiteko, modu ordenatu batean azaldu behar dira. Datu multzoak azaltzeko ohizko modu bat lerroetan jartzea, elementu hauen gainean jasotako aldagai ezberdinen balioak zutabetan jarri behar direlarik, kalkulu orri batean gelaxkak azaltzen diren bezalaxe. (eu)
  • Un conjunto de datos (conocido también por el anglicismo dataset, comúnmente utilizado en algunos países hispanohablantes) es una colección de datos habitualmente tabulada. En general, y en su versión más simple, un conjunto de datos corresponde a los contenidos de una única tabla de base de datos o una única matriz de datos estadística, donde cada columna de la tabla representa una variable en particular, y cada fila representa a un miembro determinado del conjunto de datos en cuestión. (es)
  • Un dataset (o data set) è una collezione di dati. Più comunemente un dataset costituisce un insieme di dati strutturati in forma relazionale, cioè corrisponde al contenuto di una singola tabella di base di dati, oppure ad una singola matrice di dati statistici, in cui ogni colonna della tabella rappresenta una particolare variabile, e ogni riga corrisponde ad un determinato membro del dataset in questione. La dimensione del dataset è data dal numero dei membri presenti, che formano le righe, e dal numero delle variabili di cui si compone, che formano le colonne. (it)
  • Zbiór danych – kolekcja danych statystycznych zwykle ujętych w formie stabelaryzowanej. Najczęściej kolumny odpowiadają obserwowanym cechom statystycznym, a każdy wiersz opisuje jedną obserwację z próby. Wartości komórek macierzy natomiast opisują realizacje danych zmiennych w kolejnych obserwacjach. Szczególnym przypadkiem jest też macierz kontyngencji (), w której wiersze odpowiadają etykietom jednej zmiennej nominalnej, kolumny etykietom drugiej zmiennej, a wartości macierzy odpowiadają liczności w próbie obserwacji o danych wartościach tych dwóch zmiennych. (pl)
  • Een gegevensverzameling of dataset is een verzameling van gegevens (data), meestal gepresenteerd in tabelvorm. Elke kolom vertegenwoordigt een bepaalde variabele. Elke rij komt overeen met een bepaald lid van de gegevensverzameling in kwestie. Deze rij bevat de waarden voor elk van de variabelen, of attributen, voor dit lid, bijvoorbeeld lengte en gewicht of ook willekeurige getallen. Elke waarde staat bekend als een datum. De gegevensverzameling kan gegevens voor een of meer leden bevatten, overeenkomend met het aantal rijen. (nl)
  • Um conjunto de dados ou "dataset" é uma coleção de dados normalmente tabulados. Por cada elemento (ou indivíduo) se indicam várias características. Cada coluna representa uma variável particular. Cada linha corresponde a um determinado membro do conjunto de dados em questão. Cada valor é conhecido como um dado. O conjunto de dados pode incluir dados para um ou mais membros, correspondente ao número de linhas. Conjuntos de dados não tabulares podem assumir a forma de cadeias de caracteres envolvidas por marcações, como em um arquivo XML. (pt)
  • Набір даних — колекція однотипних даних, що застосовується в задачах машинної обробки даних. Найчастіше набір даних відповідає змісту однієї таблиці бази даних або статистичній , де кожна з колонок таблиці містить однорідні значення, а кожен з рядків таблиці відповідає певному члену набору даних. Наприклад, набір даних про квіти може містити назву різновиду, розміри пелюсток, яскравість забарвлення тощо. Окремі набори даних широко використовуються в академічних колах як тестові набори, що підтверджують результати наукових досліджень. (uk)
rdfs:label
  • مجموعة بيانات (ar)
  • Dataset (cs)
  • Datenbasis (de)
  • Data set (en)
  • Conjunto de datos (es)
  • Datu-multzo (eu)
  • Jeu de données (fr)
  • Dataset (it)
  • 자료 집합 (ko)
  • Dataset (nl)
  • Zbiór danych (pl)
  • Conjunto de dados (pt)
  • Набір даних (uk)
owl:sameAs
prov:wasDerivedFrom
foaf:isPrimaryTopicOf
is dbo:type of
is dbo:wikiPageRedirects of
is dbo:wikiPageWikiLink of
is dbp:content of
is dbp:type of
is foaf:primaryTopic of