This HTML5 document contains 143 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Namespace Prefixes

PrefixIRI
n28http://dbpedia.org/resource/Master/
dctermshttp://purl.org/dc/terms/
n26https://www.youtube.com/
yago-reshttp://yago-knowledge.org/resource/
dbohttp://dbpedia.org/ontology/
foafhttp://xmlns.com/foaf/0.1/
n13http://dbpedia.org/resource/File:
n20https://github.com/RBigData/
n32http://userpages.umbc.edu/~gobbert/papers/REU2013Team2.pdf%7Caccessdate=2014-02-01%7Carchiveurl=https:/web.archive.org/web/20140204055902/http:/userpages.umbc.edu/~gobbert/papers/
dbpedia-eshttp://es.dbpedia.org/resource/
n17https://global.dbpedia.org/id/
n30https://cran.r-project.org/web/views/
n31http://userpages.umbc.edu/~gobbert/papers/REU2013Team1.pdf%7Caccessdate=2014-02-01%7Carchiveurl=https:/web.archive.org/web/20140204051351/http:/userpages.umbc.edu/~gobbert/papers/
yagohttp://dbpedia.org/class/yago/
schemahttp://schema.org/
dbthttp://dbpedia.org/resource/Template:
rdfshttp://www.w3.org/2000/01/rdf-schema#
n9http://rpubs.com/wush978/
freebasehttp://rdf.freebase.com/ns/
n14http://www.r-bloggers.com/r-at-12000-cores/
n16http://
n21http://commons.wikimedia.org/wiki/Special:FilePath/
n33http://userpages.umbc.edu/~gobbert/papers/pbdRtara2013.pdf%7Caccessdate=2013-06-26%7Carchiveurl=https:/web.archive.org/web/20140204051402/http:/userpages.umbc.edu/~gobbert/papers/
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
owlhttp://www.w3.org/2002/07/owl#
n10http://rwiki.sciviews.org/doku.php%3Fid=developers:projects:gsoc2013:mpiprofiler%7Carchive-url=https:/archive.today/20130629095333/http:/rwiki.sciviews.org/doku.php%3Fid=developers:projects:gsoc2013:
wikipedia-enhttp://en.wikipedia.org/wiki/
dbphttp://dbpedia.org/property/
dbchttp://dbpedia.org/resource/Category:
provhttp://www.w3.org/ns/prov#
xsdhhttp://www.w3.org/2001/XMLSchema#
wikidatahttp://www.wikidata.org/entity/
goldhttp://purl.org/linguistics/gold/
dbrhttp://dbpedia.org/resource/

Statements

Subject Item
dbr:Programming_with_Big_Data_in_R
rdf:type
yago:Datum105816622 yago:Cognition100023271 yago:Abstraction100002137 yago:WikicatDataMiningAndMachineLearningSoftware yago:ArtificialLanguage106894544 yago:WikicatProgrammingLanguages dbo:Language yago:ProgrammingLanguage106898352 yago:Communication100033020 dbo:ProgrammingLanguage yago:Information105816287 dbo:TelevisionShow wikidata:Q9143 owl:Thing wikidata:Q315 schema:Language yago:PsychologicalFeature100023100 yago:Language106282651 yago:WikicatFunctionalLanguages
rdfs:label
Programming with Big Data in R Programación con datos masivos en R
rdfs:comment
Programming with Big Data in R (pbdR) is a series of R packages and an environment for statistical computing with big data by using high-performance statistical computation. The pbdR uses the same programming language as R with S3/S4 classes and methods which is used among statisticians and data miners for developing statistical software. The significant difference between pbdR and R code is that pbdR mainly focuses on distributed memory systems, where data are distributed across several processors and analyzed in a batch mode, while communications between processors are based on MPI that is easily used in large high-performance computing (HPC) systems. R system mainly focuses on single multi-core machines for data analysis via an interactive mode such as GUI interface. La programación con datos masivos en R (pbdR, a partir del inglés Programming with Big Data in R)​ es una serie de paquetes R y un entorno para el cálculo estadístico con grandes volúmenes de datos mediante el uso de la programación de alto rendimiento estadístico.​ La pbdR utiliza el mismo lenguaje de programación que R con clases y métodos S3/S4 los cuales son usados entre los estadísticos y la minería de datos para el desarrollo de software estadístico. La diferencia significativa entre pbdR y el código R es que pbdR se centra principalmente en la memoria distribuida de los sistemas, donde los datos son distribuidos a través de varios procesadores y analizados en un modo por lotes, mientras que las comunicaciones entre procesadores se basan en MPI que se utiliza con gran facilidad en si
foaf:name
bdrp
foaf:homepage
n16:www.r-pbd.org
dbp:name
bdrp
foaf:depiction
n21:Pbd_overview.png
dcterms:subject
dbc:Free_statistical_software dbc:Cross-platform_free_software dbc:Parallel_computing dbc:Data-centric_programming_languages dbc:Data_mining_and_machine_learning_software dbc:Numerical_analysis_software_for_Linux dbc:Functional_languages dbc:Numerical_analysis_software_for_Windows dbc:Numerical_analysis_software_for_macOS
dbo:wikiPageID
39775648
dbo:wikiPageRevisionID
1121861265
dbo:wikiPageWikiLink
dbr:Graphics_processing_unit dbr:Cross-platform dbr:Distributed_memory dbr:MPMD dbc:Cross-platform_free_software dbc:Data-centric_programming_languages dbr:Dynamic_typing dbr:C_(programming_language) n13:Pbd_overview.png dbr:BLACS dbr:Statistical_software dbr:Statistical_computing dbc:Parallel_computing dbr:High-performance_computing dbc:Data_mining_and_machine_learning_software dbr:Fortran dbr:Open_MPI dbc:Numerical_analysis_software_for_Linux dbr:Programming_language_syntax dbr:Independent_and_identically_distributed_random_variables dbr:Singular_value_decomposition dbr:Batch_processing dbr:R_(programming_language) dbr:Multi-core_processor dbr:ScaLAPACK dbr:Computer_cluster dbr:Statistician dbr:Big_data dbr:Statistics dbr:S_(programming_language) dbr:Mixture_model dbr:NetCDF dbr:Graphical_user_interface dbr:PBLAS dbr:Data_mining dbr:Message_Passing_Interface dbc:Functional_languages dbr:Bootstrapping_(statistics) n28:slave_(technology) dbc:Numerical_analysis_software_for_Windows dbr:SPMD dbc:Numerical_analysis_software_for_macOS dbr:Library_(computing) dbr:ZeroMQ dbr:Monte_Carlo_method dbr:MPICH2 dbr:General_Public_License dbc:Free_statistical_software dbr:GitHub dbr:Mozilla_Public_License
dbo:wikiPageExternalLink
n9:pbdMPI-linux-pilot%7Ctitle=%E5%9C%A8%E9%9B%B2%E7%AB%AF%E9%81%8B%E7%AE%97%E7%92%B0%E5%A2%83%E4%BD%BF%E7%94%A8R%E5%92%8CMPI%7Cauthor=Wush n10:mpiprofiler%7Curl-status=dead%7Carchive-date=2013-06-29%7Ctitle=Profiling n14: n20: n26:watch%3Fv=m1vtPESsFqM%7Ctitle=%E5%BF%AB%E9%80%9F%E5%9C%A8AWS%E5%BB%BA%E7%AB%8BR%E5%92%8CpbdMPI%E7%9A%84%E4%BD%BF%E7%94%A8%E7%92%B0%E5%A2%83%7Cauthor=Wush n30:HighPerformanceComputing.html%7Cauthor-link=Dirk n31:REU2013Team1.pdf%7Carchivedate=2014-02-04%7Curl-status=dead n32:REU2013Team2.pdf%7Carchivedate=2014-02-04%7Curl-status=dead n33:pbdRtara2013.pdf%7Carchivedate=2014-02-04%7Curl-status=dead
owl:sameAs
yago-res:Programming_with_Big_Data_in_R n17:fDYt freebase:m.0w3311s dbpedia-es:Programación_con_datos_masivos_en_R wikidata:Q16975325
dbp:wikiPageUsesTemplate
dbt:Infobox_programming_language dbt:Cite_news dbt:Cite_web dbt:Cite_techreport dbt:URL dbt:Multiple_issues dbt:Official_website dbt:Citation_needed dbt:Reflist dbt:COI dbt:Notability dbt:Start_date_and_age
dbo:thumbnail
n21:Pbd_overview.png?width=300
dbp:designer
Wei-Chen Chen, George Ostrouchov, Pragneshkumar Patel, and Drew Schmidt
dbp:developer
pbdR Core Team
dbp:influencedBy
R, C, Fortran, MPI, and ØMQ
dbp:license
General Public License and Mozilla Public License
dbp:operatingSystem
dbr:Cross-platform
dbp:paradigm
SPMD and MPMD
dbp:typing
dbr:Dynamic_typing
dbo:abstract
Programming with Big Data in R (pbdR) is a series of R packages and an environment for statistical computing with big data by using high-performance statistical computation. The pbdR uses the same programming language as R with S3/S4 classes and methods which is used among statisticians and data miners for developing statistical software. The significant difference between pbdR and R code is that pbdR mainly focuses on distributed memory systems, where data are distributed across several processors and analyzed in a batch mode, while communications between processors are based on MPI that is easily used in large high-performance computing (HPC) systems. R system mainly focuses on single multi-core machines for data analysis via an interactive mode such as GUI interface. Two main implementations in R using MPI are Rmpi and pbdMPI of pbdR. * The pbdR built on pbdMPI uses SPMD parallelism where every processor is considered as worker and owns parts of data. The SPMD parallelism introduced in mid 1980 is particularly efficient in homogeneous computing environments for large data, for example, performing singular value decomposition on a large matrix, or performing clustering analysis on high-dimensional large data. On the other hand, there is no restriction to use manager/workers parallelism in SPMD parallelism environment. * The Rmpi uses manager/workers parallelism where one main processor (manager) serves as the control of all other processors (workers). The manager/workers parallelism introduced around early 2000 is particularly efficient for large tasks in small clusters, for example, bootstrap method and Monte Carlo simulation in applied statistics since i.i.d. assumption is commonly used in most statistical analysis. In particular, task pull parallelism has better performance for Rmpi in heterogeneous computing environments. The idea of SPMD parallelism is to let every processor do the same amount of work, but on different parts of a large data set. For example, a modern GPU is a large collection of slower co-processors that can simply apply the same computation on different parts of relatively smaller data, but the SPMD parallelism ends up with an efficient way to obtain final solutions (i.e. time to solution is shorter). La programación con datos masivos en R (pbdR, a partir del inglés Programming with Big Data in R)​ es una serie de paquetes R y un entorno para el cálculo estadístico con grandes volúmenes de datos mediante el uso de la programación de alto rendimiento estadístico.​ La pbdR utiliza el mismo lenguaje de programación que R con clases y métodos S3/S4 los cuales son usados entre los estadísticos y la minería de datos para el desarrollo de software estadístico. La diferencia significativa entre pbdR y el código R es que pbdR se centra principalmente en la memoria distribuida de los sistemas, donde los datos son distribuidos a través de varios procesadores y analizados en un modo por lotes, mientras que las comunicaciones entre procesadores se basan en MPI que se utiliza con gran facilidad en sistemas de computación de alto rendimiento (HPC). El sistema R se centra principalmente en máquinas simples multi-núcleo para el análisis de datos a través de un modo interactivo, tal como la interfaz gráfica de usuario. Las dos implementaciones principales en R utilizando MPI son Rmpi​ y pbdMPI de la pbdR. * La pbdR construida sobre pbdMPI utiliza paralelismo SPMD donde cada procesador se considera como esclavo y posee partes de los datos. El paralelismo SPMD introducido a mediados de 1980 es particularmente eficaz en entornos de cómputo homogéneos para datos de gran tamaño, por ejemplo, realizar la descomposición de valores singulares en una matriz grande, o realizar el análisis de clustering en grandes cantidades de datos de alta dimensión. Por otro lado, no hay ninguna restricción para utilizar paralelismo maestro/esclavo en entornos de paralelismo SPMD * El Rmpi​ utiliza paralelismo maestro/esclavo donde un procesador principal (maestro) sirve como el control de los otros procesadores (esclavos). El paralelismo maestro/esclavo introducido a principios del 2000 es particularmente eficaz para tareas grandes en clusters pequeños, por ejemplo, el método bootstrap y la simulación Monte Carlo en estadística aplicada desde probabilidades i.i.d. es generalmente más utilizada en análisis estadístico. En particular, el paralelismo de extracción de tareas tiene mejor rendimiento para Rmpi en entornos de cómputo heterogéneos. La idea del paralelismo PMD es para dejar que cada procesador haga la misma cantidad de trabajo, pero en partes diferentes de un conjunto grande de datos. Por ejemplo, un moderno GPU es una colección grande de co-procesadores más lento que pueden simplemente aplicar el mismo cálculo en partes diferentes sobre datos relativamente más pequeños, pero el paralelismo SPMD acaba con una manera eficaz de obtener soluciones finales (es decir, cronometrar que la solución sea más corta).​ Es claro que pbdR no es solo propio para clusters pequeños, sino también más estable para analizar grandes volúmenes de datos y más escalable para supercomputadoras.​ En resumen, pbdR * No le gusta el RMPI, ni paquetes paralelos en R, * No se centra en programación interactiva ni maestros/esclavos, * Pero es capaz de utilizar ambos paralelismos SPMD y de tarea.
dbp:latestTestVersion
Through GitHub at RBigData
gold:hypernym
dbr:Series
prov:wasDerivedFrom
wikipedia-en:Programming_with_Big_Data_in_R?oldid=1121861265&ns=0
dbo:wikiPageLength
13002
dbo:influencedBy
dbr:Message_Passing_Interface dbr:R_(programming_language) dbr:C_(programming_language) dbr:Fortran dbr:ZeroMQ
dbo:license
dbr:General_Public_License dbr:Mozilla_Public_License
foaf:isPrimaryTopicOf
wikipedia-en:Programming_with_Big_Data_in_R
Subject Item
dbr:ScaLAPACK
dbo:wikiPageWikiLink
dbr:Programming_with_Big_Data_in_R
Subject Item
dbr:Message_Passing_Interface
dbo:wikiPageWikiLink
dbr:Programming_with_Big_Data_in_R
Subject Item
dbr:List_of_statistical_software
dbo:wikiPageWikiLink
dbr:Programming_with_Big_Data_in_R
Subject Item
dbr:Outline_of_machine_learning
dbo:wikiPageWikiLink
dbr:Programming_with_Big_Data_in_R
Subject Item
dbr:PbdR
dbo:wikiPageWikiLink
dbr:Programming_with_Big_Data_in_R
dbo:wikiPageRedirects
dbr:Programming_with_Big_Data_in_R
Subject Item
wikipedia-en:Programming_with_Big_Data_in_R
foaf:primaryTopic
dbr:Programming_with_Big_Data_in_R