About: UIMA

Facets (new session)
Description
Metadata
Settings
- Rule:
- Inverse Functional Properties:
- "Same As":

About: UIMA Goto Sponge NotDistinct Permalink

An Entity of Type : yago:WikicatDataMiningAndMachineLearningSoftware, within Data Space : dbpedia.org associated with source document(s)
QRcode icon

http://dbpedia.org/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FUIMA&graph=http%3A%2F%2Fdbpedia.org&graph=http%3A%2F%2Fdbpedia.org

UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies.

Attributes	Values
rdf:type	Thing software schema:CreativeWork work wikidata:Q386724 Software yago:Abstraction100002137 yago:Code106355894 yago:CodingSystem106353757 yago:Cognition100023271 yago:Communication100033020 yago:Datum105816622 yago:Information105816287 yago:PsychologicalFeature100023100 yago:Writing106359877 yago:WrittenCommunication106349220 yago:Software106566077 yago:WikicatDataMiningAndMachineLearningSoftware
rdfs:label	UIMA (de) UIMA (es) Apache UIMA (it) UIMA (en) UIMA (zh)
rdfs:comment	UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies. (en) UIMA（全称Unstructured Information Management Architecture，即非结构化信息管理架构）于2009年3月作为，是一个组件化的软件架构，用于分析同终端用户相关联的大容量非结构化信息。 (zh) UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von Data-Mining-Anwendungen, d. h. zur Wissensextraktion. UIMA wird insbesondere in der Forschung eingesetzt, entwickelt sich aber auch immer mehr zum Industrie-Standard. Eine der bekanntesten Anwendungen von UIMA ist der Einsatz im IBM Watson. (de) UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en. (es) Apache UIMA (dall'inglese Unstructured Information Management Architecture) è un framework, sviluppato nei linguaggi di programmazione Java e C++, per il trattamento e l'analisi di informazioni semi-strutturate, e l'estrazione di informazioni da esse. Fa parte dei software sviluppati dalla Apache Software Foundation. UIMA definisce un'interfaccia per le varie componenti di analisi (Analysis Engine) che lo sviluppatore può implementare (ad esempio, conversione di file binario in testo, annotazione di concetti o di nomi propri, conversione in formato XML...). (it)
foaf:name	Apache UIMA (en)
foaf:homepage	https://uima.apache.org/
name	Apache UIMA (en)
foaf:depiction
dcterms:subject	Apache Software Foundation projects Software architecture Data mining and machine learning software
Wikipage page ID	2422681 (xsd:integer)
Wikipage revision ID	1085866372 (xsd:integer)
Link from a Wikipage to another Wikipage	Apache Software Foundation projects Information extraction Cross-platform General Architecture for Text Engineering Apache License Pipeline (software) Unstructured data C++ Data Discovery and Query Builder Watson (computer) LanguageWare Software architecture Data mining and machine learning software Java (programming language) Reference implementation IBM Apache Software Foundation OASIS (organization) Search algorithm CTAKES XML Ubiquitous Knowledge Processing Lab IBM Omnifind IBM Research Text mining Unstructured information Entity extraction Content analytics Design pattern (computer science) Component software dbr:Multi-modal_analytics
Link from a Wikipage to an external page	https://uima.apache.org/
sameAs	UIMA UIMA UIMA UIMA UIMA UIMA UIMA UIMA
dbp:wikiPageUsesTemplate	dbt:IPAc-en dbt:Infobox_software dbt:Reflist dbt:Respell dbt:Start_date_and_age dbt:Apache_Software_Foundation
thumbnail	wiki-commons:Special:FilePath/Apache_UIMA_logo.svg?width=300
developer	IBM Apache Software Foundation
genre	Information extraction Text mining
latest release date	2019-11-08 (xsd:date)
latest release version	3.100000 (xsd:double)
license	Apache License 2.0 (en)
logo	Apache UIMA logo.svg (en)
operating system	Cross-platform
programming language	Java with C++ enablement (en)
website	https://uima.apache.org/
has abstract	UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von Data-Mining-Anwendungen, d. h. zur Wissensextraktion. Das Projekt UIMA wurde 2005 von IBM gestartet und wird seit Oktober 2006 von Apache betreut.Ziel des Projekts ist es, ein standardisiertes Framework zum Erstellen von Anwendungen zur Verarbeitung unstrukturierter Informationen, insbesondere natürlicher Sprache (Natural Language Processing, NLP) zu bieten.Unstrukturierte Informationen können in beliebigen Formaten vorliegen, z. B. Bild- oder Audio-Daten, jedoch sind Texte die gängigsten Informationen. Das Konzept von UIMA sieht vor, dass eine Pipeline implementiert wird, in der zunächst Daten eingelesen werden, diese dann verschiedene Analyse- und Verarbeitungsschritte durchlaufen und schließlich an einen oder mehrere sogenannte Verbraucher geliefert werden, die die Ergebnisse verarbeiten, z. B. in einer Datenbank speichern.In jedem einzelnen Analyse-Schritt werden die Daten mit bestimmten Annotationen versehen, d. h. ein definierter Bereich der Datenmenge, also beispielsweise ein Teil des Texts, bekommt eine Anmerkung.Durch die starke Modularisierung in Pipelinestufen können die einzelnen Stufen leicht wiederverwendet werden. Ein Beispiel für eine Pipeline ist eine simple Anwendung, die die durchschnittliche Anzahl von Wörtern pro Satz in einem Text berechnen soll.Hierzu wird zunächst eine Pipelinestufe benötigt, die den Text einliest, z. B. aus einer Datei. Die zweite Stufe durchläuft den Text und markiert alle Wörter, indem alle Positionen von Leerzeichen im Text ermittelt werden. Die dritte Stufe führt analog dazu eine Satz-Erkennung durch, indem Markierungen von Satzzeichen zu Satzzeichen gesetzt werden. Diese beiden Schritte sind unabhängig voneinander und könnten demnach auch vertauscht werden. Die letzte Pipelinestufe muss nun nur noch die Anzahl markierter Wörter durch die Anzahl markierter Sätze teilen und ausgeben. Eine Erweiterung könnte nun sein, die Anzahl der Verben pro Satz zu zählen, hierzu würde nach der dritten Stufe eine Wortart-Erkennung eingebaut, die jedes Wort mit einer Annotation wie „Verb“, „Nomen“ usw. versieht, und der Verbraucher würde statt der Wort-Annotationen die Wortart-Annotationen zählen, die „Verb“ entsprechen; alle anderen Teile der Pipeline können wiederverwendet werden.UIMA übernimmt in dieser Anwendung die Verwaltung der Pipeline und die interne Repräsentation der zu verarbeitenden Daten samt Annotationen, außerdem bietet es dem Entwickler alle nötigen Schnittstellen zum Einlesen und Auslesen der Informationen. UIMA wird insbesondere in der Forschung eingesetzt, entwickelt sich aber auch immer mehr zum Industrie-Standard. Eine der bekanntesten Anwendungen von UIMA ist der Einsatz im IBM Watson. (de) UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en. Watson (inteligencia_artificial), el supercomputador de IBM que participó en un programa especial del show televisivo estadounidense Jeopardy!, utiliza Apache UIMA para escalar su procesamiento del lenguaje natural en paralelo a través de procesadores POWER7 de IBM, lo que permite a Watson realizar miles de cálculos analíticos simultáneamente en todo el clúster de servidores para responder a cada pregunta lo más rápido posible. (es) UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies. (en) Apache UIMA (dall'inglese Unstructured Information Management Architecture) è un framework, sviluppato nei linguaggi di programmazione Java e C++, per il trattamento e l'analisi di informazioni semi-strutturate, e l'estrazione di informazioni da esse. Fa parte dei software sviluppati dalla Apache Software Foundation. UIMA definisce un'interfaccia per le varie componenti di analisi (Analysis Engine) che lo sviluppatore può implementare (ad esempio, conversione di file binario in testo, annotazione di concetti o di nomi propri, conversione in formato XML...). In sintesi, una volta definiti dei descriptors (file in formato XML) per i diversi componenti (che indicano tra l'altro i dati in entrata ed in uscita) ed un descriptor che definisce la pipeline completa (sequenza ordinata di trattamenti ad effettuare), tramite una semplice API è possibile lanciare il trattamento dei dati. (it) UIMA（全称Unstructured Information Management Architecture，即非结构化信息管理架构）于2009年3月作为，是一个组件化的软件架构，用于分析同终端用户相关联的大容量非结构化信息。 (zh)

Faceted Search & Find service v1.17_git139 as of Feb 29 2024

Alternative Linked Data Documents: ODE Content Formats:

RDF

ODATA

Microdata

About

OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (378 GB total memory, 55 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software