UIMA stands for Unstructured Information Management Architecture. An OASIS standard as of March 2009, UIMA is to date the only industry standard for content analytics. UIMA is a component software architecture for the development, discovery, composition, and deployment of multi-modal analytics for the analysis of unstructured information and its integration with search technologies developed by IBM.

PropertyValue
dbpedia-owl:abstract
  • UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von NLP-Anwendungen, d. h. zur Sprachverarbeitung. Das Projekt UIMA wurde 2005 von IBM gestartet und wird seit Oktober 2006 von Apache betreut. Ziel des Projekts ist es, ein standardisiertes Framework zum Erstellen von Anwendungen zur Verarbeitung unstrukturierter Informationen, insbesondere natürlicher Sprache (Natural Language Processing, NLP) zu bieten. Unstrukturierte Informationen können in beliebigen Formaten vorliegen, z. B. Bild- oder Audio-Daten, jedoch sind Texte die gängigsten Informationen. Das Konzept von UIMA sieht vor, dass eine Pipeline implementiert wird, in der zunächst Daten eingelesen werden, diese dann verschiedene Analyse- und Verarbeitungsschritte durchlaufen und schließlich an einen oder mehrere sogenannte Verbraucher geliefert werden, die die Ergebnisse verarbeiten, z. B. in einer Datenbank speichern. In jedem einzelnen Analyse-Schritt werden die Daten mit bestimmten Annotationen versehen, d. h. ein definierter Bereich der Datenmenge, also beispielsweise ein Teil des Texts, bekommt eine Anmerkung. Durch die starke Modularisierung in Pipelinestufen können die einzelnen Stufen leicht wiederverwendet werden. Ein Beispiel für eine Pipeline ist eine simple Anwendung, die die durchschnittliche Anzahl von Wörtern pro Satz in einem Text berechnen soll. Hierzu wird zunächst eine Pipelinestufe benötigt, die den Text einliest, z. B. aus einer Datei. Die zweite Stufe durchläuft den Text und markiert alle Wörter, indem alle Positionen von Leerzeichen im Text ermittelt werden. Die dritte Stufe führt analog dazu eine Satz-Erkennung durch, indem Markierungen von Satzzeichen zu Satzzeichen gesetzt werden. Diese beiden Schritte sind unabhängig voneinander und könnten demnach auch vertauscht werden. Die letzte Pipelinestufe muss nun nur noch die Anzahl markierter Wörter durch die Anzahl markierter Sätze teilen und ausgeben. Eine Erweiterung könnte nun sein, die Anzahl der Verben pro Satz zu zählen, hierzu würde nach der dritten Stufe eine Wortart-Erkennung eingebaut, die jedes Wort mit einer Annotation wie „Verb“, „Nomen“ usw. versieht, und der Verbraucher würde statt der Wort-Annotationen die Wortart-Annotationen zählen, die „Verb“ entsprechen; alle anderen Teile der Pipeline können wiederverwendet werden. UIMA übernimmt in dieser Anwendung die Verwaltung der Pipeline und die interne Repräsentation der zu verarbeitenden Daten samt Annotationen, außerdem bietet es dem Entwickler alle nötigen Schnittstellen zum Einlesen und Auslesen der Informationen. UIMA wird insbesondere in der NLP-Forschung eingesetzt, entwickelt sich aber auch immer mehr zum Industrie-Standard für NLP-Anwendungen.
  • UIMA stands for Unstructured Information Management Architecture. An OASIS standard as of March 2009, UIMA is to date the only industry standard for content analytics. UIMA is a component software architecture for the development, discovery, composition, and deployment of multi-modal analytics for the analysis of unstructured information and its integration with search technologies developed by IBM. The source code for a reference implementation of this framework has been made available on SourceForge, and later on the website of the Apache Software Foundation. An example is a logistics analysis software system that could convert unstructured data such as repair logs and service notes into relational tables. These tables can then be used by automated tools to detect maintenance or manufacturing problems. Other examples are systems that are used in medical environments to analyze clinical notes.
  • UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en. Watson (inteligencia_artificial), el supercomputador que participó en un programa especial del show televisivo estadounidense Jeopardy!, utiliza Apache UIMA para escalar su procesamiento del lenguaje natural en paralelo a través de procesadores POWER7 de IBM, lo que permite a Watson realizar miles de cálculos analíticos simultáneamente en todo el clúster de servidores para responder a cada pregunta lo más rápido posible.
dbpedia-owl:developer
dbpedia-owl:genre
dbpedia-owl:latestReleaseVersion
  • 2.3.0
dbpedia-owl:license
dbpedia-owl:operatingSystem
dbpedia-owl:programmingLanguage
dbpedia-owl:wikiPageExternalLink
dbpprop:developer
dbpprop:genre
dbpprop:latestReleaseVersion
  • 2 (xsd:integer)
dbpprop:license
  • Apache License 2.0
dbpprop:name
  • Apache UIMA
dbpprop:operatingSystem
dbpprop:programmingLanguage
  • Java with C++ Enablement
dbpprop:website
dbpprop:wikiPageUsesTemplate
dcterms:subject
rdf:type
rdfs:comment
  • UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von NLP-Anwendungen, d. h. zur Sprachverarbeitung. Das Projekt UIMA wurde 2005 von IBM gestartet und wird seit Oktober 2006 von Apache betreut.
  • UIMA stands for Unstructured Information Management Architecture. An OASIS standard as of March 2009, UIMA is to date the only industry standard for content analytics. UIMA is a component software architecture for the development, discovery, composition, and deployment of multi-modal analytics for the analysis of unstructured information and its integration with search technologies developed by IBM.
  • UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en.
rdfs:label
  • UIMA
  • UIMA
  • UIMA
owl:sameAs
foaf:homepage
foaf:name
  • Apache UIMA
foaf:page
is dbpedia-owl:wikiPageRedirects of
is owl:sameAs of
is foaf:primaryTopic of