| dbpprop:abstract
|
- Information retrieval (IR) is the science of searching for documents, for information within documents and for metadata about documents, as well as that of searching relational databases and the World Wide Web. There is overlap in the usage of the terms data retrieval, document retrieval, information retrieval, and text retrieval, but each also has its own body of literature, theory, praxis and technologies. IR is interdisciplinary, based on computer science, mathematics, library science, information science, information architecture, cognitive psychology, linguistics, statistics and physics. Automated information retrieval systems are used to reduce what has been called "information overload". Many universities and public libraries use IR systems to provide access to books, journals and other documents. Web search engines are the most visible IR applications.
- Information Retrieval [ˌɪnfɚˈmeɪʃən ɹɪˈtɹiːvəl] (IR) bzw. Informationswiedergewinnung, gelegentlich Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem inhaltsorientiertem Suchen beschäftigt. Es ist ein Teilgebiet der Informationswissenschaft, der Computerlinguistik wie auch der Informatik. Wie der Begriff retrieval (deutsch Wiedergewinnung, Auffindung) sagt, sind Informationen in großen Datenbeständen zunächst verloren und müssen wieder gewonnen bzw. wieder gefunden werden.
- La recuperación de información, llamada en inglés Information retrieval (IR), es la ciencia de la búsqueda de información en documentos, búsqueda de los mismos documentos, la búsqueda de metadatos que describan documentos, o, también, la búsqueda en bases de datos, ya sea a través de internet, intranet, para textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante. La IR es un estudio interdisciplinario. Cubre tantas disciplinas que eso genera normalmente un conocimiento parcial desde tan solo una u otra perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la psicología cognitiva, la arquitectura de la información, diseño de la información, el comportamiento humano hacia la información, la lingüística, la semiótica, informática, biblioteconomía y documentación. Los buscadores, tales como Google, Lycos y Copernic, son algunas de las aplicaciones más populares de la recuperación de información. Básicamente hay que construir un Vocabulario, que es una lista de términos en lenguaje natural, un algoritmo que incluya las reglas lógicas de la búsqueda {Tabla de verdad} y una valoración de los resultados o cantidad de información lograda o posible. Este motor de búsqueda es pues el que permite plantear una pregunta con no menos de dos términos (en algunos casos pueden ser menos de dos términos) y mostrar los resultados mínimos y el logaritmo natural de las interacciones será alrededor de 3. Algunos de los estudiosos más destacados dentro de esta subdisciplina son Gerard Salton, W Bruce Croft, Karen Spärck Jones, Keith van Rijsbergen, Ricardo Baeza Yates. A veces se plantean ciertos problemas a la hora de recuperar información provocados por el uso del lenguaje natural (entre otras razones) como el silencio (debido a la sinonimia), el ruido (debido a la polisemia), homografía, ambigüedad, etc. Obras de referencia BAEZA-YEATS, Ricardo; RIBEIRO-NETO, Berthier: Modern Information Retrieval. New York : ACM;Harlow, Essex: Addison-Wesley Longman, 1999. SALVADOR OLIVAN, JA: Recuperación de Información. Buenos Aires : Alfagrama, 2008. SALTON, Gerald; McGILL, JM: Introduction to Modern Information Retrieval. New York : McGraw-Hill, 1983.
- Tiedonhaku on tietojenkäsittelytieteen osa-alue, jossa tutkitaan tiedon esittämisen, tallettamisen ja etsimisen prosesseja, joita tarvitaan, jotta haluttu tieto saadaan hakutehtävän esittäneen ihmisen käyttöön.
- Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d'information est la science qui consiste à rechercher l'information dans des documents - les documents eux-mêmes ou les métadonnées qui décrivent les documents -, dans des bases de données - qu'elles soient relationnelles ou mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet, et les intranets, pour le texte, le son, les images, les données. Le Vocabulaire de la documentation distingue la recherche d'information de la recherche de l'information : recherche d'information : « Ensemble des méthodes, procédures et techniques permettant, en fonction de critères de recherche propres à l’usager, de sélectionner l’information dans un ou plusieurs fonds de documents plus ou moins structurés ». recherche de l'information : « Ensemble des méthodes, procédures et techniques ayant pour objet d’extraire d’un document ou d’un ensemble de documents les informations pertinentes ». La recherche d'information est un domaine historiquement lié aux sciences de l'information et à la bibliothéconomie qui ont toujours eu le souci d’établir des représentations des documents dans le but d'en récupérer des informations, à travers la construction d’index. L’informatique a permis le développement d’outils pour traiter l’information et établir la représentation des documents au moment de leur indexation, ainsi que pour rechercher l’information. On peut aujourd'hui dire que la recherche d'information est un champ transdisciplinaire, qui peut être étudié par plusieurs disciplines, approche qui devrait permettre de trouver des solutions pour améliorer son efficacité. Au sens large, la recherche d'information inclut deux aspects : l'indexation des corpus, et l'interrogation du fonds documentaire ainsi constitué.
- L'information retrieval (IR) è l'insieme delle tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico. Per "informazione" si intendono tutti i documenti, i metadati, i file presenti all'interno di banche dati o nel world wide web. Il termine è stato coniato da Calvin Mooers alla fine degli anni '40 del Novecento, ma oggi è usato quasi esclusivamente in ambito informatico. L'IR è un campo interdisciplinare che nasce dall'incrocio di discipline diverse. L'IR coinvolge la psicologia cognitiva, l'architettura informativa, la filosofia (vedi la voce ontologia), il design, il comportamento umano sull'informazione, la linguistica, la semiotica, la scienza dell'informazione e l'informatica. Molte università e biblioteche pubbliche utilizzano sistemi di IR per fornire accesso a pubblicazioni, libri ed altri documenti. Per recuperare l'informazione, i sistemi IR usano i linguaggi di interrogazione basati su comandi testuali. Due concetti sono di fondamentale importanza: query ed oggetto: Le query ("interrogazioni") sono stringhe di parole-chiavi rappresentanti l'informazione richiesta. Vengono digitate dall'utente in un sistema IR (per esempio, un motore di ricerca). Un oggetto è un'entità che mantiene o racchiude informazioni in una banca dati. Un documento di testo, per esempio, è un oggetto di dati. Una tipica ricerca di IR ha come input un comando dell'utente. Poi la sua query viene messa in relazione con gli oggetti presenti nella banca dati. In risposta, il sistema fornisce un insieme di record che soddisfano le condizioni richieste. Spesso i documenti stessi non sono mantenuti o immagazzinati direttamente nel sistema IR, ma vengono rappresentati da loro surrogati. I motori di ricerca del Web come Google e Yahoo sono le applicazioni più note ed ovvie delle teorie di Information Retrieval.
- 情報検索(じょうほうけんさく)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索するためのコンピュータ側における仕組みを記述している。 情報検索に対するコンピュータ側における技術は情報を人間が直接管理するのに比べ、データの量的な制約やデータの取り扱いの一貫性を保つ困難さという制約を受けることなく、高速で安定なシステムにより利用者に適切なデータを提供する機能と位置付けることができる。
- Information retrieval (IR) houdt zich bezig met het zoeken naar informatie in documenten, naar documenten zelf, naar metadata die de documenten beschrijft, en het zoeken binnen databases, naar tekst, audio, beelden, of data. De termen data retrieval, document retrieval, information retrieval, en text retrieval worden vaak door elkaar gebruikt, hoewel ze elk over eigen literatuur, theorie, praktijk, en technologieën beschikken. De term "information retrieval" is afkomstig van Calvin Mooers in 1948-50.
- Informasjonsgjenfinning dreier seg om representasjon, lagring, organisering og tilgang til informasjonselementer, med utgangspunkt i et brukerbehov. Brukerens behov for informasjon er gjerne uttrykt i naturlig språk gjennom systemets brukergrensesnitt.
- Recuperação de Informação (RI) é uma área da computação que lida com o armazenamento de documentos e a recuperação automática de informação associada a eles. É uma ciência de pesquisa sobre busca por informações em documentos, busca pelos documentos propriamente ditos, busca por metadados que descrevam documentos e busca em banco de dados, sejam eles relacionais e isolados ou banco de dados interligados em rede de hipermídia, tais como a World Wide Web. A mídia pode estar disponível sob forma de textos, de sons, de imagens ou de dados. Há, entretanto, muita confusão entre os termos e conceitos "recuperação de dados", "recuperação de documentos", "recuperação de informações" e "recuperação de textos". Na verdade, cada um destes é uma área especial que possui seu próprio corpo de conhecimento e literatura, teoria, praxis e tecnologias.
- Информационный поиск (ИП) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
- Інформаційний пошук (ІП) — наука про пошук неструктурованої документальної інформації. Особливо це відноситься до пошуку інформації в документах, пошук самих документів, добуття метаданих з документів, пошуку тексту, зображень, відео та звуку у локальних реляційних базах даних, у гіпертекстових базах даних таких, як Інтернет та локальні інтранет. Інформаційний пошук — велика міждисциплінарна область науки, яка стоїть на перетині когнітивної психології, інформатики, інформаційного дизайну, лінгвістики, семіотики, бібліотечної справи, та статистики. Автоматичні системи інформаційного пошуку використовують для зменшення так званого "інформаційного перевантаження". Багато університетів та публічних бібліотек використовують системи ІП для полегшення доступу до книжок, журналів та інших документів. Найвідомішим прикладом систем ІП можна назвати пошукові системи в Інтернеті. Об’єктом інформаційного пошуку є текстова інформація, зображення, аудіо, відео інформація. З інформаційним пошуком змикаються проблеми: розсилки інформації (information routing); сортування інформації (information filtering); упорядкування (класифікація) інформації (information categorization); відбір інформації (information extraction). Для інформаційного пошуку розробляють: алгоритми інформаційного пошуку (retrieval algorithms); підходи інформаційного пошуку(retrieval approaches); стратегії інформаційного пошуку (retrieval strategies). Для його здійснення створюють: методи інформаційного пошуку (retrieval utilities); засоби інформаційного пошуку (information retrieval systems); комп’ютерні пошукові програми (search engines). До проблем інформаційного пошуку належать питання: представлення даних, інформації, знань (data, information, knowledge); представлення інформації в сучасних інформаційних сховищах (representation of information); багатомовний інформаційний пошук (cross-language information retrieval); одночасний інформаційний пошук (parallel information retrieval); розподілений інформаційний пошук (distributed information retrieval); суспільний інформаційний пошук (social information retrieval) Напрям інформаційний пошук відносять до проблем: застосовної (прикладної) лінгвістики (applied linguistics); обробки природної мови (natural language processing); Завданням інформаційного пошуку є знаходження відповідних (до пошукового запиту) інформаційних об’єктів, або документів серед доступного для пошуку матеріалу. Завдання для інформаційного пошуку задається у вигляді інофрмаційного запиту (query), який може містити слова, фрази чи речення або комбінацію їх. Переважна більшість пошукових систем орієнтована на роботу з пошуковими термінами – словами або словосполученнями, які пошукова система розпізнає як одне ціле. Для здійснення інформаційного пошуку потрібно мати збірку інформаційних об’єктів (бібліотека, комп’ютерні файли) і систему (алгоритм або програму) яка здійснює пошук. Для здійснення інформаційного пошуку користувач (людина або інформаційна система) формує інформаційний запит (information query). Результатом пошукової роботи є список документів який укладається згідно певного принципу. Такий список називають впорядкованим (ranked list, ranked results). Пошукова система переглядає всі доступні інформаційні одиниці (документи) зі збірки і відбирає документи відповідні до інформаційного запиту. Оскільки реальні пошукові системи знаходять не всі відповідні документи, говорять про точність пошукових систем (system accuracy). Результатом роботи пошукової системи є список відібраних документів (retrieved documents list), серед яких є відповідні до запиту документи (relevant documents). Для ідеальної пошукової системи список відібраних документів та відповідних документів повинні співпадати. В реальних пошукових системах в списках відібраних документів знаходяться і невідповідні до запиту документи. Тому говорять про ефективність пошукових систем. Ефективність пошукових систем оцінюється двома параметрами: пошукова відповідність (precision) та пошукова якість (recall). Пошукова відповідність визначає частку відповідних документів серед відібраних на запит. Пошукова відповідність визначає якість отриманого результату інформаційного пошуку. Пошукова якість визначає частку отриманих системою відповідних до запиту документів серед загального числа відповідних до запиту документів у збірці. Загальне число відповідних до запиту документів завжди є невідомим і може бути встановлене лише при повному перегляді збірки людиною. Крім того роботу пошукових систем оцінюють швидкодією – часом, за який отримують список відповідних до запиту документів. Стратегії інформаційного пошуку Стратегії інформаційного пошуку визначають ступінь подібності документів, що розглядаються, до пошукового запиту. Ступінь подібності визначається згідно робочої гіпотези: чим частіше пошуковий термін зустрічається в документі, тим більше «відповідним» є цей документ до пошукового запиту. Стратегії інформаційного пошуку розробляються не тільки для визначення відповідності, але і для вирішення проблем, які пов’язані з неоднозначністю мови – один і той самий термін може позначати різні концепти (ключ в механіці означає зовсім не те, що в шифруванні), один і той же концепт може позначатись різними термінами (обласний центр Львівської області має назву Львів і Місто Лева . Стратегія інформаційного пошуку це алгоритм, який, переглядаючи набір документів, встановлює їх відповідність до пошукового запиту . Оскільки пошуковий термін зустрічається в документах різну кількість раз, можна говорити про різну ступінь відповідності до пошукового запиту. Цей алгоритм обчислює коефіцієнт відповідності для кожного документу КВ, де 1 ≤ i ≤ n. Існують такі стратегії інформаційного пошуку: - з використанням векторно-просторового представлення; пошук імовірності появи пошукового терміну в документі; - з побудовою мовної моделі для кожного документу; - з побудовою мережі припущень, яка використовується для встановлення відповідності документу до пошукового запиту; - з Булевим індексуванням, коли кожному пошуковому терміну присвоюється своя «вага», що потім враховується при побудові впорядкованих списків документів; - з використанням не проявленого семантичного індексування; - з побудовою нейромереж; - з використанням продуктивних алгоритмів, коли початковий пошуковий запит «еволюційно» видозмінюється; - з використанням нечітких множин, коли документу ставиться у відповідність нечітка множина .
- 資訊檢索是指因應使用者之資訊需求提供查詢的方法以及查詢的過程。 資訊檢索(英語:Information Retrieval)是指搜尋資訊的科學,如:在文件中搜尋資訊、搜尋文件本身、搜尋描述文件的metadata或是在資料庫中進行搜尋,無論是在相關的獨立資料庫或是超文本的網路資料庫(如:World Wide Web)。 然而這裡會出現一個使人混亂的情況,就是資料檢索(data retrieval)、文件檢索(document retrieval)、資訊檢索(information retrieval)、文字檢索(text retrieval)之間常令人混淆,上述的每一個詞彙都有各自的發展理論、實踐和技術。目前,文本信息检索是发展最成熟的信息检索技术之一。 資訊檢索像是剛開始存在的、跨學科的,其建立於電腦科學、數學、圖書館學、資訊科學、認知心理學、語言學、統計學、物理學等。自動化的資訊檢索系統被用來減少資訊超載(Information overload),很多大學和公共圖書館使用資訊檢索系統提供檢索書目、期刊和其他的文件,資訊檢索系統通常與物件和檢索需求有關,檢索需求會被使用者用正式的陳述來描述其資訊需求放置於資訊檢索系統當中,而物件是一個實體被儲存於資料庫當中,一個文件就是一個資料物件,通常文件本身不會被直接儲存於資料庫中,但是會在系統中使用文件代理者來代替文件本身。
|
| rdfs:comment
|
- Information retrieval (IR) is the science of searching for documents, for information within documents and for metadata about documents, as well as that of searching relational databases and the World Wide Web. There is overlap in the usage of the terms data retrieval, document retrieval, information retrieval, and text retrieval, but each also has its own body of literature, theory, praxis and technologies.
- Information Retrieval [ˌɪnfɚˈmeɪʃən ɹɪˈtɹiːvəl] (IR) bzw. Informationswiedergewinnung, gelegentlich Informationsbeschaffung, ist ein Fachgebiet, das sich mit computergestütztem inhaltsorientiertem Suchen beschäftigt. Es ist ein Teilgebiet der Informationswissenschaft, der Computerlinguistik wie auch der Informatik. Wie der Begriff retrieval (deutsch Wiedergewinnung, Auffindung) sagt, sind Informationen in großen Datenbeständen zunächst verloren und müssen wieder gewonnen bzw.
- La recuperación de información, llamada en inglés Information retrieval (IR), es la ciencia de la búsqueda de información en documentos, búsqueda de los mismos documentos, la búsqueda de metadatos que describan documentos, o, también, la búsqueda en bases de datos, ya sea a través de internet, intranet, para textos, imágenes, sonido o datos de otras características, de manera pertinente y relevante. La IR es un estudio interdisciplinario.
- Tiedonhaku on tietojenkäsittelytieteen osa-alue, jossa tutkitaan tiedon esittämisen, tallettamisen ja etsimisen prosesseja, joita tarvitaan, jotta haluttu tieto saadaan hakutehtävän esittäneen ihmisen käyttöön.
- Abrégée en RI ou IR (Information Retrieval en anglais), la recherche d'information est la science qui consiste à rechercher l'information dans des documents - les documents eux-mêmes ou les métadonnées qui décrivent les documents -, dans des bases de données - qu'elles soient relationnelles ou mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet, et les intranets, pour le texte, le son, les images, les données.
- L'information retrieval (IR) è l'insieme delle tecniche utilizzate per il recupero mirato dell’informazione in formato elettronico. Per "informazione" si intendono tutti i documenti, i metadati, i file presenti all'interno di banche dati o nel world wide web. Il termine è stato coniato da Calvin Mooers alla fine degli anni '40 del Novecento, ma oggi è usato quasi esclusivamente in ambito informatico. L'IR è un campo interdisciplinare che nasce dall'incrocio di discipline diverse.
- Information retrieval (IR) houdt zich bezig met het zoeken naar informatie in documenten, naar documenten zelf, naar metadata die de documenten beschrijft, en het zoeken binnen databases, naar tekst, audio, beelden, of data. De termen data retrieval, document retrieval, information retrieval, en text retrieval worden vaak door elkaar gebruikt, hoewel ze elk over eigen literatuur, theorie, praktijk, en technologieën beschikken.
- Informasjonsgjenfinning dreier seg om representasjon, lagring, organisering og tilgang til informasjonselementer, med utgangspunkt i et brukerbehov. Brukerens behov for informasjon er gjerne uttrykt i naturlig språk gjennom systemets brukergrensesnitt.
- Recuperação de Informação (RI) é uma área da computação que lida com o armazenamento de documentos e a recuperação automática de informação associada a eles. É uma ciência de pesquisa sobre busca por informações em documentos, busca pelos documentos propriamente ditos, busca por metadados que descrevam documentos e busca em banco de dados, sejam eles relacionais e isolados ou banco de dados interligados em rede de hipermídia, tais como a World Wide Web.
- Информационный поиск (ИП) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
- Інформаційний пошук (ІП) — наука про пошук неструктурованої документальної інформації.
|