Statistically Improbable Phrases or SIPs constitute a system developed by Amazon. com to compare all of the books they index in the Search Inside! program and find phrases in each that are the most unlikely to be found in any other book indexed. The system is used to find the most nearly unique portions of books for use as a summary or keyword.
| Property | Value |
| dbpprop:abstract
|
- Statistically Improbable Phrases or SIPs constitute a system developed by Amazon. com to compare all of the books they index in the Search Inside! program and find phrases in each that are the most unlikely to be found in any other book indexed. The system is used to find the most nearly unique portions of books for use as a summary or keyword. SIP is also used more generally to refer to a search string likely to generate meaningful results from a search engine; that is, a string whose chance of occurring in a desirable result is much greater than its chance of occurring in a non-desirable result.
- Les Statistically Improbable Phrases (de l'anglais signifiant littéralement « phrases statistiquement improbables »), couramment abrégées sous le sigle SIPs, sont un outil statistique lancé en 2005 par le site web de commerce en ligne Amazon. com pour son programme d'indexation de contenu de livres Search Inside!; il consiste à comparer le texte de tous les livres indexés, dans le but de trouver pour chacun d'eux un ensemble de phrases ou d'expressions qui apparaissent plus souvent que dans les autres livres. L'intérêt d'identifier ces passages est qu'ils sont considérés comme les plus significatifs et les plus représentatifs du livre, constituant l'équivalent de résumés ou de mots clés, en ayant l'avantage d'être déterminés de manière automatisée. Ces métadonnées sont présentées à l'internaute sur les fiches de chaque livre. Chaque SIP y est accompagnée d'un hyperlien qui permet, au visiteur qui le suit, de retrouver les autres livres ayant la même expression parmi leurs SIPs. En effet, les ouvrages aux SIPs identiques abordent vraisemblablement les mêmes thèmes et sont donc susceptibles d'intéresser aussi le visiteur. Bill Carr, vice-président exécutif pour les médias numériques chez Amazon, souligne que ce système de rapprochement met en avant des ouvrages qui seraient difficiles à trouver sans ça, car faisant partie de la longue traîne du catalogue. L'utilité de cette fonctionnalité auprès des visiteurs n'est pas connue avec certitude. Benjamin Vershbow, chercheur à l'Institute for the Future of the Book, y voit un équivalent automatisé des tags qui sont à la base du Web 2.0, mais estime que le système fonctionne mieux pour les travaux de non-fiction que pour les romans. Amazon envisage diverses autres manières de mettre cet outil à profit, par exemple en l'intégrant dans le système de recommandation qui existe déjà, ou pour répondre à des questions en utilisant des textes faisant autorité dans le domaine.
|
| dbpprop:hasPhotoCollection
| |
| rdfs:comment
|
- Statistically Improbable Phrases or SIPs constitute a system developed by Amazon. com to compare all of the books they index in the Search Inside! program and find phrases in each that are the most unlikely to be found in any other book indexed. The system is used to find the most nearly unique portions of books for use as a summary or keyword.
- Les Statistically Improbable Phrases (de l'anglais signifiant littéralement « phrases statistiquement improbables »), couramment abrégées sous le sigle SIPs, sont un outil statistique lancé en 2005 par le site web de commerce en ligne Amazon.
|
| rdfs:label
|
- Statistically Improbable Phrases
- Statistically Improbable Phrases
|
| owl:sameAs
| |
| skos:subject
| |
| foaf:page
| |
| is dbpprop:redirect
of | |