About: Bloom filter

Property	Value
dbo:abstract	فلتر بلوم هو هيكل أو بنية بيانات احتمالية موفرة للمساحة. أوجدها بورتون هاوارد بلوم عام 1970وهي تستخدم لاختبار انتماء عنصر لمجموعة من عدمه. يمكن لفلتر بلوم أن يصنف عناصر خطأً على أنها تنتمي لمجموعة، إلا أنه لا تكون إجابته خاطئة أبدا إذا أجاب بعدم وجود العنصر في المجموعة. بمعنى آخر، تجاب الاستعلامات إما بـ«يحتمل أن ينتمي للمجموعة» أو «حتما لا ينتمي للمجموعة». يمكن إضافة عناصر للمجموعة لكن لا يمكن حذفها (لكن هناك حل لذلك مع فلتر «عادّ»). كلما زادت عناصر المجموعة كلما زاد احتمال التصنيفات الإيجابية الخاطئة (إجابة «يحتمل أن ينتمي للمجموعة»). اقترح بلوم هذه الطريقة للتطبيقات التي تستخدم بيانات ضخمة الحجم يصعب معها استخدام تقنيات خوارزميات التجزئة التقليدية. ضرب مثلا بخوارزمية وضع شارطة في الكلمات الإنجليزية لقاموس يحوي نصف مليون كلمة، 90% منها تتبع قواعد شارطة بسيطة، بينما الـ10% المتبقية تحتاج إلى وصول كثيف للقرص الصلب لجلب أنماط وضع شارطة خاصة. إذا توفرت ذاكرة كافية فيمكن استخدام خوارزمية خالية من الإجابات الخاطئة لتفادي الوصول الغير ضروري للقرص. أما إذا كانت الذاكرة محدودة، فطريقة بلوم تستخدم ذاكرة أقل مع تمكنها من استبعاد معظم الوصول الغير ضروري للقرص. على سبيل المثال، مساحة تعادل 15% مما يُستخدم عادة في خوارزميات التجزئة المعتادة الخالية من الإجابات الخاطئة تحول دون 85% من الوصول للقرص، مثلما ينص مبدأ باريتو لكن هذه المرة 85-15. بشكل عام، أقل من 10 بت لكل عنصر مطلوبة لاحتمالات أجوبة خاطئة تبلغ 1%، بغض النظر عن حجم أو عدد العناصر في المجموعة. (ar) Bloomův filtr, pojmenovaný podle , který ho objevil vroce 1970, je prostorověefektivní pravděpodobnostní datová struktura, která se používá na ověřování příslušnostiprvků do množiny. Protože je tato struktura pravděpodobnostní, můžou při tomtoověřování nastat chyby. Při této chybě se o prvku, který ve skutečnosti do dané množiny nepatří, dozvíme,že tam patří, ale nikdy ne naopak. To znamená, že při odpovědi, že daný prvek do množiny nepatří, se dá naBloomův filtr spolehnout na 100%. Pravděpodobnost chyby roste s větším počtem prvků v danémnožině (při pevné velikosti reprezentace). Bloomův filtr se používá v různých aplikacích. Například, databázový systém odspolečnosti Google používá Bloomův filtr na redukování vyhledávání na disku. Před tím, než vůbeczpracuje požadavek, ověří si pomocí Bloomova filtru, zda daný řádek anebo sloupec databázeexistuje (tj. zda patří do množiny reprezentované Bloomovým filtrem). Kvůli charakteru možných chyb připoužití Bloomova filtru se nikdy nemůže stát, že by "přehlédnul" existující záznam. Tím se výrazně zvyšujevýkon databázového systému (při neexistujících záznamech nemusí pokaždé číst z disku) při zachovánístoprocentní spolehlivosti. Bloomovy filtry používá také proxy server Squid pro tzv. cache digests a archivační systém na detekování předtím vloženéhoobsahu. (cs) A Bloom filter is a space-efficient probabilistic data structure, conceived by in 1970, that is used to test whether an element is a member of a set. False positive matches are possible, but false negatives are not – in other words, a query returns either "possibly in set" or "definitely not in set". Elements can be added to the set, but not removed (though this can be addressed with the variant); the more items added, the larger the probability of false positives. Bloom proposed the technique for applications where the amount of source data would require an impractically large amount of memory if "conventional" error-free hashing techniques were applied. He gave the example of a hyphenation algorithm for a dictionary of 500,000 words, out of which 90% follow simple hyphenation rules, but the remaining 10% require expensive disk accesses to retrieve specific hyphenation patterns. With sufficient core memory, an error-free hash could be used to eliminate all unnecessary disk accesses; on the other hand, with limited core memory, Bloom's technique uses a smaller hash area but still eliminates most unnecessary accesses. For example, a hash area only 15% of the size needed by an ideal error-free hash still eliminates 85% of the disk accesses. More generally, fewer than 10 bits per element are required for a 1% false positive probability, independent of the size or number of elements in the set. (en) Ein Bloom-Filter (benannt nach ) ist eine probabilistische Datenstruktur, mit deren Hilfe sehr schnell festgestellt werden kann, welche Daten in einem Datenstrom schon einmal vorgekommen sind und welche erstmals auftreten. Hierzu wird mit einer geeigneten Zahl von Hash-Funktionen ein „Fingerabdruck“ des gelesenen Datensatzes in einer einzeiligen Hashtabelle hinterlassen. 1970 von zur Rechtschreibkontrolle und zur Worttrennung am Zeilenende entwickelt, werden Bloomfilter heute oft bei der Datenbankverwaltung und für das Routing in Netzwerken eingesetzt. Im Gegensatz zu vergleichbaren Algorithmen brauchen Bloom-Filter nur sehr wenig Speicherplatz. Für die Anwendbarkeit sind aber auch die folgenden Eigenheiten von entscheidender Bedeutung: Schlüsselwerte, die einmal in der Hashtabelle erfasst wurden, verbleiben dort. Weiterhin sind falsch positive Ergebnisse möglich, d. h. was der Filter akzeptiert, war mit hoher Wahrscheinlichkeit in den Schlüsselwerten enthalten; hingegen war definitiv nicht enthalten, was er abweist. (de) Un filtro de Bloom es una estructura de datos probabilística, concebida por en 1970, que es usada para verificar si un elemento es miembro de un conjunto. Los falsos positivos son posibles pero los falsos negativos no. (es) En informatique, et plus précisément en algorithmique, un filtre de Bloom est une structure de données inventée par Burton Howard Bloom en 1970. C'est une implémentation du type abstrait Ensemble. Cette structure est probabiliste, c'est-à-dire qu'elle utilise des probabilités, et que sa correction est probabiliste. Plus précisément, lors du test de la présence d'un élément dans un ensemble, un filtre de Bloom permet de savoir : * avec certitude l'absence d'un élément (il ne peut pas y avoir de faux négatif) ; * avec une certaine probabilité la présence d'un élément (il peut y avoir des faux positifs). La taille d'un filtre de Bloom est fixe et indépendante du nombre d'éléments contenus, ce qui en fait une structure très compacte. L'inconvénient est toutefois qu'il y a d'autant plus de faux positifs qu'il y a d'éléments dans la structure. Le principe du filtre est le même que pour le hachage. (fr) 블룸 필터(Bloom filter)는 원소가 집합에 속하는지 여부를 검사하는데 사용되는 확률적 자료 구조이다. 1970년 Burton Howard Bloom에 의해 고안되었다.블룸 필터에 의해 어떤 원소가 집합에 속한다고 판단된 경우 실제로는 원소가 집합에 속하지 않는 긍정 오류가 발생하는 것이 가능하지만, 반대로 원소가 집합에 속하지 않는 것으로 판단되었는데 실제로는 원소가 집합에 속하는 부정 오류는 절대로 발생하지 않는다는 특성이 있다. 집합에 원소를 추가하는 것은 가능하나, 집합에서 원소를 삭제하는 것은 불가능하다. 집합 내 원소의 숫자가 증가할수록 긍정 오류 발생 확률도 증가한다. (ko) ブルームフィルタ（英語: Bloom filter）は、1970年に Burton H. Bloom が考案した空間効率の良い確率的データ構造であり、あるデータが集合の要素である（集合に含まれている）かどうかの判定に使われる。ただし判定は正確ではなくて、含まれていないのに含まれていると誤って判定すること偽陽性（false positive）の可能性がある。しかし含まれているものを含まれていないと誤判定すること偽陰性（false negative）はない。なお集合に要素を追加することはできるが、集合から要素を削除することはできない（ただし、拡張をした counting filter であれば削除もできる）。集合に要素を追加していくにつれて偽陽性の可能性は増す。 (ja) Filtr Blooma – tablica bitowa stworzona przez Burtona H. Blooma w 1970 roku. Pierwotnie Filtr Blooma był wykorzystywany do implementacji baz danych, obecnie jest bardzo popularny w sieciach komputerowych. Filtr ten jest strukturą prostą i wydajną pamięciowo, która ma na celu reprezentować zadany zbiór elementów. Zastosowanie znajduje w szybkim określaniu przynależności podanych argumentów do tego zbioru elementów. Filtr Blooma ma jedną wadę. Jego wydajność (oszczędność pamięci) jest możliwa dzięki wprowadzeniu marginesu błędnych pozytywnych odpowiedzi. Efektem tego zabiegu są straty, spowodowane błędnymi informacjami, które często są większe od zaoszczędzonej pamięci. (pl) Фильтр Блума (англ. Bloom filter) — это вероятностная структура данных, придуманная Бёртоном Блумом в 1970 году, позволяющая проверять принадлежность элемента к множеству. При этом существует возможность получить ложноположительное срабатывание (элемента в множестве нет, но структура данных сообщает, что он есть), но не ложноотрицательное. Фильтр Блума может использовать любой объём памяти, заранее заданный пользователем, причём чем он больше, тем меньше вероятность ложного срабатывания. Поддерживается операция добавления новых элементов в множество, но не удаления существующих (если только не используется модификация со счётчиками). (ru) 布隆过滤器（英語：Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。 (zh) Фільтр Блума (англ. Bloom filter) — заощадлива до пам'яті ймовірнісна структура даних, призначена для перевірки приналежності елементів до множини. Запропонована Бартоном Говардом Блумом (англ. Burton Howard Bloom) в 1970 році. Допускає помилкові спрацювання, але пропуск події неможливий, тому фільтр Блума має 100 % потужність. Алгоритм дозволяє перевірити або «ймовірну приналежність до множини», або «точну не приналежність». Можна додавати нові елементи до множини, але не можна їх видаляти (хоча цю проблему можна вирішити «рахуючим» фільтром). Чим більше елементів у множині, тим вища ймовірність помилкового спрацювання. Блум запропонував цей алгоритм для випадків, коли необхідно обробляти таку кількість даних, що звичайні алгоритми хешування потребуватимуть понад міру пам'яті. Як приклад, він навів алгоритм автоматичного перенесення слів зі словником 500 тисяч слів, 90 % яких підпадають під прості правила розбиття, а решта 10 % потребує повільного доступу до жорсткого диску для пошуку конкретних шаблонів розбиття. За умови достатнього обсягу оперативної пам'яті, звичайне хешування позбавило би потреби в зайвих зверненнях до жорсткого диску. Проте, якщо обсяг оперативної пам'яті обмежений, то фільтр Блума дозволяє позбутись більшості зайвих звернень і, при цьому, використовує менше пам'яті. Наприклад, при використанні лише 15 % пам'яті звичайного хеш-алгоритму, фільтр Блума позбувається 85 % запитів до жорсткого диску, що є варіантом 85-15 правила Парето. Зазвичай, незалежно від кількості елементів в множині, достатньо не більше 10 біт на елемент для досягнення частки помилкового спрацювання в 1 %. (uk)
dbo:thumbnail	wiki-commons:Special:FilePath/Bloom_filter.svg?width=300
dbo:wikiPageExternalLink	http://algo2.iti.uni-karlsruhe.de/singler/publications/cacheefficientbloomfilters-wea2007.pdf http://ftp.csd.uwo.ca/courses/CS9843b/papers/OceanStore.pdf http://gsd.di.uminho.pt/members/cbm/ps/dbloom.pdf http://ipsit.bu.edu/documents/wrap-web.pdf http://www-db.disi.unibo.it/~fgrandi/papers/IPL2017_accepted.pdf http://www.adetti.iscte.pt/events/CONEXT06/Conext06_Proceedings/papers/13.html http://www.ccs.neu.edu/home/pete/research/spin-3spin.html http://www.ece.eng.wayne.edu/~sjiang/ECE7995-07-fall/slides/summary-cache.pdf http://www.ee.technion.ac.il/~ayellet/Ps/nelson.pdf http://www.michaelnielsen.org/ddi/why-bloom-filters-work-the-way-they-do/ https://git.gnunet.org/bibliography.git/plain/docs/TheoryandPracticeBloomFilter2011Tarkoma.pdf https://whiteblock.io/wp-content/uploads/2019/10/sbf-sigmod-03.pdf https://www.cs.dal.ca/research/techreports/cs-2002-10 https://www.itu.dk/people/pagh/papers/bloom.pdf http://theory.stanford.edu/~rinap/papers/esa2006b.pdf https://web.archive.org/web/20070114035556/http:/www.cs.utexas.edu/users/simha/publications/lsq.pdf https://web.archive.org/web/20070202202510/http:/www.arl.wustl.edu/~sarang/ancs6819-dharmapurikar.pdf https://web.archive.org/web/20090131053735/http:/www.eecs.harvard.edu/~kirsch/pubs/bbbf/esa06.pdf https://web.archive.org/web/20090517023058/http:/adetti.iscte.pt/events/CONEXT06/Conext06_Proceedings/papers/13.html https://web.archive.org/web/20120311063707/http:/ftp.csd.uwo.ca/courses/CS9843b/papers/OceanStore.pdf https://web.archive.org/web/20170922002708/http:/www.ece.eng.wayne.edu/~sjiang/ECE7995-07-fall/slides/summary-cache.pdf https://web.archive.org/web/20210814193152/https:/www.akamai.com/us/en/multimedia/documents/technical-publication/algorithmic-nuggets-in-content-delivery-technical-publication.pdf https://www.youtube.com/watch%3Fv=947gWqwkhu0 http://www.stanford.edu/~ashishg/papers/inverted.pdf https://www.akamai.com/us/en/multimedia/documents/technical-publication/algorithmic-nuggets-in-content-delivery-technical-publication.pdf http://www.eecs.harvard.edu/~kirsch/pubs/bbbf/esa06.pdf http://www.eecs.harvard.edu/~michaelm/postscripts/im2005b.pdf http://www.perl.com/pub/2004/04/08/bloom_filters.html http://hbase.apache.org/0.94/book/perf.schema.html%7Ccontribution=11.6. http://webee.technion.ac.il/~isaac/p/infocom12_variable.pdf http://www.arl.wustl.edu/~sarang/ancs6819-dharmapurikar.pdf http://www.cs.wisc.edu/~cao/papers/summary-cache/node8.html http://eprints.bournemouth.ac.uk/22802/4/Palmieri.pdf http://www.ccs.neu.edu/home/pete/research/bloom-filters-verification.html http://www.cs.utexas.edu/users/simha/publications/lsq.pdf https://books.google.com/books%3Fid=0bAYl6d7hvkC&pg=PA110 https://github.com/efficient/cuckoofilter https://github.com/epournaras/DIAS http://people.bu.edu/staro/efficient_pda.pdf https://www.mdpi.com/2079-9292/8/7/779 http://webdocs.cs.ualberta.ca/~drafiei/papers/DupDet06Sigmod.pdf http://research.google.com/archive/bigtable.html
dbo:wikiPageID	602211 (xsd:integer)
dbo:wikiPageLength	87506 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1122201044 (xsd:integer)
dbo:wikiPageWikiLink	dbr:Calvin_Mooers dbr:Cascading_(software) dbr:Probabilistic dbr:Element_(mathematics) dbr:Bigtable dbr:Bing_(search_engine) dbr:BitFunnel dbr:Bitcoin dbr:Bitwise_operation dbr:Algorithm dbc:Probabilistic_data_structures dbr:Perl dbr:Cuckoo_filter dbr:Cuckoo_hashing dbr:University_of_Wisconsin–Madison dbr:Double_hashing dbr:Information_content dbr:Content_delivery dbr:Count–min_sketch dbr:SPIN_model_checker dbr:Chemical_similarity dbr:Golomb_coding dbr:Google_Chrome dbr:Grafana dbr:Content_delivery_network dbr:Core_memory dbr:Apache_Cassandra dbr:Apache_HBase dbr:Arithmetic_overflow dbr:Communications_of_the_ACM dbr:Feature_hashing dbr:Aggregate_function dbr:Trie dbr:Data_structure dbr:Data_synchronization dbr:Drosophila_melanogaster dbr:Hash_function dbr:Lattice_(order) dbr:Lecture_Notes_in_Computer_Science dbr:Linked_list dbr:Locality_of_reference dbr:Superimposed_code dbr:Akamai_Technologies dbc:Lossy_compression_algorithms dbr:Data_structures dbr:E_(mathematical_constant) dbr:Edge-notched_card dbr:Ethereum dbr:Exim dbr:False_positive dbr:Pseudorandom_number_generator dbc:Hashing dbr:Hash_table dbr:Intersection_(set_theory) dbr:Hypercube dbr:Hyphenation_algorithm dbr:Array_data_structure dbr:Bit dbr:Bit_array dbr:Bloom_(shader_effect) dbr:Bloom_filters_in_bioinformatics dbc:Hash_based_data_structures dbr:Associative_array dbr:PostgreSQL dbr:Squid_(software) dbr:Information_privacy dbr:MinHash dbr:Bucket_sort dbr:YouTube dbr:Map_(mathematics) dbr:Union_(set_theory) dbr:World_Wide_Web dbr:IEEE/ACM_Transactions_on_Networking dbr:Type_I_and_type_II_errors dbr:Web_cache dbr:Stirling_numbers_of_the_second_kind dbr:Self-balancing_binary_search_tree dbr:Quotient_filter dbr:Shared-nothing_architecture dbr:Medium_(publishing_platform) dbr:Skip_list dbr:Azuma–Hoeffding_inequality dbr:Inverted_files dbr:Venti dbr:Set_(computer_science) dbr:Random_projections dbr:Perfect_hash dbr:Processing_element dbr:Collision_resolution_scheme dbr:Compressive_sensing dbr:Cache_misses dbr:Locality_sensitive_hashing dbr:Location_information dbr:Zatocoding dbr:Burton_Howard_Bloom dbr:File:AttenuatedBloomFilter2.png dbr:File:BloomFilterDisk.png dbr:File:Bloom_filter.svg dbr:File:Bloom_filter_fp_probability.svg dbr:File:Bloom_filter_speed.svg dbr:File:DistributedBloomFilterExample.png dbr:Hash_compaction
dbp:wikiPageUsesTemplate	dbt:Anchor dbt:Citation dbt:Citation_needed dbt:Commons_category dbt:Distinguish dbt:Harvtxt dbt:Main dbt:Math dbt:Mvar dbt:Not_a_typo dbt:Portal dbt:Refbegin dbt:Refend dbt:Reflist dbt:Sfnp dbt:Short_description dbt:Var dbt:Probabilistic
dcterms:subject	dbc:Probabilistic_data_structures dbc:Lossy_compression_algorithms dbc:Hashing dbc:Hash_based_data_structures
gold:hypernym	dbr:Structure
rdf:type	owl:Thing yago:WikicatLossyCompressionAlgorithms yago:Abstraction100002137 yago:Act100030358 yago:Activity100407535 yago:Algorithm105847438 yago:Arrangement105726596 yago:Cognition100023271 yago:DataStructure105728493 yago:Event100029378 yago:Procedure101023820 yago:PsychologicalFeature100023100 yago:YagoPermanentlyLocatedEntity dbo:Building yago:Rule105846932 yago:Structure105726345 yago:WikicatAlgorithms yago:WikicatDataStructures yago:WikicatProbabilisticDataStructures
rdfs:comment	Un filtro de Bloom es una estructura de datos probabilística, concebida por en 1970, que es usada para verificar si un elemento es miembro de un conjunto. Los falsos positivos son posibles pero los falsos negativos no. (es) 블룸 필터(Bloom filter)는 원소가 집합에 속하는지 여부를 검사하는데 사용되는 확률적 자료 구조이다. 1970년 Burton Howard Bloom에 의해 고안되었다.블룸 필터에 의해 어떤 원소가 집합에 속한다고 판단된 경우 실제로는 원소가 집합에 속하지 않는 긍정 오류가 발생하는 것이 가능하지만, 반대로 원소가 집합에 속하지 않는 것으로 판단되었는데 실제로는 원소가 집합에 속하는 부정 오류는 절대로 발생하지 않는다는 특성이 있다. 집합에 원소를 추가하는 것은 가능하나, 집합에서 원소를 삭제하는 것은 불가능하다. 집합 내 원소의 숫자가 증가할수록 긍정 오류 발생 확률도 증가한다. (ko) ブルームフィルタ（英語: Bloom filter）は、1970年に Burton H. Bloom が考案した空間効率の良い確率的データ構造であり、あるデータが集合の要素である（集合に含まれている）かどうかの判定に使われる。ただし判定は正確ではなくて、含まれていないのに含まれていると誤って判定すること偽陽性（false positive）の可能性がある。しかし含まれているものを含まれていないと誤判定すること偽陰性（false negative）はない。なお集合に要素を追加することはできるが、集合から要素を削除することはできない（ただし、拡張をした counting filter であれば削除もできる）。集合に要素を追加していくにつれて偽陽性の可能性は増す。 (ja) Filtr Blooma – tablica bitowa stworzona przez Burtona H. Blooma w 1970 roku. Pierwotnie Filtr Blooma był wykorzystywany do implementacji baz danych, obecnie jest bardzo popularny w sieciach komputerowych. Filtr ten jest strukturą prostą i wydajną pamięciowo, która ma na celu reprezentować zadany zbiór elementów. Zastosowanie znajduje w szybkim określaniu przynależności podanych argumentów do tego zbioru elementów. Filtr Blooma ma jedną wadę. Jego wydajność (oszczędność pamięci) jest możliwa dzięki wprowadzeniu marginesu błędnych pozytywnych odpowiedzi. Efektem tego zabiegu są straty, spowodowane błędnymi informacjami, które często są większe od zaoszczędzonej pamięci. (pl) 布隆过滤器（英語：Bloom Filter）是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法，缺点是有一定的误识别率和删除困难。 (zh) فلتر بلوم هو هيكل أو بنية بيانات احتمالية موفرة للمساحة. أوجدها بورتون هاوارد بلوم عام 1970وهي تستخدم لاختبار انتماء عنصر لمجموعة من عدمه. يمكن لفلتر بلوم أن يصنف عناصر خطأً على أنها تنتمي لمجموعة، إلا أنه لا تكون إجابته خاطئة أبدا إذا أجاب بعدم وجود العنصر في المجموعة. بمعنى آخر، تجاب الاستعلامات إما بـ«يحتمل أن ينتمي للمجموعة» أو «حتما لا ينتمي للمجموعة». يمكن إضافة عناصر للمجموعة لكن لا يمكن حذفها (لكن هناك حل لذلك مع فلتر «عادّ»). كلما زادت عناصر المجموعة كلما زاد احتمال التصنيفات الإيجابية الخاطئة (إجابة «يحتمل أن ينتمي للمجموعة»). (ar) Bloomův filtr, pojmenovaný podle , který ho objevil vroce 1970, je prostorověefektivní pravděpodobnostní datová struktura, která se používá na ověřování příslušnostiprvků do množiny. Protože je tato struktura pravděpodobnostní, můžou při tomtoověřování nastat chyby. Při této chybě se o prvku, který ve skutečnosti do dané množiny nepatří, dozvíme,že tam patří, ale nikdy ne naopak. To znamená, že při odpovědi, že daný prvek do množiny nepatří, se dá naBloomův filtr spolehnout na 100%. Pravděpodobnost chyby roste s větším počtem prvků v danémnožině (při pevné velikosti reprezentace). (cs) A Bloom filter is a space-efficient probabilistic data structure, conceived by in 1970, that is used to test whether an element is a member of a set. False positive matches are possible, but false negatives are not – in other words, a query returns either "possibly in set" or "definitely not in set". Elements can be added to the set, but not removed (though this can be addressed with the variant); the more items added, the larger the probability of false positives. (en) Ein Bloom-Filter (benannt nach ) ist eine probabilistische Datenstruktur, mit deren Hilfe sehr schnell festgestellt werden kann, welche Daten in einem Datenstrom schon einmal vorgekommen sind und welche erstmals auftreten. Hierzu wird mit einer geeigneten Zahl von Hash-Funktionen ein „Fingerabdruck“ des gelesenen Datensatzes in einer einzeiligen Hashtabelle hinterlassen. (de) En informatique, et plus précisément en algorithmique, un filtre de Bloom est une structure de données inventée par Burton Howard Bloom en 1970. C'est une implémentation du type abstrait Ensemble. Cette structure est probabiliste, c'est-à-dire qu'elle utilise des probabilités, et que sa correction est probabiliste. Plus précisément, lors du test de la présence d'un élément dans un ensemble, un filtre de Bloom permet de savoir : (fr) Фильтр Блума (англ. Bloom filter) — это вероятностная структура данных, придуманная Бёртоном Блумом в 1970 году, позволяющая проверять принадлежность элемента к множеству. При этом существует возможность получить ложноположительное срабатывание (элемента в множестве нет, но структура данных сообщает, что он есть), но не ложноотрицательное. (ru) Фільтр Блума (англ. Bloom filter) — заощадлива до пам'яті ймовірнісна структура даних, призначена для перевірки приналежності елементів до множини. Запропонована Бартоном Говардом Блумом (англ. Burton Howard Bloom) в 1970 році. Зазвичай, незалежно від кількості елементів в множині, достатньо не більше 10 біт на елемент для досягнення частки помилкового спрацювання в 1 %. (uk)
rdfs:label	مرشح بلوم (ar) Bloomův filtr (cs) Bloomfilter (de) Filtro de Bloom (es) Bloom filter (en) Filtre de Bloom (fr) 블룸 필터 (ko) ブルームフィルタ (ja) Filtr Blooma (pl) Фильтр Блума (ru) Фільтр Блума (uk) 布隆过滤器 (zh)
owl:sameAs	freebase:Bloom filter yago-res:Bloom filter wikidata:Bloom filter dbpedia-ar:Bloom filter dbpedia-cs:Bloom filter dbpedia-de:Bloom filter dbpedia-es:Bloom filter dbpedia-fa:Bloom filter dbpedia-fr:Bloom filter dbpedia-he:Bloom filter dbpedia-ja:Bloom filter dbpedia-ko:Bloom filter dbpedia-pl:Bloom filter dbpedia-ru:Bloom filter dbpedia-simple:Bloom filter dbpedia-sk:Bloom filter dbpedia-sr:Bloom filter dbpedia-th:Bloom filter dbpedia-uk:Bloom filter dbpedia-vi:Bloom filter dbpedia-zh:Bloom filter https://global.dbpedia.org/id/53NMb
prov:wasDerivedFrom	wikipedia-en:Bloom_filter?oldid=1122201044&ns=0
foaf:depiction	wiki-commons:Special:FilePath/AttenuatedBloomFilter2.png wiki-commons:Special:FilePath/BloomFilterDisk.png wiki-commons:Special:FilePath/Bloom_filter.svg wiki-commons:Special:FilePath/Bloom_filter_fp_probability.svg wiki-commons:Special:FilePath/Bloom_filter_speed.svg wiki-commons:Special:FilePath/DistributedBloomFilterExample.png
foaf:isPrimaryTopicOf	wikipedia-en:Bloom_filter
is dbo:wikiPageDisambiguates of	dbr:Bloom
is dbo:wikiPageRedirects of	dbr:Attenuated_Bloom_filters dbr:Bloom_Filter dbr:Stable_Bloom_filters dbr:Layered_Bloom_filters dbr:Scalable_Bloom_filters dbr:Bloom_filters dbr:Bloom_map dbr:Bloomfilter dbr:Bloomier_filter dbr:Burton_H._Bloom
is dbo:wikiPageWikiLink of	dbr:RocksDB dbr:List_of_data_structures dbr:Binary_search_algorithm dbr:BitFunnel dbr:Approximate_Membership_Query_Filter dbr:Attenuated_Bloom_filters dbr:Cuckoo_filter dbr:Cuckoo_hashing dbr:Double_hashing dbr:Rabin–Karp_algorithm dbr:Embedded_database dbr:Moses_(machine_translation) dbr:Bloom dbr:Bloom_Filter dbr:Apache_HBase dbr:Collision_attack dbr:Comparison_of_ADC_software dbr:Feature_hashing dbr:Michael_Mitzenmacher dbr:Document_retrieval dbr:Drosophila_melanogaster dbr:Hash_filter dbr:Hash_function dbr:Lattice_(order) dbr:Locality-sensitive_hashing dbr:Superimposed_code dbr:Fowler–Noll–Vo_hash_function dbr:Kimberly_Keeton dbr:Hash_table dbr:Counting_Bloom_filter dbr:Jenkins_hash_function dbr:Bit_array dbr:Bloom_filters_in_bioinformatics dbr:Blue_(queue_management_algorithm) dbr:Record_linkage dbr:Stable_Bloom_filters dbr:Boolean_model_of_information_retrieval dbr:MinHash dbr:Redis dbr:Set_(abstract_data_type) dbr:Layered_Bloom_filters dbr:List_of_terms_relating_to_algorithms_and_data_structures dbr:Streaming_algorithm dbr:Scientific_phenomena_named_after_people dbr:Quotient_filter dbr:Scalable_Bloom_filters dbr:SipHash dbr:Skip_list dbr:Bloom_filters dbr:Bloom_map dbr:Bloomfilter dbr:Bloomier_filter dbr:Burton_H._Bloom
is foaf:primaryTopic of	wikipedia-en:Bloom_filter