dbo:abstract
|
- Unicity is a risk metric for measuring the re-identifiability of high-dimensional anonymous data. First introduced in 2013, unicity is measured by the number of points p needed to uniquely identify an individual in a data set. The fewer points needed, the more unique the traces are and the easier they would be to re-identify using outside information. In a high-dimensional, human behavioural data set, such as mobile phone meta-data, for each person, there exists potentially thousands of different records. In the case of mobile phone meta-data, credit card transaction histories and many other types of personal data, this information includes the time and location of an individual. In research, unicity is widely used to illustrate the re-identifiability of anonymous data sets. In 2013 researchers from the MIT Media Lab showed that only 4 points needed to uniquely identify 95% of individual trajectories in a de-identified data set of 1.5 million mobility trajectories. These points were location-time pairs that appeared with the resolution of 1 hour and 0.15 km² to 15 km². These results were shown to hold true for credit card transaction data as well with 4 points being enough to re-identify 90% of trajectories. Further research studied the unicity of the apps installed by people on their smartphones, the trajectories of vehicles, mobile phone data from Boston and Singapore, and, public transport data in Singapore obtained from smartcards. (en)
- Унікальність є показником ризику для вимірювання повторної ідентифікації високорозмірних . Вперше представлена у 2013 році, унікальність вимірюється кількістю точок p, необхідних для однозначної ідентифікації особи в наборі даних. Чим менше потрібно точок, тим унікальнішими є сліди і тим легше їх буде повторно ідентифікувати за допомогою зовнішньої інформації. У високорозмірному наборі даних про поведінку людини, як-от метадані мобільного телефону, для кожної людини існують потенційно тисячі різних записів. У випадку метаданих мобільного телефону, та багатьох інших типів персональних даних ця інформація включає час і місце перебування особи. У дослідженнях уніфікація широко використовується для ілюстрації повторної ідентифікації анонімних наборів даних. У 2013 році Дослідники з MIT Media Lab показали, що лише 4 бали необхідні для однозначної ідентифікації 95% індивідуальних траєкторій у наборі даних із 1,5 мільйонів мобільних траєкторій. Ці «точки» були парами місце-час, які з’являлися з роздільною здатністю 1 година та від 0,15 км² до 15 км². Було показано, що ці результати справедливі і для даних транзакцій кредитних карток при цьому 4 точки достатньо для повторного визначення 90% траєкторій. Подальше дослідження вивчало унікальність програм, встановлених людьми на своїх смартфонах, траєкторій транспортних засобів, даних мобільного телефону з Бостона та Сінгапуру, і даних про громадський транспорт у Сінгапурі, отриманих зі смарт-карт. (uk)
|