
خانم مهری رجائی دانشجوی دکترای جناب آقایان دکتر مصطفی حق جو و دکتر عین الله خنجری روز شنبه مورخ 94/10/12 از رساله دکترای خود تحت عنوان حفظ حریم خصوصی در انتشار داده های شبکه اجتماعی با تامین سطحی از سودمندی داده دفاع نمود و موفق به کسب نمره بسیار خوب گردید.
چکیده
امروزه دادههای شبکههای اجتماعی بسیاری تولید میشود، ساختار این دادهها به صورت گراف است و حاوی اطلاعات مفیدی درمورد تعاملات بین افراد جامعه میباشد. لذا تحلیل آنها مورد توجه بسیاری از تحلیلگران سیاسی، اجتماعی، اقتصادی، جغرافیایی، مدیریتی قرار گرفته است. از آنجاییکه این دادهها شامل اطلاعات شخصی و خصوصی افراد است، صاحبان دادههای شبکههای اجتماعی در راستای حفظ حریم خصوصی افراد، نمیتوانند به راحتی آنها را در اختیار تحلیلگران قرار دهند. یک راه حل برای مقابله با مشکل فوق استفاده از عملیات گمنامسازی به منظور تبدیل داده اصلی به نسخه گمنام شده و انتشار آن به جای داده اصلی میباشد. دسترسی به داده منتشرشده، در عین حال که امکان تحلیل مفید و نزدیک به واقعیت (سودمندی داده) را فراهم میکند، نبایستی منجر به افشای اطلاعات حساس افراد شود. مسئله گمنامسازی داده با درنظر گرفتن سودمندی داده و حریم خصوصی افراد معروف به مسئله حفظ حریم خصوصی در انتشاردادههای شبکه اجتماعی میباشد.
در این رساله یک راهکار کلی برای گمنامسازی دادههای شبکه اجتماعی با ارتباطات جهتدار و رئوس دارای برچسبهای توصیف کننده، پیشنهاد شده است. در راهکار پیشنهادی مسئله از پایه مورد بررسی قرار میگیرد. در گام اول، یک مدل حریم خصوصی خاص دادههای شبکهای ارائه میشود. هدف این مدل جلوگیری از چهار نوع افشای حضور، صفت حساس، درجه و ارتباط میباشد. در گام بعدی، تکنیک گمنامسازی برمبنای تکنیک تجزیه، برای مشخص کردن قالب داده منتشر شده پیشنهاد میشود. داده ذخیره شده بر مبنای تکنیک گمنامسازی پیشنهادی، این قابلیت را دارد که از افشای چهار مورد فوق جلوگیری کند. در گام سوم، یک الگوریتم گمنامسازی حریصانه برای تبدیل داده اصلی به قالب مشخص شده برای انتشار، ارائه میشود. این الگوریتم ضمن حفظ حریم خصوصی همه اعضاء مجموعه داده زیر حدود آستانه مشخص شده، سودمندی داده را در حد مطلوبی حفظ مینماید.
نتایج آزمایشات بر روی مجموعه دادههای واقعی و ساختگی برای ارزیابی سودمندی پاسخ چهار نوع پرسش تجمعی دادههای جدولی، تجمعی شبکهای، خصوصیات توپولوژیکی و طیفی گراف نشان میدهد که راهکار پیشنهادی توازن خوبی بین حریم خصوصی و سودمندی داده برقرار کرده است.
واژههای کلیدی: حریم خصوصی، داده شبکهای، شبکهاجتماعی، گمنامسازی، انتشار داده، داده حساس، سودمندی داده.
:Abstract
Nowadays, huge amounts of social network data are generated.These data have graph structure and contain useful information about interactions between members of society. So, their analysis has been interested by political, social, economical, geographical, management analysts. To protect the privacy of individuals, data owners could not share them with analysis, since social network data contain sensitive and private information about individuals. One solution to overcome this problem is to safely transform original network data by anonymization operations to anonymous release of data and publish them. But the published data should permit useful analysis while protecting privacy. This problem is known as privacy-preserving network data publication.
In this dissertation, we propose total framework for above problem for directed network data whose nodes contain attributes. In the proposed framework, we investigate the problem from base. First, we propose a privacy model special for network data. The purpose is to prevent disclosure of presence, sensitive attribute, degree and relationship (link). Second, an anonymization technique based on anatomization that specifies the format of published data is proposed. The data that stored based on our proposed anonymization technique have the ability to prevent above four disclosures. Third, we propose a greedy anonymization algorithm to transform the original data to the specified format of anonymization technique. This algorithm preserves privacy of all members of social network under specified thresholds, and also preserves data utility at an acceptable level.
We did some experiments on real and synthetic datasets to evaluate data utility of four kinds of queries (aggregate tabular query, aggregate network query, graph topological and spectrum properties). Experimental results show that our proposed approach and framework make good balance between privacy and data utility.
Keywords: privacy, network data, social network, anonymization, publish data, sensitive attribute, data utility, information loss.
ارائه دهنده:
مهری رجائی
در رشته مهندسی کامپیوتر گرایش نرمافزار
استادان راهنما:
دکتر مصطفی حقجو و دکتر عینالله خنجری
هیات داوران:
دکتر رسول جلیلی، دکتر مسعود رهگذر، دکتر سعید پارسا و دکتر بهروز مینایی
زمان : شنبه 12 دی ماه 1394
ساعت 15:00
مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه دکتری
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|