CNIL – Kişisel Verinin Anonimleştirilmesi – 19.05.2020
Kişisel Verinin Anonimleştirilmesi
Anonimleştirme bir veri kümesinden, bir kişiye belirlemeyi imkansız kılar ve bu nedenle özel hayata saygıyı mümkün kılar. CNIL, kullanılabilecek teknikleri ve bu tekniklerin zorluklarını değerlendirmiştir.
Anonimleştirme Nedir?
Anonimleştirme, pratikte kişinin herhangi bir şekilde tanımlanmasını imkansız kılan şekilde ve geri döndürülemez bir dizi tekniğin kullanılmasından oluşan bir işlemdir.
Anonimleştirme, psödonimizasyon (Takma Ad veya Rumuz Kullanma/Bulanıklaştırma) ile karıştırılmamalıdır.
Bulanıklaştırma, gerçek bir kişi ile ilgili verilerin ek bir bilgi olmaksızın bu gerçek kişi ile ilişkilendirilemeyeceği şekilde yürütülen bir kişisel veri işlemedir.
Uygulamada, bulanıklaştırma doğrudan tanımlamaya yarayan veri kümelerinin (soyadı, ilk ad, vs.), dolaylı tanımlamaya yarayan (rumuz/takma ad, sıra numarası vs) verilerle değiştirilmesini kapsar.
Bu nedenle bulanıklaştırma doğrudan kişileri tanımlayabilir olmaksızın bireylerin verilerini işlemeyi mümkün kılmaktadır. Buna karşılık uygulamada sık sık üçüncü taraf verileri kullanarak bireylerin verilerini bulmak mümkün olmaktadır: Bu nedenle ilgili veri kişisel bir karakteri korur. Bulanıklaştırma işlemi, anonimleştirme işleminden farklı olarak geri döndürülebilir bir işlemdir.
Bulanıklaştırma, kişisel veri işlemeden doğan risklerin sınırlandırılması için GDPR tarafından önerilen tedbirlerden bir tanesidir.
Kişisel verileri neden anonimleştirelim?
Genel Veri Koruma Tüzüğü (GDPR) genel bir anonimleştirme yükümlülüğü içermemektedir. Diğerleri arasında, bireysel hak ve özgürlüklere saygı duyarak kişisel verileri kullanabilmek için bir çözümdür.
Aslında, anonimleştirme ilk etapta kullanılan verinin kişisel niteliği nedeniyle yasaklanmış verilerin yeniden kullanılması potansiyelini doğurur ve bu nedenle bireylerin mahremiyetini ihlal etmeksizin veriyi kullanmalarına ve veri “havuzunu” paylaşmalarına izin verir. Ayrıca verinin saklama süresinin ötesinde saklanmasını da sağlar.
Bu durumda,anonimleştirilmiş verinin yayılması ya da yeniden kullanılmasının ilgili kişinin gizliliği üzerinde herhangi bir etkisi olmadığından veri koruma mevzuatı artık uygulanmaz.
Veri kümesinin kullanışlılığını mümkün olduğu kadar korurken veri nasıl anonimleştirilir?
Anonimleştirme süreci, herhangi bir yeniden tanımlama imkanını ortadan kaldırmayı amaçladığından dolayı bu verinin gelecekteki kullanımı belirli tipteki kullanımlarla sınırlıdır. Bu kısıtlamalar, projenin başlangıcından itibaren dikkate alınmalıdır.
Yerinde bir anonimleştirme süreci oluşturabilmek için, şunlar tavsiye edilebilir:
- İlgili oluşuna dayalı olarak saklanacak bilgiyi tanımlayın,
- Kişinin kolayca yeniden tanımlanmasını neden olabilecek nadir değerlerin (örneğin, bireylerin yaşlarının mevcudiyeti yüz yaşını aşmış kişilerin kolayca belirlenebilmesine neden olur) yanı sıra doğrudan tanımlama unsurlarını kaldırın,
- Önemli bilgileri ikincil ya da kullanışsız bilgilerden (yani silinebilir) ayırın,
- Saklanan her bilgi için ideal ve kabul edilebilir vasıtaları tanımlayın.
Bu ön şart, uygulanacak anonimleştirme sürecini yani uygulanacak anonimleştirme tekniklerinin sırasını belirlemeyi mümkün kılar. Bunlar iki aileye ayırılır: Randomizasyon (rastgeleleştirme) ve genelleştirme.
- Rastgeleleştirme, genel dağılımı korurken bir veri kümesinin daha az kesin olacak şekilde özelliklerini değiştirmektir. Bu teknik çıkarsama (sonuç çıkarma) riskine karşı veri kümesini korur (aşağıya bakınız).
Örnek: Veritabanında bulunan bilginin doğruluğunu değiştirmek üzere bireylerin doğum tarihi ile ilgili verilerin değiştirilmesi mümkündür.
- Genelleştirme, bir dizi kişide ortak olduğundan emin olmak için ölçek veri kümesinin özelliklerini ya da boyutunu değiştirmektedir. Bu teknik bir veri setinin bireyselleştirilmesinden kaçınır ve veri kümesinin diğerleri ile olası korelasyonu da sınırlar (aşağıya bakınız).
Örnek: Kişilerin doğum tarihlerini içeren bir dosyada, bu bilgiyi sadece doğum yılı ile değiştirmek mümkündür.
Anonimizasyonun Etkinliği nasıl teyit edilir?
Avrupa veri koruma kurumlar, veri kümesinin gerçek şekilde anonim olduğundan emin olmak için 3 kriter tanımlar:
- Bireyselleşme : Veri kümesindeki bir bireyi izole etmek mümkün olmalıdır;
Örneğin: Bir kişinin yalnızca adı ve soyadından oluşan bir özgeçmiş veri tabanı bu kişiyi bireyselleştirmeyi mümkün kılacak bir numara (yalnız bu kişiye tekabül eden) ile değiştirilebilir. Bu durumda, bu veritabanı anonimleştirilmiş değil, bulanıklaştırılmış sayılacaktır.
- Korelasyon : Aynı kişiyle ilgili ayrı bir veri kümelerini birbirine bağlamak mümkün olmamalıdır.
Örnek: Şahsi evlerin adreslerini bildiren bir kartografik veri tabanı, şayet başka bir yerde var olan diğer veritabanları, bireyleri tanımlamaya izin veren diğer verilerle birlikte aynı adresleri içeriyorsa, anonim olarak değerlendirilemez.
- Çıkarım/Sonuç Çıkarma: Birey hakkında, neredeyse kesin şekilde, yeni bilgi ortaya koyması mümkün olmamalıdır.
Örnek: Sözde anonim bir veri kümesi, bir anketi cevaplayan kişilerin vergi miktarı hakkında bilgi içeriyorsa, cevap veren 20 ile 25 arasındaki tüm erkeklerin vergiye tabi olmadığını bildirmişse, ankete cevap vermiş olan 24 yaşındaki bir erkek olan Bay X’in vergiye tabi olmadığını bilmemiz mümkün olacaktır.
Anonimleştirme ilgili risklere karşı nasıl koruruz?
Şayet bu üç kriter tamamen karşılanmazsa, bir veri kümesini anonimleştirmek isteyen veri sorumlusu, derinlemesine bir risk belirleme değerlendirmesi ile yeniden belirlenebilme riskini makul şekilde sıfırladığını göstermelidir.
Anonimleştirme ve yeniden belirleme tekniklerinin düzenli olarak gelişmesi muhtemel olduğundan, ilgili veri sorumluları için üretilen verinin anonim özelliğini korumak adına zaman geçtikçe düzenli olarak denetlenmesi önemlidir. Bilginin anonimliğinin kalkmasına neden olacak diğer veri kaynakları kadar, bu gözlem/denetleme uygulanabilir tekniği de hesaba katmalıdır.
Anonim olarak çevrimiçi olarak yayınlanan bir veri kümesi, gerçekte kişisel veri içerirse ve Kamu ve İdare İlişkileri Kanunu’nun (CRPA) L.312/1-2. maddelerinde bahsedilen istisnaların hiçbir uygulanabilir değilse, bu durumda bir veri ihlali meydana gelmiş sayılacaktır. Bu durumda şunlar gerekecektir:
- Mümkün olan en kısa sürede söz konusu veri kümesi geri çekilmelidir,
- Bireysel hak ve özgürlükler için bir risk doğurması muhtemel ise CNIL bilgilendirilmelidir,
- İlgili kişiler, bunun yüksek bir risk olduğu konusunda bilgilendirilmelidir.