Apa itu Teknologi dan Solusi Masking Data di Network Packet Broker?

1. Konsep Penyamaran Data

Penyamaran data juga dikenal sebagai penyamaran data. Ini adalah metode teknis untuk mengubah, memodifikasi, atau menyembunyikan data sensitif seperti nomor telepon seluler, nomor kartu bank, dan informasi lainnya ketika kita telah menetapkan aturan dan kebijakan penyamaran. Teknik ini terutama digunakan untuk mencegah data sensitif digunakan secara langsung di lingkungan yang tidak dapat diandalkan.

Prinsip Masking Data: Masking data harus mempertahankan karakteristik data asli, aturan bisnis, dan relevansi data untuk memastikan bahwa pengembangan, pengujian, dan analisis data selanjutnya tidak akan terpengaruh oleh masking. Pastikan konsistensi dan validitas data sebelum dan sesudah masking.

2. Klasifikasi Penyamaran Data

Penyembunyian data dapat dibagi menjadi penyembunyian data statis (SDM) dan penyembunyian data dinamis (DDM).

Penyamaran data statis (SDM): Masking data statis memerlukan pembentukan basis data lingkungan non-produksi baru untuk isolasi dari lingkungan produksi. Data sensitif diekstrak dari basis data produksi dan kemudian disimpan dalam basis data non-produksi. Dengan cara ini, data yang telah didesensitisasi diisolasi dari lingkungan produksi, yang memenuhi kebutuhan bisnis dan memastikan keamanan data produksi.

SDM

Penyamaran Data Dinamis (DDM)Secara umum, metode ini digunakan di lingkungan produksi untuk mendesensitisasi data sensitif secara real-time. Terkadang, diperlukan tingkat masking yang berbeda untuk membaca data sensitif yang sama dalam situasi yang berbeda. Misalnya, peran dan izin yang berbeda dapat menerapkan skema masking yang berbeda.

DDM

Aplikasi pelaporan data dan penyamaran produk data.

Skenario tersebut terutama mencakup produk pemantauan data internal atau papan pengumuman, produk data layanan eksternal, dan laporan berdasarkan analisis data, seperti laporan bisnis dan tinjauan proyek.

pelaporan data penyamaran produk

3. Solusi Penyamaran Data

Skema penyamaran data yang umum meliputi: invalidasi, nilai acak, penggantian data, enkripsi simetris, nilai rata-rata, offset dan pembulatan, dll.

PenghapusanInvalidasi mengacu pada enkripsi, pemotongan, atau penyembunyian data sensitif. Skema ini biasanya mengganti data asli dengan simbol khusus (seperti *). Operasinya sederhana, tetapi pengguna tidak dapat mengetahui format data asli, yang dapat memengaruhi aplikasi data selanjutnya.

Nilai AcakNilai acak mengacu pada penggantian acak data sensitif (angka menggantikan digit, huruf menggantikan huruf, dan karakter menggantikan karakter). Metode penyamaran ini akan memastikan format data sensitif sampai batas tertentu dan mempermudah penerapan data selanjutnya. Kamus penyamaran mungkin diperlukan untuk beberapa kata yang bermakna, seperti nama orang dan tempat.

Penggantian DataPenggantian data mirip dengan masking nilai null dan acak, kecuali bahwa alih-alih menggunakan karakter khusus atau nilai acak, data masking diganti dengan nilai tertentu.

Enkripsi SimetrisEnkripsi simetris adalah metode penyamaran reversibel khusus. Metode ini mengenkripsi data sensitif melalui kunci dan algoritma enkripsi. Format teks sandi konsisten dengan data asli dalam aturan logika.

Rata-rataSkema rata-rata sering digunakan dalam skenario statistik. Untuk data numerik, pertama-tama kita menghitung rata-ratanya, lalu mendistribusikan nilai-nilai yang telah didesensitisasi secara acak di sekitar rata-rata tersebut, sehingga jumlah data tetap konstan.

Offset dan PembulatanMetode ini mengubah data digital dengan pergeseran acak. Pembulatan offset memastikan keaslian rentang secara mendekati sambil menjaga keamanan data, yang lebih mendekati data sebenarnya daripada skema sebelumnya, dan memiliki signifikansi besar dalam skenario analisis big data.

ML-NPB-5660-数据脱敏

Model RekomendasiML-NPB-5660" untuk Penyamaran Data

4. Teknik Masking Data yang Umum Digunakan

(1). Teknik Statistik

Pengambilan sampel data dan agregasi data

- Pengambilan sampel data: Analisis dan evaluasi kumpulan data asli dengan memilih subset representatif dari kumpulan data merupakan metode penting untuk meningkatkan efektivitas teknik de-identifikasi.

- Agregasi data: Sebagai kumpulan teknik statistik (seperti penjumlahan, penghitungan, perataan, maksimum dan minimum) yang diterapkan pada atribut dalam data mikro, hasilnya mewakili semua catatan dalam kumpulan data asli.

(2). Kriptografi

Kriptografi adalah metode umum untuk mengurangi sensitivitas atau meningkatkan efektivitas pengurangan sensitivitas. Berbagai jenis algoritma enkripsi dapat mencapai efek pengurangan sensitivitas yang berbeda.

- Enkripsi deterministik: Enkripsi simetris non-acak. Biasanya memproses data ID dan dapat mendekripsi serta mengembalikan teks sandi ke ID asli bila diperlukan, tetapi kuncinya perlu dilindungi dengan benar.

- Enkripsi ireversibel: Fungsi hash digunakan untuk memproses data, yang biasanya digunakan untuk data identitas. Data tersebut tidak dapat didekripsi secara langsung dan hubungan pemetaan harus disimpan. Selain itu, karena karakteristik fungsi hash, kemungkinan terjadi tabrakan data.

- Enkripsi homomorfik: Algoritma homomorfik digunakan untuk enkripsi teks sandi. Ciri khasnya adalah hasil operasi teks sandi sama dengan hasil operasi teks biasa setelah dekripsi. Oleh karena itu, algoritma ini umum digunakan untuk memproses bidang numerik, tetapi tidak banyak digunakan karena alasan kinerja.

(3). Teknologi Sistem

Teknologi penekanan menghapus atau melindungi item data yang tidak memenuhi perlindungan privasi, tetapi tidak mempublikasikannya.

- Masking: mengacu pada metode desensitisasi paling umum untuk menyembunyikan nilai atribut, seperti nomor lawan, kartu identitas yang ditandai dengan tanda bintang, atau alamat yang dipersingkat.

- Penghapusan lokal: mengacu pada proses penghapusan nilai atribut (kolom) tertentu, menghapus bidang data yang tidak penting;

- Penghapusan data: mengacu pada proses penghapusan data (baris) tertentu, yaitu menghapus data yang tidak penting.

(4). Teknologi Pseudonim

Pseudomanning adalah teknik de-identifikasi yang menggunakan nama samaran untuk menggantikan pengenal langsung (atau pengenal sensitif lainnya). Teknik nama samaran menciptakan pengenal unik untuk setiap subjek informasi individu, sebagai pengganti pengenal langsung atau sensitif.

- Fitur ini dapat menghasilkan nilai acak secara independen yang sesuai dengan ID asli, menyimpan tabel pemetaan, dan mengontrol akses ke tabel pemetaan secara ketat.

- Anda juga dapat menggunakan enkripsi untuk menghasilkan nama samaran, tetapi perlu menyimpan kunci dekripsi dengan benar;

Teknologi ini banyak digunakan dalam kasus sejumlah besar pengguna data independen, seperti OpenID dalam skenario platform terbuka, di mana pengembang yang berbeda memperoleh OpenID yang berbeda untuk pengguna yang sama.

(5). Teknik Generalisasi

Teknik generalisasi merujuk pada teknik de-identifikasi yang mengurangi granularitas atribut terpilih dalam suatu kumpulan data dan memberikan deskripsi data yang lebih umum dan abstrak. Teknologi generalisasi mudah diimplementasikan dan dapat melindungi keaslian data tingkat catatan. Teknologi ini umum digunakan dalam produk data atau laporan data.

- Pembulatan: melibatkan pemilihan basis pembulatan untuk atribut yang dipilih, seperti pembulatan ke atas atau ke bawah, menghasilkan angka 100, 500, 1K, dan 10K.

- Teknik pengkodean atas dan bawah: Ganti nilai di atas (atau di bawah) ambang batas dengan ambang batas yang mewakili tingkat atas (atau bawah), menghasilkan hasil "di atas X" atau "di bawah X".

(6). Teknik Pengacakan

Sebagai salah satu teknik de-identifikasi, teknologi pengacakan mengacu pada modifikasi nilai suatu atribut melalui pengacakan, sehingga nilai setelah pengacakan berbeda dari nilai asli sebenarnya. Proses ini mengurangi kemampuan penyerang untuk mendapatkan nilai atribut dari nilai atribut lain dalam catatan data yang sama, tetapi memengaruhi keaslian data yang dihasilkan, yang umum terjadi pada data uji produksi.


Waktu posting: 27 September 2022