Apa teknologi dan solusi masking data dalam broker paket jaringan?

1. Konsep pembongkaran data

Masking data juga dikenal sebagai masking data. Ini adalah metode teknis untuk mengonversi, memodifikasi, atau mencakup data sensitif seperti nomor ponsel, nomor kartu bank dan informasi lainnya ketika kami telah memberikan aturan dan kebijakan masking. Teknik ini terutama digunakan untuk mencegah data sensitif digunakan secara langsung di lingkungan yang tidak dapat diandalkan.

Prinsip Masking Data: Masking data harus mempertahankan karakteristik data asli, aturan bisnis, dan relevansi data untuk memastikan bahwa pengembangan, pengujian, dan analisis data selanjutnya tidak akan dipengaruhi oleh masking. Pastikan konsistensi dan validitas data sebelum dan sesudah masking.

2. Klasifikasi Masking Data

Masking data dapat dibagi menjadi statis data masking (SDM) dan Dynamic Data Masking (DDM).

Static Data Masking (SDM): Masking data statis membutuhkan pembentukan database lingkungan non-produksi baru untuk isolasi dari lingkungan produksi. Data sensitif diekstraksi dari database produksi dan kemudian disimpan dalam database non-produksi. Dengan cara ini, data yang tidak peka diisolasi dari lingkungan produksi, yang memenuhi kebutuhan bisnis dan memastikan keamanan data produksi.

SDM

Dynamic Data Masking (DDM): Secara umum digunakan dalam lingkungan produksi untuk memuaskan data sensitif secara real time. Kadang -kadang, berbagai tingkat masking diperlukan untuk membaca data sensitif yang sama dalam situasi yang berbeda. Misalnya, peran dan izin yang berbeda dapat menerapkan skema masking yang berbeda.

Ddm

Pelaporan Data dan Aplikasi Masking Produk Data

Skenario tersebut terutama termasuk produk pemantauan data internal atau papan iklan, produk data layanan eksternal, dan laporan berdasarkan analisis data, seperti laporan bisnis dan tinjauan proyek.

Pelaporan Data Masking Produk

3. Solusi Masking Data

Skema masking data umum meliputi: Invalidasi, nilai acak, penggantian data, enkripsi simetris, nilai rata -rata, offset dan pembulatan, dll.

Penghapusan: Invalidasi mengacu pada enkripsi, pemotongan, atau menyembunyikan data sensitif. Skema ini biasanya menggantikan data nyata dengan simbol khusus (seperti *). Operasi ini sederhana, tetapi pengguna tidak dapat mengetahui format data asli, yang dapat memengaruhi aplikasi data berikutnya.

Nilai acak: Nilai acak mengacu pada penggantian acak data sensitif (angka menggantikan angka, huruf ganti huruf, dan karakter menggantikan karakter). Metode masking ini akan memastikan format data sensitif sampai batas tertentu dan memfasilitasi aplikasi data berikutnya. Kamus menutupi mungkin diperlukan untuk beberapa kata yang bermakna, seperti nama orang dan tempat.

Penggantian Data: Penggantian data mirip dengan masking nilai null dan acak, kecuali bahwa alih -alih menggunakan karakter khusus atau nilai acak, data masking diganti dengan nilai tertentu.

Enkripsi Simetris: Enkripsi simetris adalah metode masking reversibel khusus. Ini mengenkripsi data sensitif melalui kunci enkripsi dan algoritma. Format ciphertext konsisten dengan data asli dalam aturan logis.

Rata-rata: Skema rata -rata sering digunakan dalam skenario statistik. Untuk data numerik, pertama -tama kami menghitung rata -rata, dan kemudian secara acak mendistribusikan nilai -nilai desensitisasi di sekitar rata -rata, sehingga menjaga jumlah konstanta data.

Offset dan Rounding: Metode ini mengubah data digital dengan shift acak. Pembulatan offset memastikan perkiraan keaslian kisaran sambil mempertahankan keamanan data, yang lebih dekat dengan data nyata daripada skema sebelumnya, dan memiliki signifikansi besar dalam skenario analisis data besar.

ML-NPB-5660- 数据脱敏

Model rekomendasi "ML-NPB-5660"Untuk menutupi data

4. Teknik masking data yang biasa digunakan

(1). Teknik statistik

Pengambilan sampel data dan agregasi data

- Pengambilan sampel data: Analisis dan evaluasi dari set data asli dengan memilih subset yang representatif dari set data adalah metode penting untuk meningkatkan efektivitas teknik de-identifikasi.

- Agregasi Data: Sebagai kumpulan teknik statistik (seperti penjumlahan, penghitungan, rata -rata, maksimum dan minimum) yang diterapkan pada atribut dalam mikrodata, hasilnya mewakili semua catatan dalam kumpulan data asli.

(2). Kriptografi

Kriptografi adalah metode umum untuk membuat peka atau meningkatkan efektivitas desensitisasi. Berbagai jenis algoritma enkripsi dapat mencapai efek desensitisasi yang berbeda.

- Enkripsi deterministik: enkripsi simetris non-acak. Biasanya memproses data ID dan dapat mendekripsi dan mengembalikan ciphertext ke ID asli bila perlu, tetapi kunci perlu dilindungi dengan benar.

- Enkripsi ireversibel: Fungsi hash digunakan untuk memproses data, yang biasanya digunakan untuk data ID. Itu tidak dapat didekripsi langsung dan hubungan pemetaan harus disimpan. Selain itu, karena fitur fungsi hash, tabrakan data dapat terjadi.

- Enkripsi homomorfik: Algoritma homomorfik ciphertext digunakan. Karakteristiknya adalah bahwa hasil operasi ciphertext sama dengan operasi plaintext setelah dekripsi. Oleh karena itu, biasanya digunakan untuk memproses bidang numerik, tetapi tidak banyak digunakan untuk alasan kinerja.

(3). Teknologi Sistem

Teknologi penindasan menghapus atau melindungi item data yang tidak memenuhi perlindungan privasi, tetapi tidak menerbitkannya.

- Masking: Ini mengacu pada metode desensitisasi yang paling umum untuk menutupi nilai atribut, seperti nomor lawan, kartu ID ditandai dengan tanda bintang, atau alamat dipotong.

- Penindasan lokal: mengacu pada proses menghapus nilai atribut spesifik (kolom), menghapus bidang data yang tidak penting;

- Catatan Penindasan: Mengacu pada proses menghapus catatan spesifik (baris), menghapus catatan data yang tidak penting.

(4). Teknologi nama samaran

Pseudomanning adalah teknik de-identifikasi yang menggunakan nama samaran untuk menggantikan pengidentifikasi langsung (atau pengidentifikasi sensitif lainnya). Teknik nama samaran membuat pengidentifikasi unik untuk setiap subjek informasi individu, alih -alih pengidentifikasi langsung atau sensitif.

- Ini dapat menghasilkan nilai acak secara independen agar sesuai dengan ID asli, menyimpan tabel pemetaan, dan secara ketat mengontrol akses ke tabel pemetaan.

- Anda juga dapat menggunakan enkripsi untuk menghasilkan nama samaran, tetapi perlu menjaga kunci dekripsi dengan benar;

Teknologi ini banyak digunakan dalam kasus sejumlah besar pengguna data independen, seperti OpenID dalam skenario platform terbuka, di mana pengembang yang berbeda mendapatkan openID yang berbeda untuk pengguna yang sama.

(5). Teknik generalisasi

Teknik generalisasi mengacu pada teknik de-identifikasi yang mengurangi granularitas atribut yang dipilih dalam set data dan memberikan deskripsi data yang lebih umum dan abstrak. Teknologi generalisasi mudah diimplementasikan dan dapat melindungi keaslian data tingkat rekor. Ini biasanya digunakan dalam produk data atau laporan data.

- Pembulatan: Melibatkan pemilihan basis pembulatan untuk atribut yang dipilih, seperti forensik ke atas atau ke bawah, menghasilkan hasil 100, 500, 1k, dan 10k

- Teknik pengkodean atas dan bawah: Ganti nilai di atas (atau di bawah) ambang batas dengan ambang yang mewakili level atas (atau bawah), menghasilkan hasil "di atas x" atau "di bawah x"

(6). Teknik pengacakan

Sebagai semacam teknik de-identifikasi, teknologi pengacakan mengacu pada memodifikasi nilai atribut melalui pengacakan, sehingga nilai setelah pengacakan berbeda dari nilai riil asli. Proses ini mengurangi kemampuan penyerang untuk memperoleh nilai atribut dari nilai atribut lain dalam catatan data yang sama, tetapi mempengaruhi keaslian data yang dihasilkan, yang umum dengan data uji produksi.


Waktu posting: Sep-27-2022