Apa Teknologi dan Solusi Penyembunyian Data di Broker Paket Jaringan?

1. Konsep Penyembunyian Data

Penyembunyian data juga dikenal sebagai penyembunyian data. Ini adalah metode teknis untuk mengubah, memodifikasi, atau menutupi data sensitif seperti nomor ponsel, nomor kartu bank, dan informasi lainnya ketika kami telah memberikan aturan dan kebijakan penyembunyian. Teknik ini terutama digunakan untuk mencegah data sensitif digunakan secara langsung di lingkungan yang tidak dapat diandalkan.

Prinsip Penyembunyian Data: Penyembunyian data harus menjaga karakteristik data asli, aturan bisnis, dan relevansi data untuk memastikan bahwa pengembangan, pengujian, dan analisis data selanjutnya tidak akan terpengaruh oleh penyembunyian. Pastikan konsistensi dan validitas data sebelum dan sesudah masking.

2. Klasifikasi Penyembunyian Data

Penyembunyian data dapat dibagi menjadi penyembunyian data statis (SDM) dan penyembunyian data dinamis (DDM).

Penyembunyian data statis (SDM): Penyembunyian data statis memerlukan pembuatan database lingkungan non-produksi baru untuk isolasi dari lingkungan produksi. Data sensitif diekstraksi dari database produksi dan kemudian disimpan di database non-produksi. Dengan cara ini, data yang tidak peka diisolasi dari lingkungan produksi, sehingga memenuhi kebutuhan bisnis dan menjamin keamanan data produksi.

SDM

Penyembunyian Data Dinamis (DDM): Biasanya digunakan di lingkungan produksi untuk menonaktifkan data sensitif secara real-time. Terkadang, tingkat penyembunyian yang berbeda diperlukan untuk membaca data sensitif yang sama dalam situasi berbeda. Misalnya, peran dan izin yang berbeda mungkin menerapkan skema penyembunyian yang berbeda.

DDM

Pelaporan data dan aplikasi penyembunyian produk data

Skenario tersebut terutama mencakup produk pemantauan data internal atau papan reklame, produk data layanan eksternal, dan laporan berdasarkan analisis data, seperti laporan bisnis dan tinjauan proyek.

pelaporan data produk masking

3. Solusi Penyembunyian Data

Skema penyembunyian data yang umum meliputi: pembatalan validasi, nilai acak, penggantian data, enkripsi simetris, nilai rata-rata, offset dan pembulatan, dll.

Penghapusan: Pembatalan mengacu pada enkripsi, pemotongan, atau penyembunyian data sensitif. Skema ini biasanya menggantikan data nyata dengan simbol khusus (seperti *). Pengoperasiannya sederhana, tetapi pengguna tidak dapat mengetahui format data asli, yang dapat mempengaruhi aplikasi data selanjutnya.

Nilai Acak: Nilai acak mengacu pada penggantian data sensitif secara acak (angka menggantikan angka, huruf menggantikan huruf, dan karakter menggantikan karakter). Metode masking ini akan memastikan format data sensitif sampai batas tertentu dan memfasilitasi penerapan data selanjutnya. Kamus penyamaran mungkin diperlukan untuk beberapa kata yang bermakna, seperti nama orang dan tempat.

Penggantian Data: Penggantian data mirip dengan penyembunyian nilai nol dan acak, hanya saja alih-alih menggunakan karakter khusus atau nilai acak, data penyembunyian diganti dengan nilai tertentu.

Enkripsi Simetris: Enkripsi simetris adalah metode penyembunyian khusus yang dapat dibalik. Ini mengenkripsi data sensitif melalui kunci enkripsi dan algoritma. Format ciphertext konsisten dengan data asli dalam aturan logika.

Rata-rata: Skema rata-rata sering digunakan dalam skenario statistik. Untuk data numerik, pertama-tama kita menghitung rata-ratanya, dan kemudian secara acak mendistribusikan nilai-nilai yang tidak peka di sekitar rata-ratanya, sehingga jumlah datanya tetap konstan.

Offset dan Pembulatan: Metode ini mengubah data digital dengan pergeseran acak. Pembulatan offset memastikan perkiraan keaslian rentang dengan tetap menjaga keamanan data, yang lebih mendekati data sebenarnya dibandingkan skema sebelumnya, dan memiliki arti penting dalam skenario analisis data besar.

ML-NPB-5660-数据脱敏

Model yang Direkomendasikan "ML-NPB-5660" untuk Penyembunyian Data

4. Teknik Masking Data yang Umum Digunakan

(1). Teknik Statistik

Pengambilan sampel data dan agregasi data

- Pengambilan sampel data: Analisis dan evaluasi kumpulan data asli dengan memilih subkumpulan data yang representatif merupakan metode penting untuk meningkatkan efektivitas teknik de-identifikasi.

- Agregasi data: Sebagai kumpulan teknik statistik (seperti penjumlahan, penghitungan, rata-rata, maksimum dan minimum) yang diterapkan pada atribut dalam mikrodata, hasilnya mewakili semua catatan dalam kumpulan data asli.

(2). Kriptografi

Kriptografi adalah metode umum untuk menurunkan kepekaan atau meningkatkan efektivitas desensitisasi. Berbagai jenis algoritma enkripsi dapat mencapai efek desensitisasi yang berbeda.

- Enkripsi deterministik: Enkripsi simetris non-acak. Biasanya memproses data ID dan dapat mendekripsi serta mengembalikan ciphertext ke ID asli bila diperlukan, namun kuncinya perlu dilindungi dengan benar.

- Enkripsi yang tidak dapat diubah: Fungsi hash digunakan untuk memproses data, yang biasanya digunakan untuk data ID. Itu tidak dapat didekripsi secara langsung dan hubungan pemetaan harus disimpan. Selain itu, karena fitur fungsi hash, tabrakan data mungkin terjadi.

- Enkripsi homomorfik: Algoritma homomorfik ciphertext digunakan. Ciri khasnya adalah hasil operasi ciphertext sama dengan hasil operasi plaintext setelah dekripsi. Oleh karena itu, biasanya digunakan untuk memproses bidang numerik, namun tidak banyak digunakan karena alasan kinerja.

(3). Teknologi Sistem

Teknologi penindasan menghapus atau melindungi item data yang tidak memenuhi perlindungan privasi, namun tidak mempublikasikannya.

- Masking: mengacu pada metode desensitisasi yang paling umum untuk menutupi nilai atribut, seperti nomor lawan, KTP ditandai dengan tanda bintang, atau alamat terpotong.

- Penindasan lokal: mengacu pada proses penghapusan nilai atribut tertentu (kolom), penghapusan bidang data yang tidak penting;

- Penindasan catatan: mengacu pada proses menghapus catatan tertentu (baris), menghapus catatan data yang tidak penting.

(4). Teknologi Nama samaran

Pseudomanning adalah teknik de-identifikasi yang menggunakan nama samaran untuk menggantikan pengenal langsung (atau pengenal sensitif lainnya). Teknik nama samaran membuat pengidentifikasi unik untuk setiap subjek informasi, bukan pengidentifikasi langsung atau sensitif.

- Dapat menghasilkan nilai acak secara independen agar sesuai dengan ID asli, menyimpan tabel pemetaan, dan mengontrol akses ke tabel pemetaan secara ketat.

- Anda juga dapat menggunakan enkripsi untuk menghasilkan nama samaran, namun perlu menyimpan kunci dekripsi dengan benar;

Teknologi ini banyak digunakan dalam kasus pengguna data independen dalam jumlah besar, seperti OpenID dalam skenario platform terbuka, di mana pengembang berbeda memperoleh Openid berbeda untuk pengguna yang sama.

(5). Teknik Generalisasi

Teknik generalisasi mengacu pada teknik de-identifikasi yang mengurangi rincian atribut yang dipilih dalam kumpulan data dan memberikan deskripsi data yang lebih umum dan abstrak. Teknologi generalisasi mudah diterapkan dan dapat melindungi keaslian data tingkat rekaman. Ini biasanya digunakan dalam produk data atau laporan data.

- Pembulatan: melibatkan pemilihan dasar pembulatan untuk atribut yang dipilih, seperti forensik ke atas atau ke bawah, menghasilkan hasil 100, 500, 1K, dan 10K

- Teknik pengkodean atas dan bawah: Ganti nilai di atas (atau di bawah) ambang batas dengan ambang batas yang mewakili tingkat atas (atau bawah), sehingga menghasilkan hasil "di atas X" atau "di bawah X"

(6). Teknik Pengacakan

Sebagai salah satu jenis teknik de-identifikasi, teknologi pengacakan mengacu pada modifikasi nilai suatu atribut melalui pengacakan, sehingga nilai setelah pengacakan berbeda dengan nilai sebenarnya aslinya. Proses ini mengurangi kemampuan penyerang untuk memperoleh nilai atribut dari nilai atribut lain dalam rekaman data yang sama, namun memengaruhi keaslian data yang dihasilkan, yang umum terjadi pada data uji produksi.


Waktu posting: 27 Sep-2022