Data Lakehouse adalah arsitektur data terpadu yang menggabungkan fleksibilitas penyimpanan data raw dari Data Lake dengan kemampuan analitik terstruktur Data Warehouse. Dengan pendekatan ini, organisasi dapat menyimpan:
- Data terstruktur
- Semi-terstruktur
- Tidak terstruktur (seperti gambar, audio, atau log IoT)
dalam satu repositori, sekaligus mendukung transaksi Atomicity, Consistency, Isolation (ACID), untuk menjamin konsistensi data.
Manfaat Utama Data Lakehouse
Menggantikan kebutuhan dua sistem terpisah (Data Lake + Warehouse) dengan penyimpanan objek cloud berbiaya rendah seperti AWS S3 atau Google Cloud Storage. Biaya duplikasi data dan ETL pun berkurang signifikan.
Memiliki kualitas data dan governansi lebih baik karena lapisan metadata terpusat memungkinkan penerapan skema, audit trail, dan kontrol akses granular. Hasilnya, data lebih konsisten dan memenuhi standar kepatuhan seperti General Data Protection Regulation (GDPR).
Apa yang dimaksud dengan GDPR?
Tujuan Utama GDPR
- Memastikan bahwa data pribadi individu diproses dengan aman dan transparan.
- Memberikan hak kepada individu untuk mengetahui bagaimana data mereka digunakan.
- Memungkinkan individu untuk mengontrol data pribadi mereka, seperti meminta akses. menghapus data, atau membatasi penggunaannya.
- Menuntut organisasi yang mengumpulkan dan memproses data untuk mematuhi aturan ketat dalam pengelolaan data.
- Nama
- Alamat
- Nomor identifikasi
- Data lokasi
- Alamat IP
- Data kesehatan
- Informasi finansial
- Data biometrik