KUALITAS
DATA SANGAT PENTING?
1. Meningkatkan
percayaan diri dalam pengambilan keputusan
2.Memperbaiki
pelayanan kpd Customer
3.Meningkatkan
kesempatan memperbaiki kinerja,
4.Mengurangi
resiko dari keputusan yang berbahaya,
5.Mengurangi
biaya, terutama untuk pemasaran,
6.Mengembangkan
strategi untuk pembuatan keputusan,
7.Meningkatkan
produktivitas dengan memangkas beberapa proses
8.Menghindari
efek komplikasi dari data yang terkontaminasi
Akurasi
Vs Kualitas :
AKURASI
|
KUALITAS
|
1. Sesuai
entitasnya
2. Elemen
data Didefinisikan menggunakan Database Teknologi
3. Elemen
data menyesuaikan dgn
batasan tervalidasi
4. Masing2
data memiliki tipe data yg sesuai Operasional
Database
|
1. Sesuai Kegunaan
n 2. Sesuai dengan representasi Bisnis
3. Terhubung tidak hanya dalam satu data
tapi keseluruhan sistem
4. Form dan data konsisten terhadap keseluruhan
sistem Datawarehouse
|
Indikator
Data Berkualitas
1. ACCURACY = data yang tersimpan nilainya benar
(name cocok dengan alamatnya)
2. DOMAIN INTEGRITY = nilai attributnya sesuai batasan yang
diperkenankan (nilai attribut laki n perempuan)
3.DATA TYPE = Nilai data disimpan dalam tipe data
yang sesuai (data nama disimpan dengan tipe text
4.CONSISTENCY = nilai sebuah field data akan sama
semua dalam berbagai berkas (field produk A
dgn kode 123, akan selalu sama
kodenya di setiap berkas lain)
5.REDUDANCY = tidak boleh ada data yang sama
disimpan di tempat yang berbeda dalam satu sistem
6.COMPLETENESS = Tidak ada nilai atttribut salah yang
diberikan dalam sistem
7.DUPLICATION = tidak ada baris record yang sama dalam
satu sistem
8.CONFORMANCE TO BUSINESS RULES = sesuai dengan aturan bisnis yang
berlaku (di bank è
loan balance = + or 0)
9.STRUCTURAL DEFINITENESS = dapat didefinisikan strukturnya (nama
= firstname + middlename +
lastname
10.DATA
ANOMALY = sebuah field hanya digunakan sesuai
kegunaannya. (field address3 è
digunakan untuk mencatat baris ketiga
dalam alamat bukan untuk telp atau fax)
11. CLARITY = Kejelasan arti kegunaan dan cara
penulisan sebuah data (penamaan khusus)
12.TIMELY = merepresentasikan waktu dari data yang
dimasukkan (jika data digunakan perhari maka
data pada warehaouse harus juga
dibuat per hari)
Macam
permasalahan dalam menjaga kualitas data (1)
1. Dummy values in fields è (kode pos di isi 77777)
2.Absence of data values è (alamat tidak terbagi menjadi
region)
3.Unofficial use of fields è (isi komentar pada customer
contact filed)
4, Cryptic values. è (penyingkatan nilai yang berubah
L P jadi P W)
Referensi :
https://achmadyasid.files.wordpress.com/
Tidak ada komentar:
Posting Komentar