Tugas 2 Business Intelligence

  1. Perbedaan antara data warehouse dan data mart adalah sebagi berikut:
  • Data warehouse merupakan gabungan dari beberapa data mart dan levelnya berada pada perusahaan atau organisasi.
  • Data mart merupakan bagian dari datawarehouse dan berada level departemen  pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses,  misalkan penjualan, maka hanya proses penjualan saja yang ditangani pada data mart.

Data warehouse sendiri adalah database yang berisi data dari beberapa system operasional yang terintegrasi dan terstruktur sehingga dapat digunakan untuk mendukung analisa dan proses pengambilan keputusan dalam bisnis. Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).

Kemudian yang dimaksud data mart adalah lapisan akses dari data  warehouse lingkungan yang digunakan untuk mendapatkan data keluar bagi pengguna. Data mart adalah subset dari data warehouse yang biasanya berorientasi pada lini bisnis tertentu atau tim. Dalam beberapa penyebaran, masing-masing departemen atau unit bisnis dianggap sebagai pemilik data mart yang termasuk semua perangkat lunak, perangkat keras dan data.

Untuk lebih jelasnya perbedaan data warehouse dan data mart adalah sebagai berikut:

 

2. Apa kaitannya antara Data Mining dengan Sistem Informasi BI ?

Business intelligence, biasa disebut BI adalah teknologi yang menggunakan komputer yang berguna untuk mencari, menggali, dan menganalisis informasi dari data bisnis misalnya hasil penjualan suatu produk atau pendapatan/pengeluaran salah satu anak perusahaan.

Hasil keluaran dari teknologi BI dapat berupa tampilan lampau dari operasi bisnis, juga tampilan operasi bisnis saat ini, atau juga prediksi untuk operasi bisnis di masa depan. Fungsi umum yang biasa terdapat pada BI adalah reporting, online analytical processing, analytics, data mining, business performance management, benchmarking, text mining, dan predictive analytics.

BI menggunakan Data Warehouse untuk mengelola data-datanya dalam jumlah besar dan kemudian data tersebut dapat dimining. Namun tidak semua BI menggunakan Data Warehouse dalam mengelola data-datanya. Artinya tidak semua BI membutuhkan Data Warehouse dalam mengelola data-datanya.

BI bertujuan untuk memudahkan dan mendukung pembuatan keputusan pada operasi bisnis. Sistem BI tersebut dapat disebut juga Decision Support System (DSS). DSS memberikan bantuan manajemen dan perencanaan dari sebuah organisasi dan bisa membantu dalam membuat keputusan yang tidak dapat dibuat secara mudah oleh manusia. Misalnya keputusan yang sulit dispesifikasikan karena hal yang berkaitan dapat berubah secara acak.

Data Mining 

Teknologi yang digunakan untuk pengumpulan data berkembang dengan pesat. Perkembangan teknologi meningkatkan jumlah cara atau pintu masuknya data. Contoh ‘pintu’ tersebut adalah PC/laptop woth keyboard + mouse, barcode /QR code scanner, satellite, GPS, POS, dll. Banyaknya jumlah ‘pintu’ ini meningkatkan jumlah data yang dapat dikumpulkan.  Suatu organisasi sering dikatakan mengalami ‘data explosion’ atau ledakan data, karena data-nya yang sangat banyak, tapi knowledge yang dapat diperoleh secara langsung hanya sedikit. Sebenarnya mungkin ada lagi knowledge yang dapat ditarik dari data tersebut, namun untuk memperolehnya, data tersebut harus diolah lebih lanjut. Data mining ini-lah salah satu pengolahan untuk mendapatkan knowledge yang tersembunyi tersebut.

Definisi Data Mining
• JH: data mining digunakan untuk meng-extract interesting knowledge, mencari pattern, rules dan constraints yang tersembunyi
• DO: data mining digunakan unuk menganalisa data dalam jumlah besar

Namun, knowledge yang diambil dengan data mining, sebaiknya perlu dilihat lagi dengan seksama, karena
• asosiasi/hubungan yang terlihat dari beberapa kelompok data tidak semuanya adalah causality (sebab-akibat) atau trend
• mungkin ada kelainan data yang disebabkan oleh manusia dengan sengaja
• pola yang diperoleh berdasarkan data dari masa lalu (history), sehingga jangan langsung dipakai untuk mencari trend
Untuk mengimplementasikan data mining, ada beberapa hal yang harus dimiliki, yaitu
• centralized data, data tersimpan di database terpusat. Hal ini memudahkan pengolahan, karena sekali mengakses database server, dapat mengakses semua data yang perlu diolah
• business analytics tool, interface yang akan diakses untuk menganalisa proses bisnis yang berjalan. komponen ini juga sering disebut dengan dashboard atau business intelligence
• mining non-obvious information, pada data yang ada, terdapat informasi tersembunyi yang ingin dicari
• business process management (BPM). jika business intelligence biasanya diakses oleh pihak manajemen, BPM digunakan untuk melihat KPI (key process indicator, target yang harus dicapai) divisi atau pegawai.
knowledge yang berhasil diperoleh dengan data mining, dimanfaatkan lebih lanjut sebagai input dalam pembuatan keputusan (decision making) yang dibutuhkan dalam menentukan arah operasi organisasi. Untuk menghasilkan keputusan yang tepat, diperlukan knowledge yang tepat yang dapat diperoleh dengan cepat, pada waktu yang tepat, dan sesuai dengan konteks (right information at right time, right place, right person).

Penggunaan
Data mining biasanya digunakan untuk
• customer segmentation, misalnya konsumen usia 20-30 lebih menyukai kopi instan dari pada kopi hitam
• kemungkinan pembelian, misalnya konsumen yang membeli roti biasanya juga membeli selai
• customer profitability, misalnya
• mendeteksi penipuan/fraud
• customer attrition
• channel optimization
• asosiasi
• klasifikasi dan prediksi
• cluster analysis
• exception data analysis/outlier
• time series analysis/trend
dengan diberlakukannya SOX (sarbannes oxley) data mining juga dapat digunakan untuk mengontrol keanehan pada data, sehingga anomali dapat dengan mudah dan cepat dideteksi