Minggu, 19 Mei 2013


Learning From Data



Nama Kelompok:

Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut.
Dalam komputasi, sebuah gudang data atau gudang data perusahaan (DW, DWH, atau EDW) adalah database yang digunakan untuk pelaporan dan analisa data. Ini adalah repositori pusat data yang dibuat dengan mengintegrasikan data dari satu atau lebih sumber yang berbeda. Data warehouse menyimpan saat ini serta data historis dan digunakan untuk membuat laporan tren untuk pelaporan manajemen senior seperti perbandingan tahunan dan triwulanan.
Data yang disimpan di gudang-upload dari sistem operasional (seperti pemasaran, penjualan dll, yang ditunjukkan pada gambar di sebelah kanan). Data mungkin melalui menyimpan data operasional untuk operasi tambahan sebelum digunakan di DW untuk pelaporan.
Khas data warehouse berbasis ETL menggunakan pementasan, integrasi data, dan akses lapisan untuk rumah fungsi utamanya. Lapisan pementasan atau pementasan Toko database data mentah diekstrak dari setiap sistem data yang berbeda sumber. Lapisan integrasi mengintegrasikan set data yang berbeda dengan mengubah data dari lapisan pementasan sering menyimpan data ini ditransformasikan dalam menyimpan data operasional (BPO) database. Data terintegrasi kemudian pindah ke database lain belum, sering disebut database data warehouse, dimana data yang disusun dalam kelompok-kelompok hirarkis sering disebut dimensi dan menjadi fakta dan fakta agregat. Kombinasi fakta dan dimensi kadang-kadang disebut skema bintang. Lapisan akses membantu pengguna mengambil data. [1]
Sebuah gudang data dibangun dari sistem sumber data terpadu tidak memerlukan ETL, pementasan database, atau database operasional menyimpan data. Sistem sumber data yang terintegrasi dapat dianggap sebagai bagian dari lapisan operasional menyimpan data terdistribusi. Metode federasi data atau metode virtualisasi data dapat digunakan untuk mengakses sistem terdistribusi terpadu sumber data untuk mengkonsolidasikan dan data agregat langsung ke gudang tabel database data. Berbeda dengan gudang data berbasis ETL, sistem sumber data yang terintegrasi dan data warehouse semua terintegrasi karena tidak ada transformasi data dimensi atau referensi. Arsitektur ini terintegrasi data warehouse mendukung bor turun dari data agregat dari data warehouse untuk data transaksional dari sistem sumber data terpadu.
Data warehouse dapat dibagi lagi menjadi data mart. Data mart menyimpan subset data dari gudang.
Definisi dari data warehouse berfokus pada penyimpanan data. Sumber utama data dibersihkan, diubah, katalog dan dibuat tersedia untuk digunakan oleh para manajer dan profesional bisnis lainnya untuk penambangan data, pengolahan analisis online, riset pasar dan mendukung keputusan (Marakas & O'Brien 2009). Namun, sarana untuk mengambil dan menganalisis data, untuk mengekstrak, mengubah dan memuat data, dan untuk mengelola data kamus juga dianggap komponen penting dari suatu data warehouse sistem. Banyak referensi ke data pergudangan menggunakan konteks yang lebih luas. Jadi, definisi yang diperluas untuk data pergudangan meliputi alat intelijen bisnis, alat untuk mengekstrak, mengubah dan memuat data ke dalam repositori, dan alat untuk mengelola dan mengambil metadata.

Tidak ada komentar:

Posting Komentar