4.1 Dasar Pengaturan dan Akses Data
4.1.1 Hirarki Data
Sistem komputer mengorganisasikan data ke dalam suatu hirarki yang dimulai dengan bits dan kemudia bytes, fields, record, files, dan database. Bits merupakan unit terkecil dari data yang dapat diproses oleh komputer dan satu kumpulan bit yang terdiri dari 8 bits adalah bytes yang merepresentasikan karakter tunggal bisa berupa huruf, angka, atau simbol.
Fields merupakan penggabungan beberapa karakter secara logic menjadi sebuah kata, gabungan kata, atau rangkaian kata. Contohnya nama_siswa, tgl_daftar, alamat. Record adalah gabungan dari beberapa field secara logic, contohnya adalah: nama_siswa, mata kuliah yang diambil, dll. File merupakan gabungan dari beberapa record sejenis yang saling berhubungan. Database ialah gabungan dari beberapa file yang saling berhubungan. Sebuah record menggambarkan sebuah entity/entitas (orang, tempat, barang, atau pelanggan, pegawai, produk, dll). Setiap karakteristik atau kualitas menggambarkan keterangan dari entitas disebut atribut, contohnya nama_pelanggan, kode_karyawan, warna_produk.
Setiap record dalam sebuah file harus mempunyai paling tidak satu field yang unik yang dapat mengidentifikasi record tersebut, sehinga record tersebut mudah diambil (access), diperbaharui (update), dan diurutkan. Field ini yang biasa disebut Primary Key, contohnya nomor induk mahasiswa (NIM) sebagai Primary Key,karena tidak mungkin sama antara siswa satu dengan siswa lain (unik).
SecondaryKey adalah field lain yang mempunyai beberapa informasi identifikasi, tetapi tidak mengidentifikasi secara khusus. Contohnya last_name merupakan secondary key karena kemungkinan ada beberapa orang yang mempunyai last name yang sama.
4.1.2 Penyimpanan dan Pengaksesan Record
Record – record disimpan dengan berbagai cara di dalam media penyimpanan (secondary storage) dan penyusunannya menentukan cara bagaimana record tersebut bisa diakses. Dalam Sequential Access, data/record harus diambila/diakses sesuai dengan urutan fisik penyimpanan data tersebut. Untuk pengaksesan secara langsung (direct) atau random, user dapat mengambil/mengakses data/record diberbagai urutan tanpa perlu mengetahui urutan fisik data pada media penyimpanan.
Index sequential acces method (ISAM)
Metode pencarian ini dengan menggunakan sebuah index dari key field untuk mencari sebuah record. Indeks terhadap suatu file merupakan daftar key field dari setiap record dan posisi di mana record tersebut di simpan pada media penyimpanan. Record di simpan pada disk berdasarkan urutan key. Track index menunjukkan nilai tertinggi dari key field yang dapat ditemukan pada track tertentu. Untuk menemukan record tertentu, track index dicari utnuk menemukan cylinder dan track yang mengandung data, selanjutnya secara berurutan track dibaca untuk mendapatkan record.
Direct File Access Method
Metode ini menggunakan key field untuk menemukan alamat fisik dari sebuah record. Proses menggunakan rumus matematik (transform algorithm) untuk merubah key field menjadi lokasi penyimpanan dari record.
4.2 File
Dari jaman aplikasi komputer pertama dalam bisnis (pertengahan tahun 50) sampai tahun 1970, organisasi mengatur datanya dengan pendekatan tradisional yaitu dalam bentuk file. Cara ini telah berjalan sebab organisasi secara khusus telah memulai sebuah aplikasi otomatis pada suatu waktu. Sistem ini berkembang sendiri tanpa perencanaan secara menyeluruh. Setiap aplikasi mempunyai data sendiri, yang mana dikelola dalam sebuah file data. Sebuah file data adalah koleksi dari record yang berhubungan secara logic.
4.2.1 Permasalah dengan Pendekatan file
Permasalahan yang timbul antara lain :
- Data redundancy (Duplikasi)
Karena aplikasi dan file datanya telah dibuat oleh programmer yang berbeda dalam jangka waktu yang lama, maka sejumlah informasi yang sama terduplikasi di beberapa tempat.
- Data inconsistency (Data tidak Konsisten)
Data inconsistency berarti suatu jenis data memiliki berbagai macam salinan
yang berbeda – beda (untuk data yang sama, salinannya tidak sama,
sehingga data tidak konsisten).
- Data Isolasion (Pemisahan)
Dengan aplikasi yang dirancang dan diimplementasikan secara unik, data file dikelola secara terpisah mengakibatkan penyimpanan data dengan format yang berbeda, seperti ukuran tinggi dalam centimeter atau Inchi, dan biasanya tidak dapat diakses oleh aplikasi lain.
- Data Integrity (Integritas Data)
Nilai data harus dipertahankan kesesuaiannya. Misalnya nilai siswa tidak boleh negative.
- Data Independence (Aplikasi/data berdiri sendiri)
Dalam pendekatan tradisional yaitu pendekatan file, aplikasi dan file data
yang berhubungan independence satu sama lain.
4.3 Pendekatan Modern : Basis Data (Database)
Database merupakan gabungan dari beberapa file yang saling berhubungan dan dapat mengeliminasi permasalahan yang timbul dari pendekatan tradisional yaitu file. Dengan pendekatan modern semua data diletakkan di tempat penyimpanan yang sama. Tidak seperti pendekatan tradisional di mana program yang berbeda – beda mengakses file data yang berbeda – beda. Basis data diatur sedemikian rupa sehingga satu atau sekelompok program menyediakan akses terhadap semua data.
Sehingga permasalahan duplikasi data (redundancy), data yang terisolasi (isolation), dan data yang tidak konsisten (inconsistency) dapat dikurangi, dan data dapat dibagi – bagikan di antara semua pengguna (users). Di samping itu, keamanan dan integritas data meningkat, dan aplikasi serta data tidak bergantung satu dengan yang lainnya.
4.3.1 Penempatan Data dalam Basis Data
Basis Data adalah gabungan/kumpulan dari beberapa file yang berhubungan dan di mana file – file yang berhubungan tersebut ditempatkan dapat mempengaruhi user dalam mengakses data, waktu dibutuhkan untuk query, entry data, keamanan, dan biaya.
Database Terpusat (Centralized Database)
Database terpusat (Centralized Database) memiliki semua file yang saling berhubungan dalam suatu lokasi penyimpanan. File – file database ditempatkan di komputer mainframe (komputer pusat). Dengan ini tidak hanya memperkecil biaya dalam hubungannya dengan beberapa computer tapi juga memberikan database admin (DBA) dengan kemampuannya untuk bekerja pada database dalam satu lokasi saja.
Semua file tidak bisa diakses kecuali dari komputer pusat, di mana file tersebut lebih mudah diproteksi dari akses – akses atau modifikasi yang tidak berhak, juga penyelamatan dari bencana (disasters recovery) akan lebih mudah dilakukan karena data hanya berada pada satu lokasi pusat penyimpanan.
Bagaimanapun juga data terpusat mempunyai satu titik kelemahan, yakni ketika komputer pusat tidak berfungsi maka yang lain tidak bisa beroperasi. Dan kadangkala kecepatan akses bermasalah, jika user tersebar di berbagai tempat yang jauh dan harus mengerjakan manipulasi semua data, maka akan terjadi kelambatan atau akses menjadi sangat lambat.
Data Terdistribusi (Distributed Database)
Penggandaan semua database atau sebagian database ke lebih dari satu tempat/lokasi, yang biasanya lebih dekat dengan user. Ada 2 tipe data terdistribusi :
Penggandaan (copy) semua database ke beberapa lokasi, dengan
tujuan utama untuk mengatasi permasalahan apabila terjadi
kegagalan pada database pusat, selain itu juga meningkatkan respon
terhadap akses oleh user.
Penggandaan (copy) sebagian database ke suatu tempat/lokasi lain, biasanya bagian yang digandakan adalah bagian database yang sangat dibutuhkan oleh user pada lokasi tersebut. Pengaksesan akan lebih cepat karena database berada dekat dengan user.
4.3.2 Pembuatan Basis Data (Creating Database)
Untuk membuat sebuah database, perancang database harus membuat rancangan konsep (conceptual design) dan rancangan fisik (physical design). Rancangan konsep adalah model abstrak database dari user atau dari segi pandang bisnis. Rancangan fisik menunjukkan bagaimana sebuah database sebenarnya diatur/disusun pada tempat penyimpanan.
Rancangan konsep menggambarkan bagaimana elemen data dalam database dikelompokkan. Proses perancangan mengidentifikasi hubungan antara elemen data dan cara paling efisien untuk mengelompokkan elemen data dalam memenuhi kebutuhan informasi. Proses perancangan juga mengidentifikasi duplikasi dan pengelompokan pada elemen data membutuhkan aplikasi tertentu. Untuk mendapatkan rancangan database yang optimal perancang database harus menggunakan ER-Diagram dan Normalisasi.
Entity Relationship (ER) Modeling
ER Diagram sebagai dokumen dari konsep model data yang berisi entity/entitas, atribut, dan relasi, yang semuanya digambarkan dalam diagram.
o Entitas adalah sesuatu yang dapat diidentifikasi pada lingkunga kerja pengguna (user). Contoh : pendaftaran mata kuliah oleh mahasiswa. Pada contoh ini entitasnya adalah mahasiswa, mata kuliah. Entity Classes merupakan gabungan/kelompok dari beberapa entity/entitas.
o Instance menggambarkan keterangan dari entity. Sebagai contoh mahasiswa tertentu (Johns Mill, 0800759633) adalah instance dari mahasiswa.
o Identifier merupakan atribut yang mengidentifikasi instance dari
entity. Contohnya untuk instance mahasiswa dapat diidentifikasi dengan nomor id mahasiswa.
o Relationship adalah yang menggambarkan hubungan satu entity dengan entity lain. Hubungan tersebut bisa hubungan one to one, one to many, dan many to many.
�� 1 : 1 (one to one)
Satu instance dari suatu entity berhubungan dengan satu instance dari satu entity lain.
�� 1 : M (one to many)
Satu instance dari satu entity berhubungan dengan banyak instance dari suatu entity lain. Contohnya adalah hubungan antara entitas dosen dan mata kuliah. Hubungan ini menggambarkan bahwa satu dosen dapat mengajar lebih dari satu mata kuliah.
�� M : M (many to many)
Banyak instance dari suatu entity berhubungan dengan banyak instance dari suatu entity lain. Contohnya adalah hubungan antara entitas mahasiswa dan mata kuliah. Hubungan ini menggambarkan bahwa satu mahasiswa dapat mengambil lebih dari satu mata kuliah dan satu mata kuliah dapat diambil oleh lebih dari satu mahasiswa.
Normalization
Pada relational database perlu dilakukan analisa agar tidak terjadi pengulangan atau redundancy. Normalisasi adalah cara untuk menganalisa dan mengurangi suatu relasi database menjadi lebih singkat dengan tujuan meminimalkan duplikasi data, memaksimalkan integritas data, dan kinerja proses yang baik.
4.4. Sistem Manajemen Database (Database Mangement System / DBMS)
Merupakan suatu software (program) atau sekelompok program yang dapat memberikan akses ke database. DBMS memperbolehkan organisasi untuk menyimpan data di dalam satu tempat penyimpanan, dari itu data dapat diupdate dan diambil, dan juga memberikan akses ke data yang disimpan oleh berbagai macam program aplikasi.
DBMS juga memberikan mekanisme untuk pengelolaan integritas informasi yang disimpan, mengatur keamanan dan akses dari user, perbaikan informasi ketika sistem rusak, dan pengaksesan berbagai macam fungsi databsae di dalam aplikasi yang ditulis dengan bahasa generasi ke 3, 4, atau berorientasi objek.
4.4.1 Logikal vs Fiskal
Phisycal view berhubungan dengan pengaturan aktual atau sebenarnya, pengaturan fisik, dan lokasi data di tempat penyimpanan (direct acces storage). Spesialis database menggunakan phisycal view untuk membuat efisiensi penggunaan tempat penyimpanan dan pemrosesan sumberdaya. Logical view menyajikan data dalam bentuk yang sangat berarti/berguna kepada pengguna dan program software yang memproses data tersebut.
4.4.2 Komponen DBMS
Ada empat komponen utama di dalam sistem manajemen database yakni Data Model, DDL, DML, dan Data Dictionary.
Model Data (Data Model)
Menerangkan bagaimana cara data disusun secara konsep.
Data Definition Language (DDL)
Menerangkan tipe informasi yang ada di dalam database dan bagaimana informasi – informasi tersebut disusun. DDL menerangkan tiap elemen data sebagaimana adanya dalam database sebelum elemen data tersebut diubah menjadi bentuk yang dibutuhkan oleh aplikasi. DDL merupakan jalur di antara logical dan physical view. DDL digunakan untuk mendefinisikan karakter fisik setiap record, field di dalam suatu record, dan setiap nama logical dari field, tipe data dan panjang karakter, dan juga digunakan untuk rmenspesifikasikan relasi/hubungan di antara semua record.
Fungsi lain dari DDL antara lain :
o Menyediakan cara untuk menghubungkan data.
o Menentukan identifier yang unik dari record.
o Membuat keamanan terhadap akses data dan mengubah batasan (restrictions).
Data Manipulation Language (DML)
Digunakan dengan bahasa generasi ke 3,4 atau berorientasi objek untuk melakukan query terhadap isi dari database, penyimpan atau update informasi di dalam database dan membangun aplikasi database.
DML memungkinkan user untuk mengambil, mengurutkan, menampilkan dan menghapus isi dari database. SQL merupakan bahasa database relasi yang paling populer, yang mengkombinasikan kemampuan DDL dan DML.
Contoh:
SELECT (student_name) from (student_database)
where student_id = ‘0800759633’
Menampilkan nama mahasiswa dari tabel database mahasiswa yang memilik student_id = 0800759633.
Data Dictionary (Kamus Data)
Kamus data menyimpan definisi dari elemen data (field) dan karakteristik data seperti individuals, fungsi bisnis, program, dan laporan. Kamus data memiliki keuntungan yaitu dapat mengurangi ketidakkonsistenan dalam data karena kamus data menyediakan definisi standar untuk semua elemen data. Sistem manajemen database memiliki keuntungan terhadap organisasi sebagai
berikut :
- Meningkatkan kegunaan strategis dari data perusahaan.
- Mengurangi kompleksitas dari lingkungan sistem informasi perusahaan.
- Mengurangi duplikasi data dan data yang tidak konsisten.
- Meningkatkan integritas data.
- Meningkatkan keamanan.
- Mengurangi biaya pembangunan dan pengelolaan aplikasi.
- Meningkatkan fleksibilitas dari sistem informasi.
- Meningkatkan akses dan ketersediaan data dan informasi.
4.5 Logical Data Model
Kemampuan seorang manager untuk menggunakan data adalah sangat bergantung
pada bagaimana database terstruktur secara logical maupun fisik. DBMS memisahkan tampilan logic dan fisik dari data, ini berarti bahwa programmer dan user tidak tahu di mana dan bagaimana data sebenarnya disimpan.
Dalam penyusunan database secara logic, kebutuhan bisnis menentukan karakteristik dari data dan bagaimana data akan diakses. Ada tiga bentuk data model yang biasa digunakan, yakni hierarchical, network, dan relational. Dan tipe lain dari model data termasuk multidimensional, object oriented, object-relation, dan hypermedia.
Menggunakan model ini, perancang database dapat membangun tampilan logic atau konseptual dari data yang selanjutnya dapat diimplementasikan secara fisik ke dalam database virtual dengan DBMS apa saja.
4.5.1 Model Basis Data Hirarki (Hierarchical Database Model)
Membuat struktur data ke dalam bentuk pohon terbalik (inverse trees) yang setiap record mempunyai 2 elemen. Yang pertama merupakan root atau field master atau sering disebut juga key, yang mengidentifikasikan tipe lokasi atau susunan record. Kedua adalah berupa variable dari subordinate field, yang menerangkan akhir dari data dalam record. Aturannya adalah semua field hanya mempunya satu “parent”, setiap parent mempunyai banyak “Children”. Keuntungan dari Hierarchical Database Model adalah kecepatan dan efisiensi dalam pengaksesan data. Sementara kerugian dari Hierarchical Database Model adalah dalam hal pengaksesan data. Ketika mengakses data, data harus didefinisikan dahulu oleh database admin sebelum program ditulis, dan setiap relasi harus benar – benar didefinisikan ketika database dibuat.
4.5.2 Model Basis Data Jaringan (Network Database Model)
Membuat relasi/hubungan antar data melalui suatu struktur linked-list di mana subordinate record dapat dihubungkan ke lebih dari satu elemen data. Mirip dengan Hierarchical Model, tetapi pada model ini menggunakan link yang eksplisit untuk menghubungkan member dan owner yang disebut pointer. Model database ini sangat komplek/rumit, yakni setiap ada perubahan hubungan antar elemen data, sepasang pointer harus diperbaiki.
4.5.3 Model Basis Data Relasi (Relational Database Model)
Relational database model berdasar pada konsep sederhana dari tabel untuk melakukan perubahan pada karakteristik baris dan kolom data. Di dalam model ini, tabel – tabel disebut relations, baris disebut tuple, dan kolom disebut attribute.
Ada beberapa prinsip dasar dalam membuat database model ini, pertama urutan tuple atau attribute di dalam table adalah tidak berhubungan (irrelevant), kedua setiap tuple harus dapat diidentifikasi secara unik oleh data di dalam tuple (disebut primary key), ketiga setiap table harus memiliki identifier yang unik-nama dari relasi, keempat tidak ada duplikasi atribut atau tuple, dan yang terakhir hanya ada satu nilai dalam setiap baris-kolom ”cell” pada tabel.
Di dalam relasional database, ada tiga operasi dasar yang digunakan untuk membangun sejumlah data yang berguna, select, join, dan project. Operasi select membuat subset berisi semua record dalam file data yang sesuai dengan kriteria yang ditentukan. Operasi join menggabungkan tabel relasi relasi untuk menyediakan informasi yang lebih dari pada yang tersedia pada tabel individu kepada user. Operasi Project membuat subset berisi kolom dalam table, memperbolehkan user untuk membuat tabel baru yang berisi informasi yang dibutuhkan.
4.5.4 Kemunculan Data Model
Ada tiga model data, yaitu multidimensional, object oriented dan hypermedia.
4.5.4.1 Database Object Oriented Model
Model yang sekarang sedang banyak dikembangkan adalah model yang berdasarkan objek, yakni sejumlah data diletakkan secara bersama – sama dengan semua data yang dibutuhkan dengan tujuan untuk melakukan pengoperasian dengan data tersebut. Pengertian database object oriented model mirip dengan bahasa pemograman object oriented yang terdiri dari object, attribute, classes, method, dan messages. Object, mirip dengan entitas yang menggambarkan orang, tempat, atau benda, tetapi objek juga berisi semua data yang dibutuhkan oleh objek dengan tujuan untuk melakukan pengoperasian. Contohnya : karyawan, barang. Attribut, adalah karakteristik yang menerangkan keadaan objek tersebut. Contohnya: umur karyawan. Method, sebuah operasi, aksi, atau tindakan yang dialami objek. Contohnhya : barang yang terjual. Messages, dari objek lain mengaktifkan operasi yang terkandung dalam objek tersebut. Ketika operasi diaktifkan, pesan akan dikirim kepada objek ketiga yang mungkin mengaktifkan method dalam objek tersebut dan lain – lain. Class, menerangkan semua messages untuk objek yang mana yang akan merespon, sebagaimana di mana objek – objek dari kelas ini diimplementasikan. Class biasanya diatur seperti struktur pohon. Contohnya sebuah objek truk” adalah sebuah subclass dari ”Kendaraan bermotor”, sebuah ”truk” adalah ”Kendaraan bermotor”.
4.5.4.2 Object Relation Database Model
Menambah kapasitas penyimpan objek yang baru ke sistem manajemen database relation. Sistem yang berdasar pada model ini adalah penggabungan data field tradisional
manajemen, objek yang kompleks/rumit seperti rangkaian waktu, data geospital (map, photo, satellite) dan macam – macam media biner seperti audio, video, images, applet, dan text terformat atau tidak.
4.5.4.3 Hypermedia Database Model
Menyimpan sejumlah informasi dalam bentuk nodes yang terhubung oleh link yang dibuat oleh user. Nodes bisa berisi text, graphic, motion video, atau exe.file. Relasi di antara nodes tidak begitu terstruktur dibanding sistem manajemen database yang tradisional. Pada kebanyakan sistem, setiap nodes dapat ditampilkan pada layar. Layar juga berperan sebagai penghubung antara node dengan node yang lain dalam database.
4.5.5 Model Lain Basis Data (Other Database Model)
Geographical Information Database berisi data lokasi untuk digambarkan sebagai peta atau images. Dengan mengunakan tipe data ini, user dapat melihat lokasi pelanggan dan vendor tanpa harus membaca alamat yang sebenarnya. Knowledge Database dapat menyimpan aturan keputusan digunakan untuk mengevaluasi situasi dan menolong user membuat keputusan seperti layaknya seorang ahli. Multimedia Database dapat menyimpan dalam bentuk media atau apa saja, seperti suara, video, images, grafik, animasi, dan teks.
4.5.6 Small-Footprint Database
Small-Footprint Database memungkinkan organisasi untuk menempatkan data tipe tertentu pada lokasi di mana pekerja berada. Database ini menawarkan informasi yang lebih banyak dalam bentuk yang dapat diakses.
4.6 Gudang Data (Data Warehouse)
Pada saat ini organisasi fokus untuk meningkatkan atau mengganti system pemrosesan tranaksi online dan memberikan perhatiankhusus untuk membuat informasi tersedia terhadap user melalui manajemen akses dan pengaturan efisien. Fokus teknologi telah berubah dari pengambilan input data melalui system operasional perusahaan menjadi pengaksesan informasi yang disediakan oleh gudang data perusahaan.
Data Warehouse adalah sistem manajemen database relational atau multidimensional yang dirancang untuk mendukung manajemen pengambilan keputusan. Data Warehouse mengandung data terbaru dengan rinci, data yang lama (Historical Data) dengan rinci, rangkuman data, dan metadata. Metadata adalah data mengenai data. Metadata penting untuk perancangan, pembuatan, pengambilan, dan pengontrolan data dari gudang data. Pengguna data warehouse perlu mengetahui data apa saja yang tersedia, apa sumber data, di mana data berada, dan bagaimana mengakses data. Metadata secara teknis termasuk dari mana data berasal, bagaimana gudang data diubah, bagaimana data diatur, bagaimana data disimpan, siapa memiliki data, siapa bertanggungjawab terhadap data, siapa yang dapat mengakses data, dan tanggal update terbaru. Bisnis metadata termasuk data apa yang tersedia, di mana data berada, apa maksud data, pengertian data, bagaimana mengakses data, dan lain – lain.
Datawarehouse memberikan keuntungan bisnis diantaranya sebagai berikut :
- Meyediakan pengguna bisnis dengan pandangan “customer centric” dari data perusahaan yang beraneka ragam dengan membantu mengintegrasikan data dari penjualan, layanan (servcie), manufacturing, distribusi, dan sistem bisnis lain yang berhubungan dengan customer.
- Memberikan nilai tambah kepada pelanggan (customer perusahaan) dengan memungkinkan mereka mengakses informasi ketika gudang data digabungkan dengan teknologi internet.
- Menggabungkan data mengenai masing – masing pelanggan dan menyediakan tempat penyimpanan terhadap semua pelanggan untuk segmentation modeling, perencanaan pemeliharaan pelanggan, dan analisa penjualan.
- Menghilangkan batasan antara area fungsional dengan menawarkan suatu cara untuk penyesuaian tampilan dari beberapa sumber, dengan demikian memberikan pandangan pada aktivitas.
- Memberikan laporan pada unit operasi multidivisi, multinasional, termasuk trend atau hubungan di dalam semua area seperti merchandising, perencanaan produksi, dan seterusnya.
4.6.1 Multidimensional Database Model
Database multidimensi sering disebut pusat dari data warehouse, data yang hubungannya sangat kuat dan dapat dilihat dan dianalisa dari sudut pandang yang berbeda yang disebut dimensi dan juga menyediakan tempat penyimpanan yang efisien, efektif, dan nyaman serta pengambilan data yang besar. Data seperti dalam database dianalisa oleh Online Analytical Processing (OLAP). Dalam model data ini, data disimpan dalam bentuk array.
Berikut ini beberapa keuntungan yang diberikan oleh multidimensional database :
- Data dalam basis data multidimensi dapat disajikan dengan mudah.
- Basis data multidimensi lebih mudah dipelihara.
- Basis data multidimensi lebih cepat dari pada relational database dengan adanya tambahan dimensi dan antisipasi terhadap bagaimana data akan diakses oleh pengguna.
4.6.2 Data Mart
Data Mart merupakan versi scaled-down dari data warehouse yang memfokuskan pada area subjek tertentu. Data Mart biasa dirancang untuk mendukung kebutuhan bisnis yang unik dari departemen atau proses bisnis tertentu. Suatu perusahaan dapat memiliki banyak data mart di mana setiap data mart fokus pada sebagian dari keseluruhan bagian perusahaan. Butuh sedikit waktu untuk membangun data mart, biaya ringan, dan tidak begitu rumit. Permulaan yang tidak teliti dari beberapa data mart dengan yang tidak ada hubungannya satu sama lain untuk data warehouse perusahaan akan menyebabkan permasalahan.
4.6.3 Data Mining
Data Mining memberikan pengertian atau arti yang sebelumnya tidak diketahui, prediksi informasi dari data – data yang dapat diakses dari dalam data warehouse. Tools Data Mining menggunakan algoritma yang otomatis dan canggih untuk menemukan pola (pattern) yang tersembunyi, korelasi, dan hubungan antara data. Tools ini digunakan untuk memprediksi pola atau trend di masa yang akan datang, yang mengarahkan perusahaan dalam mengambil keputusan.
Data mining mempunyai 5 fungsi utama :
- Klasifikasi (Classification), menyimpulkan penjelasan karakteristik dari sebuah kelompok tertentu.
- Clusterin, mengidentifikasikan sekelompok item yang berbagi karakteristik tertentu.
- Association, mengidentifikasikan hubungan antara kejadian yang terjadi pada waktu yang sama.
- Sequencing, mirip dengan asosiasi, kecuali hubungan terjadi melampaui batas waktu yang telah ditentukan.
- Forecasting, memperkirakan nilai yang akan datang berdasarkan pola (pattern) yang terdapat di dalam sekelompok besar data.
4.6.4 Text Mining
Merupakan aplikasi dari data mining untuk file teks yang tidak terstruktur atau kurang terstruktur, lebih berfokus pada format dokumen daripada isi dokumen. Text Mining membantu organisasi untuk melakukan hal – hal berikut :
- Menemukan isi yang tersembunyi dari suatu dokumen, termasuk hubungan yang berguna.
- Menghubungkan dokumen – dokumen di antara divisi – divisi yang sebelumnya tidak terperhatikan.
- Mengelompokkan dokumen dengan themes yang sama.
sumber : https://saydasyarifa.wordpress.com/2013/01/06/pengorganisasian-data-dan-informasi/