PENGORGANISASIAN DATA DAN INFORMASI

10.26.2016

DASAR PENGATURAN DAN AKSES DATA

Hirarki Data adalah istem komputer mengorganisasikan data ke dalam suatu hirarki yang dimulai dengan bits dan kemudia bytes, fields, record, files, dan database

Bits : Bits merupakan unit terkecil dari data yang dapat diproses oleh komputer dan satu kumpulan bit yang terdiri dari 8 bits adalah bytes yang merepresentasikan karakter tunggal bisa berupa huruf, angka, atau simbol.
Fields : Fields merupakan penggabungan beberapa karakter secara logic menjadi sebuah kata, gabungan kata, atau rangkaian kata. Contohnya nama_siswa, tgl_daftar, alamat.
Record : Record adalah gabungan dari beberapa field secara logic, contohnya adalah: nama_siswa, mata kuliah yang diambil, dll.
File : File merupakan gabungan dari beberapa record sejenis yang saling berhubungan.
Database : Database ialah gabungan dari beberapa file yang saling berhubungan.

PENYIMPANAN DAN PENGAKSESAN RECORD

Record – record disimpan dengan berbagai cara di dalam media penyimpanan (secondary storage) dan penyusunannya menentukan cara bagaimana record tersebut bisa diakses. Dalam Sequential Access, data/record harus diambila/diakses sesuai dengan urutan fisik penyimpanan data tersebut. Untuk pengaksesan secara langsung (direct) atau random, user dapat mengambil/mengakses data/record diberbagai urutan tanpa perlu mengetahui urutan fisik data pada media penyimpanan.

Index sequential acces method (ISAM)

Metode pencarian ini dengan menggunakan sebuah index dari key field untuk mencari sebuah record. Indeks terhadap suatu file merupakan daftar key field dari setiap record dan posisi di mana record tersebut di simpan pada media penyimpanan. Record di simpan pada disk berdasarkan urutan key. Track index menunjukkan nilai tertinggi dari key field yang dapat ditemukan pada track tertentu. Untuk menemukan record tertentu, track index dicari utnuk menemukan cylinder dan track yang mengandung data, selanjutnya secara berurutan track dibaca untuk mendapatkan record.

Direct File Access Method

Metode ini menggunakan key field untuk menemukan alamat fisik dari sebuah record. Proses menggunakan rumus matematik (transform algorithm) untuk merubah key field menjadi lokasi penyimpanan dari record.

PERMASALAHAN DENGAN PENDEKATAN FILE

Data redundancy (Duplikasi)

Karena aplikasi dan file datanya telah dibuat oleh programmer yang berbeda dalam jangka waktu yang lama, maka sejumlah informasi yang sama terduplikasi di beberapa tempat.

Data inconsistency (Data tidak Konsisten)

Data inconsistency berarti suatu jenis data memiliki berbagai macam salinan yang berbeda – beda (untuk data yang sama, salinannya tidak sama,sehingga data tidak konsisten).

Data Isolasion (Pemisahan)

Dengan aplikasi yang dirancang dan diimplementasikan secara unik, data file dikelola secara terpisah mengakibatkan penyimpanan data dengan format yang berbeda, seperti ukuran tinggi dalam centimeter atau Inchi, dan biasanya tidak dapat diakses oleh aplikasi lain.

Data Integrity (Integritas Data)

Nilai data harus dipertahankan kesesuaiannya. Misalnya nilai siswa tidak boleh negative.

Data Independence (Aplikasi/data berdiri sendiri)

Dalam pendekatan tradisional yaitu pendekatan file, aplikasi dan file data yang berhubungan independence satu sama lain.

PENDEKATAN MODERN : BASIS DATA (DATABASE)

Basis Data adalah gabungan/kumpulan dari beberapa file yang berhubungan dan di mana file – file yang berhubungan tersebut ditempatkan dapat mempengaruhi user dalam mengakses data, waktu dibutuhkan untuk query, entry data, keamanan, dan biaya.

Dengan pendekatan modern semua data diletakkan di tempat penyimpanan yang sama. Tidak seperti pendekatan tradisional di mana program yang berbeda – beda mengakses file data yang berbeda – beda. Basis data diatur sedemikian rupa sehingga satu atau sekelompok program menyediakan akses terhadap semua data.

Sehingga permasalahan duplikasi data (redundancy), data yang terisolasi (isolation), dan data yang tidak konsisten (inconsistency) dapat dikurangi, dan data dapat dibagi – bagikan di antara semua pengguna (users). Di samping itu, keamanan dan integritas data meningkat, dan aplikasi serta data tidak bergantung satu dengan yang lainnya.

Database Terpusat (Centralized Database)

Database terpusat (Centralized Database) memiliki semua file yang saling berhubungan dalam suatu lokasi penyimpanan. File – file database ditempatkan di komputer mainframe (komputer pusat). Dengan ini tidak hanya memperkecil biaya dalam hubungannya dengan beberapa computer tapi juga memberikan database admin (DBA) dengan kemampuannya untuk bekerja pada database dalam satu lokasi saja.

Semua file tidak bisa diakses kecuali dari komputer pusat, di mana file tersebut lebih mudah diproteksi dari akses – akses atau modifikasi yang tidak berhak, juga penyelamatan dari bencana (disasters recovery) akan lebih mudah dilakukan karena data hanya berada pada satu lokasi pusat penyimpanan.

Bagaimanapun juga data terpusat mempunyai satu titik kelemahan, yakni ketika komputer pusat tidak berfungsi maka yang lain tidak bisa beroperasi. Dan kadangkala kecepatan akses bermasalah, jika user tersebar di berbagai tempat yang jauh dan harus mengerjakan manipulasi semua data, maka akan terjadi kelambatan atau akses menjadi sangat lambat.

Data Terdistribusi (Distributed Database)

Data Terdistribusi (Distributed Database) adalah sekumpulan database atau data logic yang saling berhubungan secara fisik terdistribusi dalam jaringan komputer, yang tidak tergantung dari program aplikasi sekarang maupun masa yang akan datang.

Pada basis data terdistribusi (distributed database), data disimpan pada beberapa tempat (site), setiap tempat diatur dengan suatu DBMS (Database Management System) yang dapat berjalan secara independent. Properti yang terutama terdapat pada basis data terdistribusi : Independensi data terdistribusi : pemakai tidak perlu mengetahui dimana data berada (merupakan pengembangan prinsip independensi data fisik dan logika). Transaksi terdistribusi yang atomic : pemakai dapat menulis transaksi yang mengakses dan mengubah data pada beberapa tempat seperti mengakses transaksi local.

Penggandaan semua database atau sebagian database ke lebih dari satu tempat/lokasi, yang biasanya lebih dekat dengan user. Ada 2 tipe data terdistribusi :

Replicated Database

Penggandaan (copy) semua database ke beberapa lokasi, dengan tujuan utama untuk mengatasi permasalahan apabila terjadi kegagalan pada database pusat, selain itu juga meningkatkan responterhadap akses oleh user.

Partitioned Database

Penggandaan (copy) sebagian database ke suatu tempat/lokasi lain, biasanya bagian yang digandakan adalah bagian database yang sangat dibutuhkan oleh user pada lokasi tersebut. Pengaksesan akan lebih cepat karena database berada dekat dengan user.

PEMBUATAN BASIS DATA (CREATING DATABASE)

Untuk membuat sebuah database, perancang database harus membuat rancangan konsep (conceptual design) dan rancangan fisik (physical design). Rancangan konsep adalah model abstrak database dari user atau dari segi pandang bisnis. Rancangan fisik menunjukkan bagaimana sebuah database sebenarnya diatur/disusun pada tempat penyimpanan.

Rancangan konsep menggambarkan bagaimana elemen data dalam database dikelompokkan. Proses perancangan mengidentifikasi hubungan antara elemen data dan cara paling efisien untuk mengelompokkan elemen data dalam memenuhi kebutuhan informasi. Proses perancangan juga mengidentifikasi duplikasi dan pengelompokan pada elemen data membutuhkan aplikasi tertentu. Untuk mendapatkan rancangan database yang optimal perancang database harus menggunakan ER-Diagram dan Normalisasi.

Entity Relationship (ER) Modeling

ER Diagram sebagai dokumen dari konsep model data yang berisi entity/entitas, atribut, dan relasi, yang semuanya digambarkan dalam diagram.

Entitas adalah sesuatu yang dapat diidentifikasi pada lingkunga kerja pengguna (user). Contoh : pendaftaran mata kuliah oleh mahasiswa. Pada contoh ini entitasnya adalah mahasiswa, mata kuliah. Entity Classes merupakan gabungan/kelompok dari beberapa entity/entitas.
Instance menggambarkan keterangan dari entity. Sebagai contoh mahasiswa tertentu (Johns Mill,0800759633) adalah instance dari mahasiswa.
Identifier merupakan atribut yang mengidentifikasi instance darientity. Contohnya untuk instance mahasiswa dapat diidentifikasi dengan nomor id mahasiswa.
Relationship adalah yang menggambarkan hubungan satu entity dengan entity lain. Hubungan tersebut bisa hubungan one to one, one to many, dan many to many.
Normalization

Pada relational database perlu dilakukan analisa agar tidak terjadi pengulangan atau redundancy. Normalisasi adalah cara untuk menganalisa dan mengurangi suatu relasi database menjadi lebih singkat dengan tujuan meminimalkan duplikasi data, memaksimalkan integritas data, dan kinerja proses yang baik.

SISTEM MANAJEMEN DATABASE (DATABASE MANAGEMENT SYSTEM / DBMS)

Merupakan suatu software (program) atau sekelompok program yang dapat memberikan akses ke database. DBMS memperbolehkan organisasi untuk menyimpan data di dalam satu tempat penyimpanan, dari itu data dapat diupdate dan diambil, dan juga memberikan akses ke data yang disimpan oleh berbagai macam program aplikasi.

DBMS juga memberikan mekanisme untuk pengelolaan integritas informasi yang disimpan, mengatur keamanan dan akses dari user, perbaikan informasi ketika sistem rusak, dan pengaksesan berbagai macam fungsi databsae di dalam aplikasi yang ditulis dengan bahasa generasi ke 3, 4, atau berorientasi objek.

Ada empat komponen utama di dalam sistem manajemen database yakni Data Model, DDL, DML, dan Data Dictionary.

Model Data (Data Model)

Menerangkan bagaimana cara data disusun secara konsep.

Data Definition Language (DDL)

Menerangkan tipe informasi yang ada di dalam database dan bagaimana informasi – informasi tersebut disusun. DDL menerangkan tiap elemen data sebagaimana adanya dalam database sebelum elemen data tersebut diubah menjadi bentuk yang dibutuhkan oleh aplikasi. DDL merupakan jalur di antara logical dan physical view. DDL digunakan untuk mendefinisikan karakter fisik setiap record, field di dalam suatu record, dan setiap nama logical dari field, tipe data dan panjang karakter, dan juga digunakan untuk rmenspesifikasikan relasi/hubungan di antara semua record.

Data Manipulation Language (DML)

Digunakan dengan bahasa generasi ke 3,4 atau berorientasi objek untuk melakukan query terhadap isi dari database, penyimpan atau update informasi di dalam database dan membangun aplikasi database.DML memungkinkan user untuk mengambil, mengurutkan, menampilkan dan menghapus isi dari database. SQL merupakan bahasa database relasi yang paling populer, yang mengkombinasikan kemampuan DDL dan DML.

Contoh:

SELECT (student_name) from (student_database)

where student_id = ‘0800759633’

Menampilkan nama mahasiswa dari tabel database mahasiswa yang memilik student_id = 0800759633.

Data Dictionary (Kamus Data)

Kamus data menyimpan definisi dari elemen data (field) dan karakteristik data seperti individuals, fungsi bisnis, program, dan laporan. Kamus data memiliki keuntungan yaitu dapat mengurangi ketidakkonsistenan dalam data karena kamus data menyediakan definisi standar untuk semua elemen data. Sistem manajemen database memiliki keuntungan terhadap organisasi sebagai berikut :

Meningkatkan kegunaan strategis dari data perusahaan.
Mengurangi kompleksitas dari lingkungan sistem informasi perusahaan.
Mengurangi duplikasi data dan data yang tidak konsisten.
Meningkatkan integritas data.
Meningkatkan keamanan.
Mengurangi biaya pembangunan dan pengelolaan aplikasi.
Meningkatkan fleksibilitas dari sistem informasi.
Meningkatkan akses dan ketersediaan data dan informasi.

LOGICAL DATA MODEL

Kemampuan seorang manager untuk menggunakan data adalah sangat bergantung pada bagaimana database terstruktur secara logical maupun fisik. DBMS memisahkan tampilan logic dan fisik dari data, ini berarti bahwa programmer dan user tidak tahu di mana dan bagaimana data sebenarnya disimpan.

Dalam penyusunan database secara logic, kebutuhan bisnis menentukan karakteristik dari data dan bagaimana data akan diakses. Ada tiga bentuk data model yang biasa digunakan, yakni hierarchical, network, dan relational. Dan tipe lain dari model data termasuk multidimensional, object oriented, object-relation, dan hypermedia.

Menggunakan model ini, perancang database dapat membangun tampilan logic atau konseptual dari data yang selanjutnya dapat diimplementasikan secara fisik ke dalam database virtual dengan DBMS apa saja.

Model Basis Data Hirarki (Hierarchical Database Model)

Membuat struktur data ke dalam bentuk pohon terbalik (inverse trees) yang setiap record mempunyai 2 elemen. Yang pertama merupakan root atau field master atau sering disebut juga key, yang mengidentifikasikan tipe lokasi atau susunan record. Kedua adalah berupa variable dari subordinate field, yang menerangkan akhir dari data dalam record. Aturannya adalah semua field hanya mempunya satu “parent”, setiap parent mempunyai banyak “Children”.

Model Basis Data Jaringan (Network Database Model)

Membuat relasi/hubungan antar data melalui suatu struktur linked-list di mana subordinate record dapat dihubungkan ke lebih dari satu elemen data. Mirip dengan Hierarchical Model, tetapi pada model ini menggunakan link yang eksplisit untuk menghubungkan member dan owner yang disebut pointer. Model database ini sangat komplek/rumit, yakni setiap ada perubahan hubungan antar elemen data, sepasang pointer harus diperbaiki.

Model Basis Data Relasi (Relational Database Model)

Relational database model berdasar pada konsep sederhana dari tabel untuk melakukan perubahan pada karakteristik baris dan kolom data. Di dalam model ini, tabel – tabel disebut relations, baris disebut tuple, dan kolom disebut attribute.

GUDANG DATA (DATA WAREHOUSE)

Data Warehouse adalah sistem manajemen database relational atau multidimensional yang dirancang untuk mendukung manajemen pengambilan keputusan. Data Warehouse mengandung data terbaru dengan rinci, data yang lama (Historical Data) dengan rinci, rangkuman data, dan metadata. Metadata adalah data mengenai data.Pengguna data warehouse perlu mengetahui data apa saja yang tersedia, apa sumber data, di mana data berada, dan bagaimana mengakses data.

Multidimensional Database Model

Database multidimensi sering disebut pusat dari data warehouse, data yang hubungannya sangat kuat dan dapat dilihat dan dianalisa dari sudut pandang yang berbeda yang disebut dimensi dan juga menyediakan tempat penyimpanan yang efisien, efektif, dan nyaman serta pengambilan data yang besar. Data seperti dalam database dianalisa oleh Online Analytical Processing (OLAP). Dalam model data ini, data disimpan dalam bentuk array.

Data Mart

Data Mart merupakan versi scaled-down dari data warehouse yang memfokuskan pada area subjek tertentu. Data Mart biasa dirancang untuk mendukung kebutuhan bisnis yang unik dari departemen atau proses bisnis tertentu. Suatu perusahaan dapat memiliki banyak data mart di mana setiap data mart fokus pada sebagian dari keseluruhan bagian perusahaan. Butuh sedikit waktu untuk membangun data mart, biaya ringan, dan tidak begitu rumit.

Data Mining

Data Mining memberikan pengertian atau arti yang sebelumnya tidak diketahui, prediksi informasi dari data – data yang dapat diakses dari dalam data warehouse. Tools Data Mining menggunakan algoritma yang otomatis dan canggih untuk menemukan pola (pattern) yang tersembunyi, korelasi, dan hubungan antara data. Tools ini digunakan untuk memprediksi pola atau trend di masa yang akan datang, yang mengarahkan perusahaan dalam mengambil keputusan.

Text Mining

Merupakan aplikasi dari data mining untuk file teks yang tidak terstruktur atau kurang terstruktur, lebih berfokus pada format dokumen daripada isi dokumen.

Sumber :

Rangkuman semua ppt pembelajaran

https://saydasyarifa.wordpress.com/2013/01/06/pengorganisasian-data-dan-informasi/

M	T	W	T	F	S	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Leave a Reply