BAB 9



PEMROSESAN FILE DAN KONSEP MANAJEMEN DATA


9.1 Tinjauan Sekilas Tentang Teknologi

A.Field, Unsur Data, Atribut, dan Elemen- Elemen
Istilah- istilah field, unsur data, atribut, dan elemen digunakan secara bergantian untuk menyebutkan blok data terkecil yang disimpan dan digunakan dalam SISTEM INFORMASI. Field dapat terdiri atas karakter tunggal atau nomor tunggal, atau dapat terdiri dari beberapa karakter atau nomor.
Contoh- contoh field adalah :
1. Nama pelanggan
2. Nomor tunjangan sosial karyawan
3. Nomor pesanan pembelian
Field biasanya secara logis berkaitan dengan field lainnya;
pengelompokan logis atas field disebut catatan (record).

B. Okurensi Data
Struktur catatan memiliki okurensi (occurences), yang juga disebut instances. Okurensi catatan adalah himpunan spesifik nilai- nilai data untuk catatan.

C. Panjang Catatan- Tetap dan variabel
Catatan dalam file dapat memiliki panjang yang tetap atau variabel. Dalam catatan dengan panjang- tetap, baik jumlah field maupun panjang (ukuran karakter) setiap field adalah tetap. Sebagian besar catatan yang disimpan dalam direct access storage devices (DASDs) adalah catatan panjang- tetap. Catatan dengan panjang- variable, lebar field dapat disesuaikan untuk setiap okurensi data. Catatan penjejak adalah perluasan dari catatan master,. Catatan penjejak terpisah dari catatan master dan hanya ditulis sesuai kebutuhan. Dengan menggunakan file piutang dagang akun terbuka, sebagai contoh, catatan master memuat informasi yang umum bagi seluruh akun dan jumlah faktur yang memadai bagi sebagian besar akun, dimana catatan penjejak memuat lebih banyak faktur. Catatan master harus memiliki jumlah yang sama dengan catatan penjejak yang berkaitan sesuai kebutuhan. Catatan penjejak harus segera dituliskan setelah catatan master yang berkaitan.
Kelompok berulang adalah kelompok field yang berhubungan yang diulang dalam catatan dengan panjang variabel. Dalam diagram pohon 11.3 PART tampak sebagai Induk dari PEMASOK dan LOKASI karena setiap kemunculan PART akan menimbulkan lebih dari satu pemasok atau lokasi. Secara umum, elemen tingkat tertinggi dalam diagram pohon adalh induk; elemen dengan tingkatan lebih rendah yang tampak pada diagram pohon yanng berkaitan dengan (atau bagian dari induk disebut anak.

D. Kunci catatan dan Urutan File
Kunci atau kunci catatan merupakan unsur data atau kombinasi unsusr data yang secara unik mengidentifikasi catatan tertentu dalam file. Istilah order random relatif berkaitan dengan field dimana file tidak disortir.

9.2 EVOLUSI TEKNOLOGI DATABASE


Teknologi database berkembang sejalan dengan perkembangan perangkat keras dan perangkat lunak. Pembuatan jaringan dan teknologi komunikasi mengubah skala ekonomi pembuatan database.
Periode Kejadian Teknik database yang berkaitan
1960-an Lingkungan mainframe

Sistem manajemen database

Layanan informasi on-line Sistem file

Manajemen database

Manajemen teks
1970-an Expert systems

Pemrograman berorientasi- obyek Inferensi dan deduksi

Inheritensi dan abstraksi
1980-an Sistem hiperteks Asosiasi

1990-an Sistem database intelijen Kombinasi teknik- teknik

Pengembangan dalam teknologi untuk melakukan masukan data ke komputer secara umum berperan dalam perkembangan database secara pesat.

A. Lingkungan Mainframe
Pada mulanya, masalah utama berkaitan dengan jumlah file yang besar.

B. Sistem Manajemen Database
Lama- kelamaan, perusahaan menghadapi masalah sistem file sederhana. Kesulitan utama termasuk menemukan file yang tepat untuk informasi yang dibutuhkan, pemborosan karena duplikasi data yang sama dalam file yang berbeda, dan kurangnya standarisasi antar file.

C. Layanan Informasi On-line
Salah satu layanan database tersambung (on-line) terbesar adalah Dialog, yang sekarang mencakup ratusan database dan ratusan jutaan catatan. Banyak perusahaan mengumpulkan informasi dari layanan on-line yang harus dikaitkan secara sistematis dengan sistem informasi mereka. Ini berhubungan juga dengan kebutuhan baru, manajemen teks, yang bersama- sama dengan data grafis dan suara, membutuhkan teknologi yang lebih baik dari yang disediakan sistem database yang tradisional. Sistem multimedia tersebut semakin penting saja masalah ini.

D. Expert Systems
Sistem ahli (expert systems) membantu pengambilan keputusan tingkat tinggi dan telah sukses diterapkan dalam beberapa area seperti pengesahaan pemberian pinjaman, penentuan dimana penggalian mineral dilakukan, dan diagnosa pengobatan.

E. Pemrograman Berorientasi-Objek
Pemrograman Berorientasi- Objek meliputi pendefinisian obyek- obyek dari daftar atau kumpulan informasi yang rumit.

F. Sistem Hiperteks
Sistem hiperteks memungkinkan para pemakai untuk mengambil database dengan cara random melalui pemilihan kata- kata kunci. Aplikasi awal hipermedia dalam bisnis sangat berkaitan dengan materi- materi referensi seperti manual kebijakan dan pelatihan.

G. Sistem Database Intelejen
Sistem database intelejen merefleksikan kecenderungan penggabungan seluruh teknologi- teknologi terbaru, termasuk yang paling muktahir, ke dalam satu sistem database.

9.3 SISTEM MANAJEMEN DATABASE DAN ARSITEKTURNYA

Pada gambar 11.5 terdapat tiga tingkatan arsitektur yang relevan dengan database dan manajemen database; arsitektur tingkat konseptual, arsitektur tingkat logis, dan arsitektur tingkat fisik. Pada tingkat konseptual, database merupakan kumpulan beragam elemen informasi yang akan digunakan untuk tujuan- tujuan yang telah dipilih. Catatan dan field- field dalam database distrukturkan dan diorganisasikan dalam beberapa pola logis, sehingga membantu pembentukan struktur data logis. Terdapat tiga jenis struktur data logis yang dapat digunakan untuk mencapai tujuan tersebut, yaitu : hirarkis, jaringan, dan relasional.

A. Arsitektur Konseptual
Model data hubungan entitas- entity relationship (ER) merupakan pendeketan yang populer. Model ER menggambarkan hubungan antar segmen secara sederhana. Terdapat pula metode- metode konseptual lainnya, termasuk teknik pembuatan model berorientasi-obyek-object-oriented modeling technique (OMT), yang pada dasarnya dikembangkan untuk pemrograman berorientasi- obyek dan diadaptasi untuk pembuatan model Blaha, Premerlani, dan Rumbaugh. Kelas obyek berkaitan dengan segmen, dan obyek berkaitan dengan bagian tertentu.

B. Arsitektur Database pada Tingkat Logis : Struktur Database Logis
Hubungan- hubungan yang timbul antara segmen- segmen dalam database ditentukan oleh struktur data logis, yang juga disebut skema atau model database. Tiga model utama struktur data logis yang ada dalam literatur adalah :
1. Model pohon atau hirarkis
2. Model jaringan
3. Model relasional

Penjelasannya :

1. Model pohon atau hirarkis
Struktur pohon merupakan representasi langsung proses segmentasi yang telah di jelaskan sebelumnya.Dalam struktur pohon,setiap simpul mewakili himpunan field(misalnya,segmen),dan simpul berkaitan dengan node lain yang tingkatanya lebih tinggi dalam struktur pohon.Simpul yang lebih tinggi disebut simpul induk.Hubungan antara induk dan anak di sebut cabang.

2. Struktur jaringan
Struktur jaringan memungkinkan segmen anak memiliki lebih dari satu induk.struktur pohon dan jaringan keduanya diterapkan dengan penunjuk field(field pointer),dengan segmen lintas-hubung,seperti yang akan di bahas lebih jauh dalam bagian berikutnya.

3. Implementasi struktur-struktur pohon dan jaringan
Topik implementasi srtuktur-struktur pohon dan jaringan lebih merupakan bagian dari arsitektur fisik database di bandingkan sebagai arsitektur logis.Dalam organisasi daftar,setiap catatan memuat satu atau lebihponter(field)yang mengindikasikan alamat catatan logis berikutnya yang memiliki atribut yang sama.Catatan dapat merupakan bagian dari beberapa daftar.Daftar ini disebut organisasi multydaftar.
Dua area aplikasi sistem berdasar penunjuk field yang paling berkrmbang adalah hiperteks dan jaringan data semantik.

4. Struktur data relasional
Model relasional memandang database sebagai kumpulan dua tabel dimensional dibandingkan sebagai struktur jenis hirarkis atau jaringan.Aturan-aturan tertentu di sebut format-format normal mengatur pembuatan tabel-tabel.ketiga format normal adalah sebagai berikut:
Format normal Aturan
Format normal pertama Membagi tabel untuk mengeliminasi kelompok berulang
Format normal kedua Membagi tabel sehingga tidak ada kunci yang memntukan nilai field non-kunci.

Format normal ketiga Membagi tabel sehingga tidak ada field non- kunci yang menentukan nilai field non- kunci lainnya.

C. Arsitektur database pada tingkat fisik
Dalam pembahasan tingkat fisik arsitektur database,kita akan berfokus pada tiga metode akses file:Sekuensial,Terindeks,langsung.

1. File terakses secara sekuensial
Dalam file akses sekuensial,catatan-catatan hanya dapat di akses dalam sekuens yang telah di tentukan sebelumnya.organisasi file sekuensial bukan merupakan alat sortir data yang bermanfaat jika hanya terdapat sedikit saja catatan yang akan di akses dalam file yang memuat banyak catatan.file sekuensial bermanfaat dalam pemrosesan batch,secara normal mengakses seluruh catatan dalam file.kesimpulannya,organisasi file sekuensial bermanfaat jika di butuhkan pemrosesan batch.

2. File terindeks
Setiap atribut dapat di ekstrak dari catatan dalam file utama dan di gunakan untuk membuat file baru yang bertujuan menyediakan indeks untuk file asli.File seperti itu di sebut file terindeks atau file terinversi.File dikatakan terinversi secara penuh jika ada indeks untuk seluruh fieldnya.File sekuensial terindeks adalah file sekuensial yang tersimpan dalam DASD dan di indeks serta di sortir secara fisik dalam field yang sama.File-file tersebut umumnya berhubungan dengan file ISAM,dimana ISAM berlaku sebagai kontraksi metode akses sekuensial terindeks.Area utama(primer)merupakan bagian dari disk dimana catatan-catatan aktual di tulis.area tambahan merupakan bagian terpisah dari disk yang di lokasikan bagi file untuk memuat tambahan yang di buat,tanpa melakukan pemrosesan ekstensif terhadap file awal.

3. File terakses secara langsung
File terakses secara langsung memungkinkan catatan-catatan individual dapat di panggil secara cepat tanpa menggunakan indeks.Tranformasi random merupakan metode penyimpanan dan penempatan catatan dalam file akses langsung yang di gunakan secara luas.jadi istilah akses random sering kali di gunakan sebagai sinonim dari akses langsung.

D. Hubungan ekonomik antar teknik-teknik organisasi file
Teknik-teknik akses file yang telah di bahas(sekuensial,terindeks,dan akses langsung) cocok untuk situasi-situasi yang berbeda.gambar 11.18 mengiktisarkan kapan masing-masing teknik organisasi file di gunakan.aspek ekonomik pemrosesan file sangat ditentukan oleh rasio aktifitas(jumlah catatan-catatan yang di akses dibagi dengan jumlah catatan dalam file),dan waktu yang dibutuhkan untuk pemrosesan dan inquiri.

Teknik-Teknik organisasi file Saat terbaik Keterbatasan
Sekuensial Rasio aktifitas tinggi,seperti dalam pemrosesan batch Tidak memungkinkan untuk mengakses catatan tunggal secara cepat
Terindeks Rasio aktifitas rendah,ukuran file dari moderat sampai tinggi Pemutakhiran file membutuhkan pemutakhiran indeks-indeks
Sekuensial terindeks File harus di proses dengan pola pemrosesan batch(rasio aktifitas tinggi) dan non batch(rasio aktifitas rendah) Sama dengan sekuensial dan terindeks
Langsung Rasio aktifitas rendah,file berukuran rendah,struktur jaringan,dan struktur pohon Memerlukan kunci-kunci untuk menempatkan catatan-catatan

E. Arsitektur fisik,Perangkat keras,dan waktu tanggap
Dari sisi perangkat keras,waktu tanggap di pengaruhi oleh waktu akses fisik.ini adalah waktu yang dibutuhkan CPU untuk melakukan pemanggilan blok tunggal data dari disk,yang disebut waktu akses disk.faktor lain yang dapat mempengaruhi waktu tanggap adalah bagaimana catatan data secara fisik didistribusikan dalam disk.Dalam harddisk,data dalam trek atau silinder yang sama dapat di akses tanpa memindahkan alat baca tulis.harus di tekankan bahwa banyak sistem database yang tergantung pada kegiatan masukan atau keluaran sistem oprasinya.kebutuhan menyimpan file secara berurutanbergantung pada arsitektur fisik database dan metode akses file yang digunakannya.