Yuk Berkenalan dengan Algoritma Hash


Kalau kita belajar data mining tentu tidak asing lagi dengan istilah association rules. Ya. topik inin sangat menarik untuk dipelajari karena sering kita gunakan dalam kehidupan sehari-hari, terutama bagi para pebisnis mini market atau punya toko dalam jumlah besar. Beberapa algoritma dalam association rules adalah Apriori, FP-Growth, juga Algoritma Hash. kali ini kita akan belajar tentang algoritma hash.

Algoritma hash-based menggunakan teknik hashing untuk menyaring keluar itemset yang tidak penting untuk pembangkitan itemset selanjutnya. Ketika support count untuk kandidat kitemset dihitung dengan menelusuri basis data, algoritma hash-based mengumpulkan informasi mengenai (k+1)-itemset dengan cara seluruh kemungkinan (k+1)-itemset di-hash ke dalam hash table dengan menggunakan fungsi hash (yang menggunakan sebuah bilangan prima untuk operasi modulo). Setiap buket pada hash table berisi angka berapa kali itemset telah di-hash kedalam buket tersebut. Berdasarkan hash table lalu akan dibangun bit vektor, dimana bit vektor bernilai 1 jika angka pada buket yang bersangkutan lebih besar atau sama dengan minimum support. Pada bagian pembangkitan kandidat, setelah menghitung Ck=Lk-1*Lk-1, setiap itemset diperiksa apakah itemset tersebut di-hash ke buket yang memiliki bit vector sama dengan satu. Bila tidakmaka itemset tersebut tidak akan digunakan. Penggunaan hash table ini mengurangi jumlah dari kandidat kitemset, sehingga mampu mengurangi nilai komputasi dari pembangkitan itemset pada setiap iterasi.

Hash adalah suatu teknik “klasik” dalam Ilmu Komputer yang banyak digunakan dalam praktek secara mendalam. Hash merupakan suatu metode yang secara langsung mengakses record-record dalam suatu tabel dengan melakukan transformasi aritmatik pada key yang menjadi alamat dalam tabel tersebut. Keymerupakan suatu input dari pemakai di mana pada umumnya berupa nilai atau string karakter.

Fungsi Hash adalah suatu fungsi yang mengubah key menjadi alamat dalam tabel. Fungsi Hash memetakan sebuah key ke suatu alamat dalam tabel. Idealnya, key-key yang berbeda seharusnya dipetakan ke alamat-alamat yang berbeda juga. Pada kenyataannya, tidak ada fungsi Hash yang sempurna. Kemungkinan besar yang terjadi adalah dua atau lebih key yang berbeda dipetakan ke alamat yang sama dalam tabel

Referensi:

  1. Analisis Keranjang Pasar Dengan Algoritma Hash-Based Pada Data Transaksi Penjualan Apotek
  2. Data Mining Concepts and Techniques by : Jiawei Han and Micheline Kamber
  3. An Effective Hash Based Algorithm for Mining Association Rules by Joo Soo Park, Ming-Syan Chen and Philips S. Yu
  4. Teori dasar algoritma Hash

One thought on “Yuk Berkenalan dengan Algoritma Hash

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s