Setelah sebelumnya sukses mabok bersama JAVA SCRIPT dan JAVA PROGRAMMING, kini saatnya kita beralih ke alam hitung-hitungan #siapsiapsiapinobatmenci
Ets, aku gak lagi ngomongin Matematika, Kalkulus, atau Aljabar Matriks. Ketiga pelajaran tsb kebetulan emang kusuka, tapi kali ini gak jamin deh. Mata kuliah ini gak kalah abstrak dengan Bahasa Pemrograman. Yak, sebut saja dia dengan nama DATA MINING. DATA MINING!!!
Apaan tuh Data Mining???
Kata Pak Dosenku, Data Mining adalah proses mencari pola/keterkaitan di dalam database. Nah lhooo, napa jadi ngomongin database nih???
Oke, sebenarnya saat pertemuan pertama kuliah Data Mining, aku sama sekali GAK NGERTI tentang Teori Data Mining. Maksudnya apa sih tu???aku juga gak ngerti, yang kutangkap sih...misal, dalam sebuah supermarket, pembeli membeli 3 macam barang. Sebut saja susu, teh, gula. Nah, bisa saja pembeli lainnya hanya membeli susu dan teh, atau teh dan gula atau tiga-tiganya.
Nah, si Data Mining yang terhormat ini bertugas untuk mencari pola. Kayaknya emang males banget kalo cuma berteori saja. mending juga kita langsung to the point azza :D
Bab pertama yang bakal kita obrak abrik yaitu ttg Teknik Data Mining.
Ada yang disebut Analisis Asosiasi, yaitu teknik data mining untuk menemukan aturan asosiatif antara kombinasi item #pingsan. Contohnya gini deh: misal di sebuah supermarket ingin mengetahui seberapa besar kemungkinan pembeli membeli susu dan teh secara bersamaan #cukup
So, penting gaknya aturan asosiatif bisa ditentukan oleh 2 parameter, yaitu Support (nilai penunjang) dan Confidence (nilai kepastian) #muntahbusa
Mending langsung aje kita masuk ke dunia RUMUS. Cekibuuummmm!!!
Tahapan Metodologi Analisis Asosiasi
1. Identifikasi item ke dalam tabel
2. Menentukan Pola Frekuensi Tinggi (nilai support)
RUMUS: support(A) = Jumlah transaksi mengandung A / Total transaksi
3. Menentukan Aturan Asosiasi
RUMUS:
confidence(A,B) = Jumlah transaksi mengandung A & B / Jumlah transaksi mengandung A
4. Membuat Aturan Final
RUMUS : Nilai support X Nilai confidence
Nah, cukup 4 langkah aje yeeee buat ngerjain soalnyeee hyeehehehehe.....Oke, kita masuk ke contoh soal :D
Ada soal berupa data dalam tabel seperti di bawah ini :
Nah, ini ceritanya ada 10 transaksi pembelian bahan makanan. Syaratnya :
Minimal Support = 2
Minimal Confidence = 60%
Cari deh tu Aturan Asosiasinya :D
Cara jawabnye gimane??? Yuk, kita telusuriiiii :D
JAWAB :
Kita jawabnya pake 4 langkah tadi :D
1. Identifikasi Item ke dalam Tabel
Tabel 1
Maksudnya apaan nih coooyyyy????
Oke, kita tetep bikin 10 transaksi, tapi kita jabarin lagi noh item-item yang ada di soal tadi. Hayoooo ada berapa item di soal tadiiiii???
Yak, ada 5 item!! Ada susu, teh, gula, roti dan kopi. Masukin dah tu ke dalem tabel, jadilah kayak tabel di atas.
Nah terus yg di checklist itu apa ya?
Ya itu kita liat aja di soal. Pada transaksi 1, ada item apa aja coba??? ada susu, teh, gula. Ya udah deh tinggal di checklist doank. Begitu seterusnya ampe transaksi 10 ^_____^. Nah, kalau udah jangan lupa dijumlahin dah tu tiap kolomnya :D
---------------------------------------------------------------------------------------------------------------------------
2 ITEM
Tabel 2
Maksudnya apa sih tu tabel???abstrak banget >,<
Oke, sabar donk. Jadi gini. Tadi kan udah kita jabarin di Tabel 1 bahwa ada 5 item yaitu susu, teh, gula, roti dan kopi. Nah, dari 5 item itu kita kombinasikan atau gampangnya kita bikin kemungkinannya, tapi jumlahnya 2 item aja. Hasilnya seperti Tabel 2 diatas.
Terus, kok itu susu,teh ada 1...susu,gula ada 4 dst...????
1. Liat Tabel 1
2. Coba cari yang kombinasi susu,teh dari 10 transaksi...ada berapa??? 1 kan??? begitu seterusnya.
Terus, kok itu tulisannya ada yg dimerahin kenapaaa????
Nah, tadi kan di soal ada syarat Minimal Support = 2, berati kombinasi yg kita ambil hanya yang nilainya lebih dari atau sama dengan 2, ya yg tulisannya merah itu :D, yg lain....abaikan!!
------------------------------------------------------------------------------------------------------------------------
3 ITEM
Tabel 3
Sebelumnya kan kita bikin kombinasi tapi hanya 2 item. Sekarang kita buat kombinasi 3 item.
1. Liat Tabel 1
2. Cari aja di tiap transaksi yang checklist-nya ada 3. Nah, itu yang diambil *gampangnya sih gitu*
3. jangan lupa dijumlahin :D *sama kayak yang 2 item tadi*
-----------------------------------------------------------------------------------------------------------------------
2. Menentukan Pola Frekuensi Tinggi
2 ITEM
Tabel 4
1. Liat Tabel 2
2. Kumpulin data yang tulisannya warna merah dalam 1 tabel. Jadilah Tabel 4
3. Liat rumus support (A) di atas :D
4. susu, gula-----------4/10 = 40% ............ dapet darimana tuh??
(4 didapat dari jumlah kombinasi 'susu,gula' di Tabel 2 dan 10 didapat dari jumlah transaksi lalu dikali 100%). Begitu seterusnya ^____^
--------------------------------------------------------------------------------------------------------------------------
3 ITEM
Tabel 5
1. Liat Tabel 3
2. Simpen data yang tulisannya berwarna merah (Min.Support=2) ke dalam 1 tabel. Jadilah Tabel 5.
3. Perhitungan sama seperti pada kombinasi 2 ITEM sebelumnya.
------------------------------------------------------------------------------------------------------------------------
3. Menentukan Aturan Asosiasi
2 ITEM
Tabel 6
1. Lihat Tabel 2
2. Satu (1) Kombinasi terdiri dari 2 Aturan. Pada Tabel 2 terdiri dari 6 Kombinasi (yg Min.Supp=2), otomatis ada 12 Aturan.
Contoh: Pada Tabel 2, kombinasi 1 yaitu 'susu,gula', maka kita buat kalimat menjadi 'Jika membeli susu maka membeli gula'. Aturan ke-2 tinggal dibalik saja menjadi 'Jika membeli gula maka membeli susu '. Begitu seterusnya.
3. Lihat Rumus Confidence sebelumnya.
4. Jika membeli susu maka membeli gula-------------------4/6 = 67%...............dapet darimane tuh???
(4 didapat dari jumlah kombinasi 'susu,gula' pada Tabel 2 dan 6 didapat dari jumlah transaksi pembelian susu pada Tabel 1 lalu dikali 100%)
5. Jika membeli gula maka membeli susu-------------------4/8 = 50%.........kok bisa gitu?????
(4 tetap didapat dari jumlah kombinasi 'susu,gula' pada Tabel 2 sedangkan 8 didapat dari jumlah transaksi gula pada Tabel 1 lalu dikali 100% ) #muntahkambing
----------------------------------------------------------------------------------------------------------------------
3 ITEM
Tabel 7
1. Karena ini 3 ITEM, jadi 1 Kombinasi terdiri dari 3 Aturan. Lihat Tabel 3
2. Pada Tabel 3, ada 'gula,kopi,susu' yg memenuhi syarat Min.Supp=2, jadi kalimat 'Jika membeli gula+kopi maka membeli susu'. Begitu seterusnya *kombinasikan saja*
3. Jika membeli gula+kopi maka membeli susu-----------2/3 = 67%.......pegimane caranya tuh???
(2 didapat dari jumlah kombinasi 'gula,kopi,susu' yg sudah memenuhi syarat Min.Supp=2 pada Tabel 3 dan 3 didapat dari jumlah kombinasi gula+kopi pada Tabel 2 lalu dikali 100% ).
4. Gitu aja terus :D
-------------------------------------------------------------------------------------------------------------------------
4. Aturan Final
Tabel 8
1. Lihat Tabel 6 dan Tabel 7
2. Pada soal, ada syarat Minimal Confidence = 60%, jadi ambil data aturan yang nilainya lebih atau sama dengan 60% (yg tulisannya dimerahin :D). Masukan dalam tabel. Jadilah Tabel 8
3. Jika membeli susu maka membeli gula-------40% X 67% = 26,8%....kok gitu???
4. Tadi kan udah dikasi rumus untuk membuat Aturan Final, yaitu Nilai Support X Nilai Confidence
5. Tinggal dikaliin aja Nilai Support pada Tabel 4 (2 ITEM) dan Tabel 5 (3 ITEM) sama Nilai Confidence pada Tabel 6 (2 ITEM) dan Tabel 7 (3 ITEM) lalu dibagi 100%.
6. SELESAI!!!!
-----------------------------------------------------------------------------------------------------------------------
Oke deh,,,yakin sejuta persen kalo yg baca ini pasti udah pada mabok bawang deh. Sama,,,aku juga MABOK cabe neh >,<. Kebayang gak seeeehhh kalo ujian gimanaaaaaaa....ini aja ngerjain 1 soal butuh sejam lebiiiiiiiihhhh coooooyyyy......*banting2 buku*
Oke deh, daripada ntar ada yg kena epilepsi akut dadakan, mending udahin dulu deh yak ngetiknyeee...
Yuk Mariii (>,<)/