9 Okt 2011

DATA MINING #1

Setelah sebelumnya sukses mabok bersama JAVA SCRIPT dan JAVA PROGRAMMING, kini saatnya kita beralih ke alam hitung-hitungan #siapsiapsiapinobatmenci

Ets, aku gak lagi ngomongin Matematika, Kalkulus, atau Aljabar Matriks. Ketiga pelajaran tsb kebetulan emang kusuka, tapi kali ini gak jamin deh. Mata kuliah ini gak kalah abstrak dengan Bahasa Pemrograman. Yak, sebut saja dia dengan nama DATA MINING. DATA MINING!!!

Apaan tuh Data Mining???
Kata Pak Dosenku, Data Mining adalah proses mencari pola/keterkaitan di dalam database. Nah lhooo, napa jadi ngomongin database nih??? 

Oke, sebenarnya saat pertemuan pertama kuliah Data Mining, aku sama sekali GAK NGERTI tentang Teori Data Mining. Maksudnya apa sih tu???aku juga gak ngerti, yang kutangkap sih...misal, dalam sebuah supermarket, pembeli membeli 3 macam barang. Sebut saja susu, teh, gula. Nah, bisa saja pembeli lainnya hanya membeli susu dan teh, atau teh dan gula atau tiga-tiganya.

Nah, si Data Mining yang terhormat ini bertugas untuk mencari pola. Kayaknya emang males banget kalo cuma berteori saja. mending juga kita langsung to the point azza :D

Bab pertama yang bakal kita obrak abrik yaitu ttg Teknik Data Mining.
Ada yang disebut Analisis Asosiasi, yaitu teknik data mining untuk menemukan aturan asosiatif antara kombinasi item #pingsan. Contohnya gini deh: misal di sebuah supermarket ingin mengetahui seberapa besar kemungkinan pembeli membeli susu dan teh secara bersamaan #cukup

So, penting gaknya aturan asosiatif bisa ditentukan oleh 2 parameter, yaitu Support (nilai penunjang) dan Confidence (nilai kepastian) #muntahbusa


Mending langsung aje kita masuk ke dunia RUMUS. Cekibuuummmm!!!

Tahapan Metodologi Analisis Asosiasi
1. Identifikasi item ke dalam tabel
2. Menentukan Pola Frekuensi Tinggi (nilai support)
    RUMUS:   support(A) = Jumlah transaksi mengandung A / Total transaksi
3. Menentukan Aturan Asosiasi
    RUMUS:   
    confidence(A,B) = Jumlah transaksi mengandung A & B / Jumlah transaksi mengandung A 
4. Membuat Aturan Final
    RUMUS :   Nilai support X Nilai confidence

Nah, cukup 4 langkah aje yeeee buat ngerjain soalnyeee hyeehehehehe.....Oke, kita masuk ke contoh soal :D
Ada soal berupa data dalam tabel seperti di bawah ini :

Nah, ini ceritanya ada 10 transaksi pembelian bahan makanan. Syaratnya :
Minimal Support = 2
Minimal Confidence = 60%
Cari deh tu Aturan Asosiasinya :D
Cara jawabnye gimane??? Yuk, kita telusuriiiii :D
JAWAB :
Kita jawabnya pake 4 langkah tadi :D

1. Identifikasi Item ke dalam Tabel


Tabel 1
Maksudnya apaan nih coooyyyy????
Oke, kita tetep bikin 10 transaksi, tapi kita jabarin lagi noh item-item yang ada di soal tadi. Hayoooo ada berapa item di soal tadiiiii???
Yak, ada 5 item!! Ada susu, teh, gula, roti dan kopi. Masukin dah tu ke dalem tabel, jadilah kayak tabel di atas.
Nah terus yg di checklist itu apa ya?
Ya itu kita liat aja di soal. Pada transaksi 1, ada item apa aja coba??? ada susu, teh, gula. Ya udah deh tinggal di checklist doank. Begitu seterusnya ampe transaksi 10 ^_____^. Nah, kalau udah jangan lupa dijumlahin dah tu tiap kolomnya :D
---------------------------------------------------------------------------------------------------------------------------
2 ITEM
Tabel 2 
Maksudnya apa sih tu tabel???abstrak banget >,<
Oke, sabar donk. Jadi gini. Tadi kan udah kita jabarin di Tabel 1 bahwa ada 5 item yaitu  susu, teh, gula, roti dan kopi. Nah, dari 5 item itu kita kombinasikan atau gampangnya kita bikin kemungkinannya, tapi jumlahnya 2 item aja. Hasilnya seperti Tabel 2 diatas. 

Terus, kok itu susu,teh ada 1...susu,gula ada 4 dst...???? 
1. Liat Tabel 1
2. Coba cari yang kombinasi susu,teh dari 10 transaksi...ada berapa??? 1 kan??? begitu seterusnya.

Terus, kok itu tulisannya ada yg dimerahin kenapaaa????
Nah, tadi kan di soal ada syarat Minimal Support = 2, berati kombinasi yg kita ambil hanya yang nilainya lebih dari atau sama dengan 2, ya yg tulisannya merah itu :D, yg lain....abaikan!!
------------------------------------------------------------------------------------------------------------------------
3 ITEM
Tabel 3 
Sebelumnya kan kita bikin kombinasi tapi hanya 2 item. Sekarang kita buat kombinasi 3 item.
1. Liat Tabel 1
2. Cari aja di tiap transaksi yang checklist-nya ada 3. Nah, itu yang diambil *gampangnya sih gitu*
3. jangan lupa dijumlahin :D *sama kayak yang 2 item tadi*
-----------------------------------------------------------------------------------------------------------------------
2. Menentukan Pola Frekuensi Tinggi

2 ITEM
Tabel 4

1. Liat Tabel 2
2. Kumpulin data yang tulisannya warna merah dalam 1 tabel. Jadilah Tabel 4
3. Liat rumus support (A) di atas :D
4. susu, gula-----------4/10 = 40%   ............ dapet darimana tuh??
(4 didapat dari jumlah kombinasi 'susu,gula' di Tabel 2 dan 10 didapat dari jumlah transaksi lalu dikali 100%). Begitu seterusnya ^____^
--------------------------------------------------------------------------------------------------------------------------
3 ITEM

Tabel 5

1. Liat Tabel 3
2. Simpen data yang tulisannya berwarna merah (Min.Support=2) ke dalam 1 tabel. Jadilah Tabel 5
3. Perhitungan sama seperti pada kombinasi 2 ITEM sebelumnya.
------------------------------------------------------------------------------------------------------------------------
3. Menentukan Aturan Asosiasi

2 ITEM
 Tabel 6

1. Lihat Tabel 2
2. Satu (1) Kombinasi terdiri dari 2 Aturan. Pada Tabel 2 terdiri dari 6 Kombinasi (yg Min.Supp=2), otomatis ada 12 Aturan. 
Contoh: Pada Tabel 2, kombinasi 1 yaitu 'susu,gula', maka kita buat kalimat menjadi 'Jika membeli susu maka membeli gula'. Aturan ke-2 tinggal dibalik saja menjadi 'Jika membeli gula maka membeli susu '. Begitu seterusnya.
3. Lihat Rumus Confidence sebelumnya.
4. Jika membeli susu maka membeli gula-------------------4/6 = 67%...............dapet darimane tuh???
(4 didapat dari jumlah kombinasi 'susu,gula' pada Tabel 2 dan 6 didapat dari jumlah transaksi pembelian susu pada Tabel 1 lalu dikali 100%)
5. Jika membeli gula maka membeli susu-------------------4/8 = 50%.........kok bisa gitu?????
(4 tetap didapat dari jumlah kombinasi 'susu,gula' pada Tabel 2 sedangkan 8 didapat dari jumlah transaksi gula pada Tabel 1 lalu dikali 100% ) #muntahkambing
----------------------------------------------------------------------------------------------------------------------
3 ITEM
Tabel 7

1. Karena ini 3 ITEM, jadi 1 Kombinasi terdiri dari 3 Aturan. Lihat Tabel 3
2. Pada Tabel 3, ada 'gula,kopi,susu' yg memenuhi syarat Min.Supp=2, jadi kalimat 'Jika membeli gula+kopi maka membeli susu'. Begitu seterusnya *kombinasikan saja*
3. Jika membeli gula+kopi maka membeli susu-----------2/3 = 67%.......pegimane caranya tuh???
(2 didapat dari jumlah kombinasi 'gula,kopi,susu' yg sudah memenuhi syarat Min.Supp=2 pada Tabel 3 dan 3 didapat dari jumlah kombinasi gula+kopi pada Tabel 2 lalu dikali 100% ).
4. Gitu aja terus :D
-------------------------------------------------------------------------------------------------------------------------
4. Aturan Final
Tabel 8

1. Lihat Tabel 6 dan Tabel 7
2. Pada soal, ada syarat Minimal Confidence = 60%, jadi ambil data aturan yang nilainya lebih atau sama dengan 60% (yg tulisannya dimerahin :D). Masukan dalam tabel. Jadilah Tabel 8
3. Jika membeli susu maka membeli gula-------40% X 67% = 26,8%....kok gitu???
4. Tadi kan udah dikasi rumus untuk membuat Aturan Final, yaitu Nilai Support X Nilai Confidence
5. Tinggal dikaliin aja Nilai Support pada Tabel 4 (2 ITEM) dan Tabel 5 (3 ITEM) sama Nilai Confidence pada Tabel 6 (2 ITEM) dan Tabel 7 (3 ITEM) lalu dibagi 100%.
6. SELESAI!!!!
-----------------------------------------------------------------------------------------------------------------------
Oke deh,,,yakin sejuta persen kalo yg baca ini pasti udah pada mabok bawang deh. Sama,,,aku juga MABOK cabe neh >,<. Kebayang gak seeeehhh kalo ujian gimanaaaaaaa....ini aja ngerjain 1 soal butuh sejam lebiiiiiiiihhhh coooooyyyy......*banting2 buku*

Oke deh, daripada ntar ada yg kena epilepsi akut dadakan, mending udahin dulu deh yak ngetiknyeee...

Yuk Mariii (>,<)/

20 komentar:

  1. tolong !!!
    ak mabok angka !! (-____-)/

    BalasHapus
  2. maaf saya kurang paham,, bisa di jelaskan lagi,, #plakk,,tepuk jidat,,met siang aja dech ya,, met weekend

    BalasHapus
  3. @Yuz: wkwkkwkwk eh eh selamat menikmati yaaaaaaaaa =))

    @alKahfi: ini udh sy jelasin lg,,malah tetep nemplok disini wkkwkwkw...met weekend jg :D

    BalasHapus
  4. panjang banget kak... ak...ak... aku takut bacanya

    BalasHapus
  5. @Zihny: heheh ak sndri bingung hahaha...jgn dipaksa bca hehehe...ni mah buat review azza haha..

    BalasHapus
  6. jaan aku SD udah diajari ini lho
    BUdi beli kopi
    Ibunya budi banting gelas
    Budi numpahin susu
    susu dicampur kopi

    ah mbuh....

    eh masih inget yg buat login pake PHP yg kalo salah 3 kali bakal gak bisa login lagi?

    BalasHapus
  7. @Slam: wahahahha keren dun udh diajarin pelajaran abstrak pas SD :D
    haahahhaha ak ndak tw Slam,,,PHP udh bner2 "di luar kepala" wkwk =))

    driku kn cma nyasar di dunia pemrograman wkwkkw..pastinya anda lebih jago :)

    BalasHapus
  8. saya paham,hahahahahahaaaaaa......... walau agak lama saya blajarnya^^

    BalasHapus
  9. Ada aplikasinya gak?
    Klo ada minta donk.. hehehee
    email : bima_arjuna@yahoo.com

    BalasHapus
    Balasan
    1. waduh ga ada nih, kebetulan manual aja hehhehhe

      Hapus
  10. mbak nanya klu yang dihitung variable of mixed type gmn? variabel campuran atau database <-- kata lainnya variable of mixed type..

    BalasHapus
  11. Mantap pencerahannya :D

    BalasHapus
  12. terima kasih atas pencerahannya,, :D

    BalasHapus
  13. terima kasih atas pencerahannya,, :D

    BalasHapus
  14. nh aku juga ngerjain skripsi pake metode ini, yang jadi pertanyaan gimana carannya ngitung minimum support sama minimum confidence yang disoal tadi minimum supportnya 2 dan minimum confidencenya 60%.. bisa dibantu jawab tolong

    BalasHapus
  15. nh aku juga ngerjain skripsi pake metode ini, yang jadi pertanyaan gimana carannya ngitung minimum support sama minimum confidence yang disoal tadi minimum supportnya 2 dan minimum confidencenya 60%.. bisa dibantu jawab tolong

    BalasHapus
  16. nh aku juga ngerjain skripsi pake metode ini, yang jadi pertanyaan gimana carannya ngitung minimum support sama minimum confidence yang disoal tadi minimum supportnya 2 dan minimum confidencenya 60%.. bisa dibantu jawab tolong

    BalasHapus
    Balasan
    1. halo kak.. saya boleh bertanya. apakah kka sudah mendapatkan jawaban mengenai penentuan nilai minimumnya ? karena saya juga bingung dan tidak mengerti tentang hal ini.

      Hapus
  17. maaf, itu contoh data skala kecil, jika menggunakan data skala yang cukup besar misalkan dengan data transaksi dan data barang yang mencapai ribuan, saya kewalahan jika membuat matriks data transaksi dan kombinasi itemset secara manual. jika menggunakan ms.excel, apakah ada referensi rumus untuk perhitungan nya? terimakasih.

    BalasHapus

was wes wos...^^

Welcome Home Anta!

Cek cerita hilangnya Anta DI SINI Sekitar 2 minggu yang lalu, di malam Jumat yang syahdu, notifikasi HP berdering berkali-kali. Si pecint...