Jumat, 16 Agustus 2013

materi SP (cleaning data)

saturday 17 agust 2013.

 semester pendek pun dimulai :) semester pendek dengan mata kuliah komputer dan e-learning dimulai pada pukul 09.00. aku sedikit terlambat karena harus balik lagi ke rumah untuk mengambil flashdisk yang ketinggalan di rumah. waah :O bisa gawat kalo pak usman tahu kalo belajar komputer tapi lupa bawa flashdisk. itu sama aja pergi ke sawah tapi lupa bawa cangkul. apa yang mesti dikerjain kalo hal sepenting itu bisa lupa. setibanya di labor komputer hari udah nunjukin jam 09.20, setelah nyampe lapor sama bapak kalo aku telat. minta izin apa boleh ikut pelajaran atau gak. alhamdulillah boleh YEY !!


materi pertama pun dimulai. penggabungan data yang dikirim bapak lewat draf C harus digabungin. sebelum digabung harus buka program epidata. untuk menggabungkan data kita bisa klik di menu data in/out. setelah itu kita BROWSE data yang mau kita gabungin. setelah itu kita kasih nama file yang udah digabungin. untuk langkah selanjutnya kita gunakan hasil penggabungan dari kedua file tadi untuk digabungkan dengan file seterusnya . gak ngerti ya ?

jadi gini lo : misal file a digabungin jadi file b hasilnya file
1. untuk penggabungan selanjutnya file 1 kita gabung dengan file c dan hasilnya dikasih nama file
2. trus file 2 digabungin dengan file d hasilnya dikasih nama file
3. begitu seterusnya. setelah hasil final dari data yang udah digabungin, kita lakukan eksport data. dengan men-klik menu eksport data -- klik spss trus oke.

setelah itu kita buka program spss, klik menu file -- open -- syntax -- buka file yang telah kita eksport dari epidata tadi -- oke. untuk melihat apakah ada data kategori yang terdapat missing, kita juga bisa melihatnya dengan mengklik menu analiyze -- descriptive statistik -- frequensis -- lalu kita pilih mana data kategori yang akan kita lihat missing atau tidaknya. jika terdapat missing, kita lakukan untuk men-sort data dengan meng klik menu data -- sort cases -- pilih kategori mana yang akan kita lihat (ex : tinggi badan) pilih TB -- asending -- oke.

tujuannya agar kita bisa lebih mudah melihat mana diantara data kita yang tidak sesuai , tidak konsisten, tidak sesuia aturan (missing). setelah data kita lakukan assending, maka data yang missing akan muncul pada baris paling atas. kita hanya melihat pada bagian atas dari Data view. lakukan penghapusan dengan melihat berapa jumlah data kiata yang missing.

misal ; data kita missing ada 2456. maka lakukan penghapusan sebanyak 2456 pada data view. untuk melakukan pengujian apakah data yang sudah kita lakukan penghapusan sudah tidak ada missing lagi lakukan uji dengan menampilkan hasil dari frequensis tadi ( langkahnya seperti yang tertera diatas).

jika missingnya sudah 0 berarti data kita sudah bersih. lakukan seperti langkah diatas untuk pengujian data kategorik lainnya. untuk pengujian data numerik cara diatas tidak dapat dilakukan. tapi kita dapat mengetahuinya dengan cara mensort data numerik yang akan kita lihat. karena bisa jadi pada tampilan output terdapat missing yang sebenarnya tidaklah missing. untuk melihat apakah data numerik kita ada yang tidak sesuai (missing) maka kita perlu batasan. misalnya : untuk TB batas 140 - 175.
pada data view kita hanya mengklik menu data -- sort cases -- asending -- oke. untuk melihat apakah ada tinggi badan yang dibawah 140 cm. jika ada lakukan penghapusan. setelah itu, lakukan desending dengan langkah yang sama , untuk melihat apakah tiggi badan ada yang melebihi 175 cm.

jika ada lakukan penghapusan. sebenarnya ada cara yang lebih sederhana, dengan mengklik menu transform -- recode into same variabels -- lalu pilih data -- setelah itu tandai pada kolom old value angka yang akan menjadi missing (misal 0 ) -- lalu di kolom value di sebelah kanan new value angka yang besar -- oke. ini akan membedakan mana data yang tidak sesuai dengan aturan. untuk melihat berapa responden yang mengajukan suara (misalnya pemeriksaan kehamilan). responden yang memberikan suara ada sebanyak 48765 sedangkan responden yang mengatakan pernah melakukan pemeriksaan kehamilan ada sebanyak 48691. jadi perbedaan inilah yang dapat dilihat dengan mengklik menu analyze -- descriptive statistik -- frequensis -- lalu masukan data yang akan kita lihat perbandingannya.

perbandingan akan terlihat pada menu output. akan terlihat perbedaan responden yang pernah melakukan pemeriksaan dan yang tidak pernah melakukan pemeriksaan kehamilan . jadi inilah yang aku pahami setelah semester pendek mata kuliah komputer pada hari ini. mungkin masih banyak lagi yang dipelajari tapi tak bisa diungkapkan dengan kata kata yang terstruktur :) good luck for today

Tidak ada komentar:

Posting Komentar