Eksplorasi data adalah langkah awal dalam analisis data yang melibatkan pemeriksaan data mentah untuk menemukan pola, mendeteksi anomali, menguji hipotesis, dan memeriksa asumsi dengan bantuan statistik ringkasan dan representasi grafis.
Langkah pertama dalam eksplorasi data adalah menampilkan lima baris pertama dari dataset. Berikut adalah contoh kode untuk menampilkan lima baris pertama dari dataset mtcars
:
# Menampilkan 5 baris pertama
head(mtcars, 5)
Langkah selanjutnya adalah menampilkan lima baris terakhir dari dataset. Berikut adalah contoh kodenya:
# Menampilkan 5 baris terakhir
tail(mtcars, 5)
Untuk melihat struktur dataset, kita dapat menggunakan fungsi str()
. Berikut adalah contoh kodenya:
# Melihat struktur dataset
str(mtcars)
Untuk melihat ringkasan statistik dari dataset, kita dapat menggunakan fungsi summary()
. Berikut adalah contoh kodenya:
# Melihat ringkasan statistik
summary(mtcars)
Untuk visualisasi distribusi data, kita dapat menggunakan histogram. Berikut adalah contoh kodenya:
# Membuat histogram
hist(mtcars$mpg, main = "Histogram of Miles per Gallon", xlab = "Miles per Gallon", border = "blue", col = "green", las = 1, breaks = 10)
Untuk visualisasi data numerik, kita juga dapat menggunakan boxplot. Berikut adalah contoh kodenya:
# Membuat boxplot
boxplot(mtcars$mpg, main = "Boxplot of Miles per Gallon", ylab = "Miles per Gallon", col = "orange", border = "brown")
Untuk melihat korelasi antar variabel dalam dataset, kita dapat menggunakan fungsi cor()
. Berikut adalah contoh kodenya:
# Melihat korelasi antar variabel
cor(mtcars)
Untuk visualisasi korelasi antar variabel, kita dapat menggunakan pairs plot. Berikut adalah contoh kodenya:
# Membuat pairs plot
pairs(mtcars, main = "Pairs Plot of mtcars Dataset", pch = 19, col = "blue")