Scatter Plot adalah jenis grafik yang digunakan untuk memvisualisasikan hubungan antara dua variabel numerik dalam bentuk titik-titik yang tersebar di dalam bidang. Setiap titik mewakili sepasang nilai dari dua variabel yang berbeda. Tujuan utamanya untuk menunjukkan pola atau hubungan antara dua variabel.
Scatter Plot membantu dalam memvisualisasikan hubungan atau korelasi antara dua variabel. Ini dapat membantu dalam menentukan apakah ada hubungan antar keduanya.
Scatter Plot dapat digunakan untuk melihat apakah ada pola tertentu dalam distribusi titik-titik, seperti pola linear,pola non-linear, atau ketiadaan pola.
Korelasi Positif: Jika titik-titik cenderung bergerak dari kiri bawah ke kanan atas, maka ada kemungkinan terdapat korelasi positif antara kedua variabel.
Korelasi Negatif: Jika titik-titik cenderung bergerak dari kiri atas ke kanan bawah, maka ada kemungkinan terdapat korelasi negatif antara kedua variabel.
Tidak Ada Korelasi: Jika titik-titik tersebar acak di seluruh plot tanpa pola khusus, ini menunjukkan bahwa kedua variabel tersebut mungkin tidak memiliki hubungan.
Scatter Plot dibuat di R menggunakan Fungsi plot()
plot(x, y, main, xlab, ylab, xlim, ylim, axes)
x: Parameter ini menetapkan koordinat horizontal/variabel pertama.
y: Parameter ini menetapkan koordinat vertikal/variabel kedua.
xlab: Parameter ini adalah label untuk sumbu horizontal (sumbu x) pada scatter plot.
ylab: Parameter ini adalah label untuk sumbu vertikal (sumbu y) pada scatter plot.
main: Parameter main adalah judul dari grafik scatter plot.
xlim: Parameter ini digunakan untuk plotting nilai-nilai x.
ylim: Parameter ini digunakan untuk plotting nilai-nilai y.
axes: Parameter ini menunjukkan apakah kedua sumbu harus digambar pada plot.
Membuat Scatter Plot menggunakan data set "mtcars" dengan variabel "wt" dan "mpg".
input <- mtcars
print(head(input))
# Input Data
input <- mtcars[, c('wt', 'mpg')]
# Membuat Scatter Plot
plot(x = input$wt, y = input$mpg,
xlab = "Weight",
ylab = "Milage",
main = "Weight vs Milage")
Ketika kita memiliki dua atau lebih variabel dan kita ingin melihat korelasi antara satu variabel dengan variabel lain kita menggunakan scatter plot matiks.
pairs(formula,data)
formula: Parameter ini mewakili rangkaian variabel yang digunakan secara berpasangan.
data: Parameter ini mewakili set data dari mana variabel-variabel akan diambil.
Dapat dilihat dibawah ini cara membuat scatterplot matriks
pairs(~wt + mpg + disp + cyl, data = mtcars, main = "Scatterplot Matrix")
"~wt + mpg + disp + cyl" menunjukkan bahwa kita ingin membuat matriks scatterplot yang membandingkan hubungan antara variabel 'wt', 'mpg', 'disp', dan 'cyl' dari dataset 'mtcars'
Pada bagian terakhir ini kita akan mencoba membuat 3D scatter plot menggunakan plot_ly() dalam package plotly
library(plotly)
data <- mtcars
plot_ly(data, x = ~mpg, y = ~hp, z = ~cyl, color = ~gear, type = "scatter3d", mode = "markers")