Distribusi probabilitas adalah fungsi statistik yang menjelaskan semua nilai dan kemungkinan yang mungkin dari suatu variabel acak dalam rentang tertentu. Rentang ini dibatasi antara nilai minimum dan maksimum yang mungkin. Lokasi nilai kemungkinan pada distribusi probabilitas tergantung pada beberapa faktor, termasuk rata-rata (mean), simpangan baku (standard deviation), skewness, dan kurtosis dari distribusi tersebut.
Salah satu distribusi probabilitas yang paling umum adalah distribusi normal atau kurva lonceng, meskipun ada beberapa distribusi lain yang sering digunakan. Proses pembangkitan data dari suatu fenomena biasanya menentukan distribusi probabilitasnya. Proses ini disebut sebagai fungsi kepadatan probabilitas.
Distribusi probabilitas juga dapat digunakan untuk membuat fungsi distribusi kumulatif (CDF) yang menjumlahkan probabilitas kejadian secara kumulatif. CDF selalu dimulai dari nol dan berakhir pada 100%.
Akademisi, analis keuangan, dan manajer dana mungkin menentukan distribusi probabilitas dari suatu saham untuk mengevaluasi kemungkinan hasil yang diharapkan dari saham tersebut di masa depan.
Distribusi probabilitas diskret dan kontinu adalah dua jenis utama dari distribusi probabilitas, yang masing-masing menggambarkan berbagai jenis variabel acak. Memahami perbedaan di antara keduanya sangat penting untuk penerapan metode statistik dan interpretasi data yang benar.
Distribusi probabilitas diskret menggambarkan skenario di mana serangkaian hasil yang mungkin dapat dihitung dan terbatas atau tak terbatas yang dapat dihitung. Distribusi ini digunakan ketika variabel acak dapat mengambil nilai-nilai tertentu yang berbeda. Contohnya adalah jumlah sisi yang muncul dalam sepuluh lemparan koin atau jumlah pelanggan yang datang ke toko dalam satu jam. Dalam skenario ini, Anda dapat mencantumkan semua hasil yang mungkin, seperti 0, 1, 2, dan seterusnya. Distribusi probabilitas diskret biasanya lebih "bercak" karena terdapat lebih sedikit hasil yang mungkin.
Di sisi lain, distribusi probabilitas kontinu berlaku untuk variabel acak yang dapat mengambil nilai apa saja dalam rentang tertentu. Nilai-nilai ini tidak dapat dihitung karena terdapat kemungkinan tak terbatas dalam interval mana pun. Contohnya adalah tinggi badan individu dalam suatu populasi atau waktu yang diperlukan untuk menyelesaikan suatu tugas. Distribusi probabilitas kontinu dapat memiliki kurva distribusi yang lebih halus karena mungkin ada lebih banyak hasil yang mungkin.
Distribusi probabilitas memiliki banyak klasifikasi. Mereka termasuk distribusi normal, distribusi chi-square, distribusi binomial, dan distribusi Poisson. Distribusi-distribusi ini memiliki tujuan yang berbeda dan mewakili berbagai proses pembangkitan data.
Distribusi binomial mengevaluasi probabilitas suatu kejadian terjadi beberapa kali selama sejumlah percobaan yang diberikan probabilitas kejadian dalam setiap percobaan. Ini dapat dihasilkan dengan melacak berapa kali seorang pemain bola basket melakukan lemparan bebas dalam suatu permainan, di mana 1 = berhasil dan 0 = gagal.
Contoh lain adalah menggunakan koin dan menentukan probabilitas bahwa koin tersebut muncul sisi kepala dalam 10 lemparan berturut-turut. Distribusi binomial adalah diskret daripada kontinu karena hanya satu atau nol yang merupakan respons yang valid.
Distribusi yang paling umum digunakan adalah distribusi normal. Ini sering digunakan dalam keuangan, investasi, sains, dan teknik. Distribusi normal sepenuhnya ditandai oleh rata-rata (mean) dan simpangan baku (standard deviation). Distribusi ini tidak miring dan memiliki kurtosis.
Distribusi ini simetris dan digambarkan sebagai kurva berbentuk lonceng ketika dipetakan. Distribusi normal didefinisikan oleh rata-rata nol dan simpangan baku 1,0 dengan skewness nol dan kurtosis = 3.
Sekitar 68% dari data yang dikumpulkan dalam distribusi normal akan berada dalam +/- satu simpangan baku dari rata-rata. Sekitar 95% akan berada dalam +/- dua simpangan baku dan 99,7% akan berada dalam +/- tiga simpangan baku. Berbeda dengan distribusi binomial, distribusi normal adalah kontinu. Semua nilai yang mungkin diwakili daripada hanya nol dan satu dengan tidak ada yang di antaranya.
Distribusi Poisson adalah distribusi probabilitas diskret yang memodelkan jumlah kejadian yang terjadi dalam interval waktu atau ruang yang tetap. Kejadian-kejadian ini harus terjadi secara independen satu sama lain, dan tingkat rata-rata (jumlah kejadian rata-rata) harus konstan.
Ciri utama dari distribusi Poisson adalah bahwa distribusi ini menggambarkan probabilitas dari sejumlah kejadian yang terjadi dalam interval tertentu ketika kejadian-kejadian tersebut jarang dan independen.
Distribusi Poisson digunakan dalam berbagai aplikasi dunia nyata di mana kejadian terjadi secara acak dan independen. Contohnya, ini dapat memodelkan jumlah kedatangan pelanggan di bank dalam satu jam, jumlah email yang diterima dalam satu hari, atau jumlah panggilan telepon di pusat panggilan per menit.
Teorema batas tengah (CLT) adalah prinsip statistik yang menyatakan bahwa distribusi jumlah dari sejumlah besar variabel acak yang independen dan identik akan mendekati distribusi normal. Teorema ini penting karena memungkinkan ahli statistik membuat inferensi tentang parameter populasi meskipun distribusi populasi tidak diketahui, selama ukuran sampel cukup besar.
Salah satu implikasi utama dari CLT adalah bahwa untuk ukuran sampel yang besar, distribusi pengambilan sampel dari rata-rata sampel akan mendekati distribusi normal. Misalnya, bayangkan Anda memiliki sekelompok siswa di mana tinggi setiap siswa bervariasi, tetapi rata-rata mereka cenderung sekitar 5 kaki dengan beberapa variasi. Menurut CLT, distribusi rata-rata sampel tinggi badan akan cenderung mengikuti kurva normal (berbentuk lonceng).
Lihatlah angka yang diamati saat melempar dua dadu standar enam sisi. Setiap dadu memiliki probabilitas 1/6 untuk mendapatkan angka mana pun, dari satu hingga enam, tetapi jumlah dari dua dadu akan membentuk distribusi probabilitas yang digambarkan dalam gambar ini. Tujuh adalah hasil yang paling umum (1+6, 6+1, 5+2, 2+5, 3+4, 4+3). Dua dan dua belas jauh lebih jarang terjadi (1+1 dan 6+6).
Ada dua langkah untuk menentukan apakah distribusi probabilitas valid. Analisis harus menentukan dalam langkah pertama apakah setiap probabilitas lebih besar dari atau sama dengan nol dan kurang dari atau sama dengan satu. Langkah kedua menentukan apakah jumlah dari semua probabilitas sama dengan satu. Distribusi probabilitas valid jika kedua langkah tersebut benar.
Distribusi probabilitas digunakan dalam keuangan dengan dua cara utama:
Distribusi probabilitas yang paling umum digunakan adalah distribusi uniform, binomial, Bernoulli, normal, Poisson, dan eksponensial.
Probabilitas mengukur kemungkinan terjadinya suatu kejadian, dinyatakan sebagai rasio antara jumlah hasil yang menguntungkan dan jumlah total hasil yang mungkin. Odds, di sisi lain, mewakili rasio antara probabilitas terjadinya suatu kejadian dan probabilitas tidak terjadinya. Misalnya, jika probabilitas menang dalam suatu permainan adalah 0,25, odds-nya adalah 1:3 (1 kemenangan dibandingkan dengan 3 kekalahan).
Hukum Bilangan Besar menyatakan bahwa seiring dengan meningkatnya jumlah percobaan atau eksperimen, rata-rata hasil yang diperoleh mendekati nilai yang diharapkan atau probabilitas sebenarnya. Prinsip ini memastikan bahwa rata-rata sampel konvergen ke rata-rata populasi seiring dengan semakin banyaknya pengamatan yang dikumpulkan, memberikan stabilitas pada inferensi statistik.
Distribusi probabilitas menggambarkan semua nilai yang mungkin dari suatu variabel acak. Ini digunakan dalam investasi, terutama untuk menentukan kinerja yang mungkin dari suatu saham serta dalam komponen manajemen risiko investasi dengan membantu menentukan kerugian maksimum.