Kali ini kita akan bermain-main dengan data
no | Provinsi | Luas Daratan (km2) | Persentase luas* | Jumlah Pulau | Jumlah Penduduk** |
1 | Aceh | 57 956,00 | 3,03 | 663 | 4 406 464 |
2 | Sumatera Utara | 72 981,23 | 3,82 | 419 | 12 858 574 |
3 | Sumatera Barat | 42 012,89 | 2,20 | 391 | 4 790 621 |
4 | Riau | 87 023,66 | 4,55 | 139 | 5 365 358 |
5 | Kepulauan Riau | 8 201,72 | 0,43 | 2 408 | 1 607 257 |
6 | Jambi | 50 058,16 | 2,62 | 19 | 3 023 005 |
7 | Sumatera Selatan | 91 592,43 | 4,79 | 53 | 7 329 776 |
8 | Kepulauan Bangka Belitung | 16 424,06 | 0,86 | 950 | 1 189 669 |
9 | Bengkulu | 19 919,33 | 1,04 | 47 | 1 690 494 |
10 | Lampung | 34 623,80 | 1,81 | 188 | 7 526 448 |
11 | DKI Jakarta | 664,01 | 0,03 | 218 | 9 489 879 |
12 | Jawa Barat | 35 377,76 | 1,85 | 131 | 42 338 524 |
13 | Banten | 9 662,92 | 0,51 | 131 | 10 373 132 |
14 | Jawa Tengah | 32 800,69 | 1,72 | 296 | 32 289 825 |
15 | DI Yogyakarta | 3 133,15 | 0,16 | 23 | 3 426 637 |
16 | Jawa Timur | 47 799,75 | 2,50 | 287 | 37 236 149 |
17 | Bali | 5 780,06 | 0,30 | 85 | 3 817 447 |
18 | Nusa Tenggara Barat | 18 572,32 | 0,97 | 864 | 4 454 570 |
19 | Nusa Tenggara Timur | 48 718,10 | 2,55 | 1 192 | 4 599 034 |
20 | Kalimantan Barat | 147 307,00 | 7,71 | 339 | 4 361 613 |
21 | Kalimantan Tengah | 153 564,50 | 8,04 | 32 | 2 177 520 |
22 | Kalimantan Selatan | 38 744,23 | 2,03 | 320 | 3 563 602 |
23 | Kalimantan Timur | 204 534,34 | 10,70 | 370 | 3 435 081 |
24 | Sulawesi Utara | 13 851,64 | 0,72 | 668 | 2 245 329 |
25 | Gorontalo | 11 257,07 | 0,59 | 136 | 1 019 592 |
26 | Sulawesi Tengah | 61 841,29 | 3,24 | 750 | 2 590 092 |
27 | Sulawesi Selatan | 46 717,48 | 2,44 | 295 | 7 953 505 |
28 | Sulawesi Barat | 16 787,18 | 0,88 | – | 1 131 495 |
29 | Sulawesi Tenggara | 38 067,70 | 1,99 | 651 | 2 191 951 |
30 | Maluku | 46 914,03 | 2,46 | 1 422 | 1 495 939 |
31 | Maluku Utara | 31 982,50 | 1,67 | 1 474 | 1 015 647 |
32 | Papua | 319 036,05 | 16,70 | 598 | 2 701 705 |
33 | Papua Barat | 97 024,27 | 5,08 | 1 945 | 735 793 |
* terhadap luas Indonesia
** tahun 2009
Data diatas saya ambil dari BPS tepatnya dari Booklet BPS Agustus 2013. Itu data BPS lho jadi kevalidan datanya tidak usah kita ragukan lagi.
Dari tabel diatas, kita akan menghitung banyaknya angka pertama yang muncul.
Angka pertama, apa maksudnya?
Mudah saja angka pertama adalah angka awal dari suatu bilangan. Contohnya angka pertama dari 304 adalah 3, sedangkan 2 adalah angka pertama dari 212.
Oya satu aturan kecil dari angka pertama adalah kita mengabaikan nol sebagai angka pertama. Jika suatu bilangan dimulai dari nol maka yang dianggap angka pertama adalah angka selanjutnya yang bukan nol. Angka pertama dari 0,98 adalah 9 sedangkan 7 adalah angka pertama dari 0,07.
Pada kolom kedua (Data Luas daratan) diperoleh 1 paling sering muncul sebagai angka pertama daripada angka-angka lainya. Satu muncul 8 kali sebagai angka pertama. Itu berati kemumgkinannya adalah 8/33 = 24%.
Pada kolom ketiga (Data persentase luas) kembali 1 menjadi angka pertama yang serimg muncul, munculnya 9 kali. So… kemungkinannya adalah 9/33 = 27%.
Pada kolom keempat (Data banyaknya pulau) Lagi-lagi angka pertama yang paling sering nongol adalah 1, nongol sebanyak 10 kali. So… kemungkinannya adalah 10/33 = 30%
Pada kolom terakhir (Data jumlah penduduk) tetap satu menjadi angka pertama yang sering muncul sebanyak 9 kali. Kemungkinannya adalah 9/33 = 27%
Dapat kita tarik kesimpulan: Angka pertama yang sering muncul adalah 1 dengan kemungkinan sekitar 30%.
Sekarang yang menjadi pertanyaan:
Apakah itu kebetulan?
Tidak karena sudah sesuai dengan Hukum Benford atau disebut juga Hukum Angka pertama.
Secara sederhana hukum Benford menyatakan
Jika kita mengambil sembarang tabel data maka terdapat kemugkinan sekiatar 30 % angka pertama yang muncul adalah 1.
Secara formal hukum Benford meyatakan
Diberikan sembarang tabel data dan d ∈ {1, …, 9} maka kemungkina munculnya d sebagai angka pertama adalah
P(d) = log ((d+1)/d)
Jika dibuat grafik kemungkinan munculnya 1 sampai 9 menjadi angka pertama berdasarkan hukum Benford, diperoleh
Dari grafik terlihat hukum Benford mengatakan bahwa 1memiliki peluang terbesar mejadi angka pertama, selanjutnya 2 begitu seterusnya samapi dengan 9 yang memiliki peluang terkecil.
***
Fenomena munculnya 1 sebagai angka pertama terbanyak pertama kali disadari oleh Astromer Amerika Simon Newcomb pada tahun 1881, akan tetapi dia tidak mengeksplorasi lebih dalam. Barulah di tahun 1938, seorang fisikawan Frank Benford, meneliti fenomena ini secara seksama, dia mengamati lebih dari 20.000 tabel data (wuidih… buanyak banget) sebelum akhirnya dia merumuskan hukum Benford.
***
Hukum Benford sekarang dipakai untuk mengetahui kecurangan data (Data Fraud). Jika kau diberikan data ternyata data tersebut amat melenceng dari hukum Benford, kau harus curiga data tersebut palsu. Bisa dikatakan semua software audit mempunyai fungsi Hukum Benford
***
Tentu saja tidak semua data berlaku hukum Benford. Misalkan data ukuran Sepatu warga Bogor, mustahil sesuai hukum Benford karea ukuran sepatu terletak pada rentang 35 – 45.
Apa ada asumsi-asumsi lain yang harus dipenuhi agar hukum ini berlaku?
Jelas data yang agka depannya mustahil1 tidak akan berlaku hukum benford.
contohnya
data ukuran sepatu
data ukuran celana
Itu faktor penyebabnya apa ya, sampe hampir semua tabel data sedunia bisa kompak begitu?
Ada penjelasannya sich tapi saya masih belum paham