Statistik telah lama menjadi bagian integral dari kehidupan. Orang-orang menghadapinya di mana-mana. Berdasarkan statistik, ditarik kesimpulan tentang di mana dan penyakit apa yang umum, apa yang lebih diminati di wilayah tertentu atau di antara segmen populasi tertentu. Bahkan konstruksi program politik calon badan pemerintah didasarkan pada data statistik. Mereka juga digunakan oleh rantai ritel saat membeli barang, dan produsen dipandu oleh data ini dalam proposal mereka.
Statistik memainkan peran penting dalam kehidupan masyarakat dan mempengaruhi setiap individu anggotanya, bahkan dalam hal-hal kecil. Misalnya, jika menurut statistik, kebanyakan orang lebih menyukai warna gelap pada pakaian di kota atau wilayah tertentu, maka menemukan jas hujan kuning cerah dengan cetakan bunga di toko lokal akan sangat sulit. Tapi berapa jumlahapakah data ini bertambah hingga memiliki dampak seperti itu? Misalnya, apa yang "signifikan secara statistik"? Apa sebenarnya yang dimaksud dengan definisi ini?
Apa ini?
Statistik sebagai ilmu terdiri dari kombinasi besaran dan konsep yang berbeda. Salah satunya adalah konsep “signifikansi statistik”. Ini adalah nama dari nilai variabel, probabilitas munculnya indikator lain yang diabaikan.
Misalnya, 9 dari 10 orang memakai sepatu karet di kaki mereka saat jalan pagi mencari jamur di hutan musim gugur setelah malam hujan. Probabilitas bahwa pada suatu saat 8 dari mereka memakai sepatu kanvas dapat diabaikan. Jadi, dalam contoh khusus ini, angka 9 adalah apa yang disebut “signifikansi statistik”.
Dengan demikian, jika kita mengembangkan contoh praktis yang diberikan lebih lanjut, toko sepatu membeli sepatu bot karet pada akhir musim panas dalam jumlah yang lebih besar daripada waktu lain dalam setahun. Dengan demikian, besarnya nilai statistik berdampak pada kehidupan sehari-hari.
Tentu saja, dalam perhitungan yang rumit, katakanlah, ketika memprediksi penyebaran virus, sejumlah besar variabel diperhitungkan. Tetapi esensi dari menentukan indikator signifikan dari data statistik adalah serupa, terlepas dari kerumitan perhitungan dan jumlah nilai variabel.
Bagaimana cara menghitungnya?
Digunakan saat menghitung nilai indikator "signifikansi statistik" dari persamaan. Artinya, dapat dikatakan bahwa dalam hal ini semuanya ditentukan oleh matematika. Opsi perhitungan paling sederhana adalah rantai operasi matematika, di mana parameter berikut terlibat:
- dua jenis hasil yang diperoleh dari survei atau studi data objektif, seperti jumlah pembelian, dilambangkan dengan a dan b;
- indikator ukuran sampel untuk kedua grup – n;
- nilai dari bagian sampel gabungan - p;
- kesalahan standar - SE.
Langkah selanjutnya adalah menentukan skor tes keseluruhan - t, nilainya dibandingkan dengan angka 1,96. 1,96 adalah nilai rata-rata, menyampaikan kisaran 95%, sesuai dengan fungsi distribusi-t Student.
Pertanyaan yang sering muncul adalah apa perbedaan antara nilai n dan p. Nuansa ini mudah diperjelas dengan sebuah contoh. Katakanlah signifikansi statistik loyalitas terhadap produk atau merek apa pun pria dan wanita dihitung.
Dalam hal ini, huruf-huruf akan diikuti oleh yang berikut:
- n - jumlah responden;
- p - jumlah kepuasan dengan produk.
Jumlah wanita yang diwawancarai dalam kasus ini akan ditetapkan sebagai n1. Dengan demikian, laki-laki - n2. Nilai yang sama akan memiliki angka "1" dan "2" dari simbol p.
Membandingkan nilai ujian dengan rata-rata lembar kerja Siswa menjadi apa yang disebut "signifikansi statistik".
Apa yang dimaksud dengan verifikasi?
Hasil perhitungan matematis apa pun selalu dapat diperiksa, ini diajarkan kepada anak-anak di sekolah dasar. Adalah logis untuk berasumsibahwa karena statistik ditentukan menggunakan rantai perhitungan, maka statistik tersebut diperiksa.
Namun, pengujian signifikansi statistik bukan hanya matematika. Statistik berurusan dengan sejumlah besar variabel dan berbagai probabilitas, yang jauh dari selalu dapat dihitung. Artinya, jika kita kembali ke contoh sepatu karet di awal artikel, maka konstruksi logis dari data statistik yang akan diandalkan oleh pembeli barang untuk toko dapat terganggu oleh cuaca kering dan panas, yang tidak biasa terjadi pada musim gugur.. Akibat fenomena ini, jumlah orang yang membeli sepatu karet akan berkurang dan gerai akan mengalami kerugian. Tentu saja, rumus matematika tidak mampu meramalkan anomali cuaca. Momen ini disebut “kesalahan”.
Itu hanya kemungkinan kesalahan tersebut dan memperhitungkan pemeriksaan tingkat signifikansi yang dihitung. Ini memperhitungkan indikator yang dihitung dan tingkat signifikansi yang diterima, serta jumlah yang secara konvensional disebut hipotesis.
Berapa tingkat signifikansinya?
Konsep "level" termasuk dalam kriteria utama signifikansi statistik. Ini digunakan dalam statistik terapan dan praktis. Ini adalah jenis nilai yang memperhitungkan kemungkinan kemungkinan penyimpangan atau kesalahan.
Tingkat didasarkan pada identifikasi perbedaan dalam sampel yang sudah jadi, memungkinkan Anda untuk menetapkan signifikansinya atau, sebaliknya, keacakan. Konsep ini tidak hanya memiliki makna digital, tetapi juga interpretasinya yang khas. Mereka menjelaskanbagaimana Anda perlu memahami nilainya, dan level itu sendiri ditentukan dengan membandingkan hasilnya dengan indeks rata-rata, ini mengungkapkan tingkat keandalan perbedaan.
Dengan demikian, kita dapat membayangkan konsep level secara sederhana - ini adalah indikator kesalahan yang dapat diterima, kemungkinan kesalahan atau kesalahan dalam kesimpulan yang diambil dari data statistik yang diperoleh.
Tingkat signifikansi apa yang digunakan?
Signifikansi statistik dari koefisien probabilitas kesalahan dalam praktik didasarkan pada tiga tingkat dasar.
Tingkat pertama adalah ambang batas di mana nilainya 5%. Artinya, probabilitas kesalahan tidak melebihi taraf signifikansi 5%. Ini berarti bahwa keyakinan pada ketidaksempurnaan dan ketidaksempurnaan kesimpulan yang dibuat berdasarkan data penelitian statistik adalah 95%.
Tingkat kedua adalah ambang 1%. Dengan demikian, angka ini berarti bahwa seseorang dapat dipandu oleh data yang diperoleh selama perhitungan statistik dengan kepercayaan 99%.
Tingkat ketiga - 0,1%. Dengan nilai ini, probabilitas kesalahan sama dengan sebagian kecil dari persen, yaitu, kesalahan praktis dihilangkan.
Apa yang dimaksud dengan hipotesis dalam statistik?
Kesalahan sebagai sebuah konsep dibagi menjadi dua bidang, mengenai penerimaan atau penolakan hipotesis nol. Hipotesis adalah suatu konsep yang di baliknya, menurut definisi, serangkaian hasil survei, data atau pernyataan lain disembunyikan. Yaitu, gambaran tentang distribusi probabilitas dari sesuatu yang berhubungan dengan mata kuliah akuntansi statistik.
Ada dua hipotesis dalam perhitungan sederhana - nol dan alternatif. Perbedaan di antara mereka adalah bahwa hipotesis nol didasarkan pada gagasan bahwa tidak ada perbedaan mendasar antara sampel yang terlibat dalam menentukan signifikansi statistik, dan alternatif yang sepenuhnya berlawanan dengan itu. Artinya, hipotesis alternatif didasarkan pada adanya perbedaan yang signifikan dalam sampel tersebut.
Apa kesalahannya?
Kesalahan sebagai konsep dalam statistik berbanding lurus dengan penerimaan hipotesis ini atau itu sebagai kebenaran. Mereka dapat dibagi menjadi dua arah atau jenis:
- tipe pertama adalah karena penerimaan hipotesis nol, yang ternyata salah;
- detik - disebabkan oleh mengikuti alternatif.
Jenis kesalahan pertama disebut false positive dan cukup umum di semua area di mana statistik digunakan. Oleh karena itu, kesalahan tipe kedua disebut negatif palsu.
Mengapa kita membutuhkan regresi dalam statistik?
Kepentingan statistik regresi adalah bahwa dengan bantuannya dimungkinkan untuk menetapkan seberapa banyak model berbagai dependensi yang dihitung berdasarkan data sesuai dengan kenyataan; memungkinkan Anda untuk mengidentifikasi kecukupan atau kekurangan faktor akuntansi dan kesimpulan.
Nilai regresi ditentukan dengan membandingkan hasil dengan data yang tercantum dalam tabel Fisher. Atau menggunakan analisis varians. Indikator regresi penting ketikastudi statistik yang kompleks dan perhitungan yang melibatkan sejumlah besar variabel, data acak dan kemungkinan perubahan.