Jumat, 30 Juli 2021

CONDITIONAL PROBABILITY DAN ATURAN PERKALIAN

Juli 30, 2021 No comments

CONDITIONAL PROBABILITY DAN ATURAN PERKALIAN

- Conditional Probability adalah probabilitas kemunculan suatu event, dengan mengetahui bahwa event lain sudah muncul atau terjadi.

P ( B/A) probability of B given A.

- Independent Events

Dua events adalah independent bila kemunculan dari event yang satu tidak mempengaruhi probability kemunculan event kedua.

P(B/A) = P (B)

P(A/B) = P(A)

- Dependent Events

Events yang tidak independent dikenal sebagai dependent events.

P(B/A) /= P (B)

- The Multiplication Rule

Untuk mencari probability dari dua events yang muncul secara berurutan, kita bisa memanfaatkan Multiplication Rule.

1.Probability untuk dua buah events (A dan B) untuk muncul secara berurutan

2 Bilamana kedua events (A dan B) tersebut independent, maka bisa disederhanakan

PROBABILITAS DASAR

Juli 30, 2021 No comments

PROBABILITAS DASAR
Probability adalah pengukuran terhadap suatu kemungkinan atau peluang. Pemahaman terkait probability merupakan dasar untuk melangkah ke Statistika Inferensi ( Inferential Statistics ).
- Terminologi
● Hasil dari suatu percobaan ( trial ) dikenal sebagai outcome.
● Himpunan dari seluruh kemungkinan outcome pada suatu probability experiment dikenal sebagai sample space.
● Bagian dari sample space dikenal sebagai event.
● Event bisa terdiri dari satu atau lebih outcomes.

- Probability Experiments adalah aksi atau percobaan ( trial ) yang menghasilkan suatu perhitungan, pengukuran, atau respon ( counts, measurements, or responses ).
- Tree Diagram
Tree Diagram digunakan untuk memberikan gambaran secara visual terkait setiap outcome dari suatu probability experiment.
- Event
● Event umumnya direpresentasikan dengan huruf kapital (uppercase letters), seperti A, B, dan C.
● Suatu event yang terdiri dari sebuah outcome dikenal sebagai simple event.
- Fundamental Counting Principle
● Pemanfaatan Tree Diagram untuk menghitung banyaknya outcome dari sejumlah event tidaklah praktis.
● Sebagai alternatif, kita bisa memanfaatkan Fundamental Counting Principle untuk mengetahui jumlah kemungkinan outcomes dari dua atau lebih event yang muncul secara berurutan.

- Empirical (statistical) Probability: contoh
Suatu perusahaan melakukan survey online dengan memilih sejumlah responden secara acak untuk dimintai keterangan seberapa sering mereka melakukan recycle. Sejauh ini mereka mendapatkan data dari 2,451 responden.

PENGUKURAN POSISI DATA

Juli 30, 2021 No comments

10. PENGUKURAN POSISI DATA

Measure of Position dapat dideﬁnisikan sebagai suatu pengukuran nilai yang digunakan untuk menentukan posisi relatif dari suatu entri data (data point) pada dataset.

Terdiri dari;

- Quartile (Kuartil)

Quartile adalah nilai yang membagi suatu dataset terurut menjadi empat bagian yang sama. Terdapat tiga nilai quartile, yaitu: Q1, Q2, dan Q3

- Interquartile Range (IQR)

Interquartile Range (IQR) adalah measure of Variation (pengukuran keberagaman/sebaran data) dengan menselisihkan nilai quartile ketiga dan quartile pertama.

IQR = Q3 - Q1.

Deteksi Outlier dengan IQR

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila:

● Lebih kecil dari Q1-1.5(IQR)

● Lebih besar dari Q3+1.5(IQR)

- Percentile (Persentil)

Percentile adalah nilai yang membagi suatu dataset terurut menjadi 100 bagian yang sama. Terdapat 99 nilai percentaile, yaitu: P1, P2, …, P99

● P25 menunjuk posisi yang sama dengan Q1

● P50 menunjuk posisi yang sama dengan Q2

● P75 menunjuk posisi yang sama dengan Q3

Deteksi Outlier dengan Percentile

Entri data (data point) pada suatu dataset bisa dikategorikan sebagai outlier bila: ● Lebih kecil dari P5 ● Lebih besar dari P95 .

- Standard Score (z-score)

Standard Score (z-score) merepresentasikan nilai simpangan suatu entri data terhadap mean dari dataset yang diukur berdasarkan standard deviation. Nilai z-score bisa negatif, positif, atau nol.

PENGUKURAN SEBARAN DATA

Juli 30, 2021 No comments

9. PENGUKURAN SEBARAN DATA
Measure of Variation/ pengukuran sebaran data dapat dideﬁnisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan keberagaman atau sebaran data.
Yang terdiri dari ; Range, Variance, Standard Deviation.
- Range (Jangkauan) Range dari suatu dataset merupakan hasil perhitungan selisih antara nilai tertinggi dengan nilai terrendah pada dataset tersebut.
Pengukuran nilai keberagaman dengan menggunakan range memiliki kelemahan di mana hanya menyertakan dua nilai saja dalam proses pengukuran.

- Variance (Variansi)
Variance dari suatu dataset merupakan hasil perhitungan rerata simpangan tiap entri data pada dataset terhadap nilai mean dari dataset tersebut.

- Standard Deviation (Simpangan Baku) Kelemahan utama dari Variance adalah nilai yang dihasilkan tidak lagi memiliki satuan yang sama dengan entri data. Kelemahan ini dapat diatasi dengan Standard Deviation.

Coefficient of Variation
● Standard Deviation dapat digunakan untuk membandingkan keberagaman/sebaran data antar dataset yang memiliki satuan pengukuran yang sama dengan nilai mean yang mirip.
● Sedangkan untuk dataset yang memiliki satuan pengukuran yang berbeda atau nilai mean yang jauh berbeda, maka kita mesti menggunakan Coeﬃcient of Variation.

PENGUKURAN TENDENSI SENTRAL

Juli 24, 2021 No comments

Measure of Central Tendency dapat dideﬁnisikan sebagai suatu pengukuran nilai yang dapat digunakan untuk merepresentasikan nilai tipikal atau sentral dari suatu dataset.

Didalamnya terdapat ; mean, median, mode

- Mean

Mean dari suatu dataset merupakan penjumlahan dari keseluruhan entri pada dataset dibagi dengan banyaknya entri pada dataset tersebut.

- Median

Median dari suatu dataset merupakan nilai yang berada di tengah dengan mengacu pada nilai dataset yang sudah terurut.

● Untuk dataset dengan jumlah entri ganjil, nilai median dapat diperoleh dari nilai yang tepat berada di tengah.

● Untuk dataset dengan jumlah entri genap, nilai median diperoleh dari rerata dua nilai yang berada di tengah.

- Mode

Mode dari suatu dataset merupakan nilai dari dataset yang memiliki frekuensi kemunculan paling tinggi.

● Suatu dataset dapat memiliki lebih dari satu mode (multi-modal).

● Suatu dataset juga bisa saja tidak memiliki mode, ketika frekuensi kemunculan dari tiap datanya sama.

Kelebihan dan Kekurangan Mean

● Mean cukup bisa diandalkan karena mean memperhitungkan setiap entri dari dataset yang kita miliki.

● Mean sangat rentan terhadap outlier.

● Median bisa dijadikan alternatif bilamana terdapat outlier pada dataset.

* Weighted Mean

Weighted Mean adalah nilai rerata dari suatu dataset di mana setiap entrinya memiliki bobot tertentu.

* Mean of Grouped Data (Frequency Distribution)

estimasi nilai rerata dari suatu dataset yang sudah dikelompokkan ke dalam format distribusi frekuensi.

VISUALISASI DATA DALAM STATISTIKA

Juli 24, 2021 No comments

Beberapa teknik visualisasi data yang akan dipelajari:

● Stem and Leaf Plot

● Dot Plot

● Pie Chart

● Bar Plot

● Scatter Plot

● Time Series Chart

● Visualisasi Data dengan Python

Beberapa karakteristik yang umum digunakan untuk mendeskripsikan data yang kita miliki adalah dengan mencari tahu titik tengah data (center), variasi/sebaran data (variability/spread), dan bentuk data (shape).

● Ini bisa dicapai bila data yang kita miliki dikelola dengan baik; salah satu cara yang paling mudah untuk mengelola data adalah dengan memanfaat distribusi frekuensi (frequency distribution)

Distribusi Frekuensi (Frequency Distribution)

● Distribusi frekuensi adalah bentuk pengelolaan data di mana data dikelompokkan ke dalam beberapa kelas (classes) berdasarkan interval tertentu.

● Jumlah kemunculan data untuk tiap kelas akan dihitung dan dikenal sebagai frekuensi dari kelas.

Contoh :

● Terdapat 6 classes

● Antar classes tidak ada overlap

● Setiap class memiliki: ○ Lower Class Limit: 1, 6, 11, 16, 21, 26 ○ Upper Class Limit: 5, 10, 15, 20, 25, 30 ○ Class Width: 5

PENGUMPULAN DATA

Juli 24, 2021 No comments

Pengumpulan Data

Census

Pengumpulan data dilakukan pada tingkat populasi. Alhasil, akan diperoleh informasi yang sifatnya lengkap. Hanya saja ketika ukuran populasinya sangat besar, maka seringkali census menjadi pilihan yang mahal dan sulit untuk dilakukan

Sampling

Pengumpulan data dilakukan pada sub bagian dari populasi. Alhasil, informasi yang diperoleh sifatnya tidak lengkap. Pendekatan semacam ini cukup umum ditemui dalam studi statistik. Di sini sample yang baik adalah sample yang dapat merepresentasikan populasinya. Dibutuhkan teknik sampling yang tepat untuk mendapatkan sample yang representatif terhadap populasinya.

- Sampling Error

Karena sample merupakan sub bagian dari populasi, maka selisih atau perbedaan nilai antara data sample dan data populasi akan selalu ada. Bahkan dengan teknik sampling sebaik apapun, sampling error ini tidak dapat dihindarkan.

- Sampling: with/without Replacement

Sampling with replacement: Memungkinkan satu anggota populasi untuk terpilih lebih dari satu kali sebagai anggota sample.

Teknik Sampling (Sampling Techniques)

● Simple Ramdom Sampling

● Stratiﬁed Sampling

● Cluster Sampling

● Systematic Sampling

● Convenience Sampling

- Sampling Technique: Simple Random Sampling

Simple random sampling merupakan teknik pengumpulan data yang dilakukan secara acak di mana setiap anggota populasi memiliki peluang yang sama untuk dapat terpilih sebagai anggota sample.

- Sampling Technique: Systematic Sampling

Systematic sampling merupakan teknik pengumpulan data berdasarkan interval tertentu. Teknik sampling ini terbilang cukup mudah untuk diterapkan. Hanya saja teknik ini tidak dapat diterapkan bila ditemui adanya pola yang sifatnya konsisten dan sistematis pada data kita.

- Sampling Technique: Convenience Sampling

Convenience sampling merupakan teknik pengumpulan data yang bisa dibilang asal atau sembrono dan hanya berorientasi pada kemudahan. Ini merupakan teknik pengumpulan data yang buruk dan sangat rentan terhadap bias.

DESAIN EKSPERIMEN

Juli 17, 2021 No comments

DESAIN EKSPERIMEN dalam STATISTIKA

STUDI STATISTIK (statistical Study)

> Studi Observasi(Observation Study)

Seorang peneliti hanya melakukan pengamatan terhadap subjek (e.g., pengukuran karakteristik) tanpa melakukan tindakan apapun yang dapat mempengaruhi hasil pengamatan.

> Studi Eksperimen (Experimental Study)

Seorang peneliti menerapkan satu treatment tertentu terhadap subjek sebelum melakukan pengamatan memahami efek dari treatment yang diberikan.

Observation Study : contoh

Sebuah penelitian dilakukan untuk mengamati laju kecepatan kendaraan yang melintas Merdeka pada pukul 10 sampai dengan 12 malam

Pengukuran kecepatan kendaraan dilakukan dengan bantuan speed gun selama 90 hari

Experimental Study : contoh

Sebuah penelitian dilakukan untuk mengamati efek dari pemberian suplemen vitamin D3 140 pasien dengan tingkat antibodi rendah.

Sebanyak 7-0 pasien menerima 4000 IU vitamin D3 per hari selama 1 tahun dan 70 pasien sisanya menerima placebo.

Hasil pengamatan terhadap dua kelompok pasien ini dibandingkan

Desain Eksperimen (Experimental Design)

Kendali (Control)
Pengacakan (Randomisation)
Replikasi (Replication)

Experimental Design : Control (Kendali)

Gambar

Experimental Design: Control(Kendali)

Kendali (control) dapat dilakukan dengan menerapkan

> Bilinding

> Double Blinding

Bilinding

>Subjek eksperimen tidak mengetahui apakah seorang subjek menerima treatment atau placebo

Double Blinding

> Baik peneliti maupun subjek eksperimen tidak mengetahui apakah seorang subjek menerima treatment atau placebo

> Dibutuhkan pihak ketiga untuk mendistribusikan treatment dan plasebo kepada subjek eksperimen

Experimental DesignL Randomisation (Pengacakan)

Random Blocked Design

> Keseluruhan subjek eksperimen akan dikelompokkan berdasarkan kesamaan karakteristik tertentu (e.g., rentang usia, jenis kelamin)

> Subjek di tiap kelompok dipilih secara acak untuk dimasukkan dalam treatment group dan control group.

Experimental Design : Replication (replikasi)

Untuk meningkatkan validitas dari hasil eksperimen, dibutuhkan replikasi atau pengulangan eksperimen dengan kondisi serupa atau mirip.

Replika melibatkan subjek eksperimen yang berbeda, dengan demikian replika juga akan memperbesar ukuran dari subjek eksperimen (sample size) yang juga dapat menunjang validitas dari eksperimen.

Dengan Eksperimen (contoh)

Sebuah perusahaan mendesain suatu eksperimen untuk menguji efektivitas dari suatu produk permanen karet yang dikembangkan membantu seorang yang ingin berhenti merokok.

Sepuluh orang perokok berat dilibatkan sebagai subjek eksperimen. Lima orang di antaranya diberikan permen karit dan lima sisanya diberikan plasebo. Setelah dua bulan berjalan, kesepuluh subjek eksperimen ini dievaluasi dan didapati kelima subjek penerima permen karet telah berhenti merokok.

Apakah kita bisa menyimpulkan bahwa produk permen karet ini efektif? Permasalahan apa yang terdappat pada desaion exsperimen ini?

Tentang dalam Experimental Study

Confounding/Lurking variable

> Faktor eksternal (dan tidak perhitungkan sebelumnya) yang berpotensi memberikan pengaruh terhadap eksperimen.

Placebo effect

> Subjek eksperimen memberikan reaksi positif walau subjek tersebut menerima placebo (treatment palsu)

Hawtgire effect

> Perubahan perilaku dari subjek eksperimen setelah mengetahui bahwa terlibat eksperimen.

KLASIFIKASI DATA

Juli 16, 2021 No comments

KLASIFIKASI DATA

Klasifikasi data dapat dibagi menjadi 2 yaitu :

Data Kualitatif(Qualitative) berasosiasi Adalah data non numerik yang berfokus pada Atribut dan Label

Data Kuantitatif(Quantitative) Data numerik yang dihasilkan melalui prosesPenghitungan dan pengukuran

Contoh :

Skala pengukuran (Level of Measurements)

dan terdapat 4 skala pengukuran (Level of Measurements) dalam bidanag statistika

Nominal
Ordinal
Interval
Rasi(Ratio)

Skala Pengukuran Nominal

Berasosiasi dengan tipe data kualitatif
Berfokus pada pengelompokan atau pengkategorian berdasarkan nama, label, atau kualitas
Tidak dapat dikenakan operasi matematika
Contoh : (merek kendaraan, kota kelahiran, nama seseorang, nomor kendaran.

Skala Pengukuran Ordinal

Berasosiasi dengan tipe data kuantitatif
Data dapat dikelompokkan
Data dapat disusun berdasarkan urutan, perangkat, atau rangking.
Tidak dapat dikenakan operasi matematk
Conton : (tingkat kepuasan pelanggan : “sangat baik, cukup,puas, sejuk dan dingin)

Skala Pengukuran Interval

Berasosiasi dengan tipe data kuantitatif
Data dapat dikelompokkan
Data dapat disusun berdasarkan urutan, peringkat atau rangking.
Dapat dikenakan operasi matematika untuk menghitung selisih nilai
Nilai numerik merepresentasikan posisi pada suatu skala ukur tertentu
Tidak memiliki nilai nol yang absolut (no inthernet zero)
Tidak dapat dikenakan operasi matematika terkait perkalian
Contoh : (temperatur udara 32 derajat celcuis, tahun 2020)

Skala Pengukuran Rasio (Ratio)

Berasosiasi dengan tipe data kuantitatif
Data dapat dikelompokkan
Data dapat disusun berdasarkan urutan, peringkat, atau rangking
Dapat disusun berdasarkan urutan, peringkat, atau rangking.
Memiliki nilai nol yang absolut (inhernet zero)
Datap dikenakan operasi matematika terkait perkalian
Contoh : (usia anak 7 tahun, berat badan 65 Kg, harga nasi goreng Rp.25.000,00)

PENGANTAR STATISTIKA

Juli 09, 2021 No comments

Mengapa perlu belajar statistika ?

Karena kita telah memasuki masa dimana masanya sebuah data bisa di muat dalam bentuk digital, atausudah memasuki masa 4.0 dimana banyak sekali cabang data yang muncul dalam era 4.0 yaitu

Data Warehouse
Data Meaning
Big Data Analisis
Machine Learning
Data Sience

Dengan adanya cabang-cabang data yang telah ada maka diperlukan bagi kita untuk mempelajari yang namanya ilmu Statistika, dimana Statistika sendiri adalah dasar dari cabang data-data yang di atas.

Statistika sendiri adalah cabang keilmuan yang mencakup dari

Pengumpulan sebuah data
Pengelolaan
Analyzing dan
Interpretasi data

Sedangkan data dalam statistika dapat diperoleh dengan cara Pengamatan, Penghitungan, Pengukuran, dan Responsi dari sebuah topik yang akan di uji.

Data Set dalam Statistika dapat dibagi menjadi 2, yaitu Populasi dan Sampel,

Populasi adalah kumpulan dari Pengamatan, Penghitungan, pengukuran, Responsi dari sebuah topik yang akan diuji.

Sedangkan sampel adalah
>Bagian dari populasi
> Sampel yang baik adalah sampel yang representatif terhadap populasi, sehingga dapat ditarik kesimpulan dari populasi itu sendiri.
> Oleh karenanya data sampel harus dikumpulkan dengan metode yang tepat (e.g, random sampling)

Gambaran sampel dan populasi

Jadi sampel hanya memiliki sebagian data yang dimiliki oleh populasi, dengarkan sang populasi sendiri memberikan sebagian data kepada sampel

Contoh dari sampel :
Universitas teknokrat indonesia mengadakan Sosialisasi Prodi Informatika yang akan dilaksanakan pada tanggal 30 september 2021 yang akan diikuti oleh seluruh mahasiswa Prodi Informatika.

Contoh dari Populasi :
Dalam penerimaan mahasiswa di universitas teknokrat indonesia, terdata bahwa dari seluruh siswa yang mendaftar di seluruh prodi terdapat 75% siswa yang melebihi standar kelulusan tes masuk di Universitas Teknokrat Indonesia.

Terdapat dua istilah atau terminologi lain dalam statistika yaitu :

Statistika Deskriptif (Descriptive Statistics)

Cabang ilmu statistika yang bercabang pada

Pengelolaan data (Organization)
Peringkasan data (Sumarsitation)
Visualisasi data(display/visualisation)

Statistik Inferensi(Inferential Statistic)

Cabang ilmu statistika yang berfokus pada pemanfaatan sampel untuk menarik kesimpulan pada populasi

Contoh dari Statistika Inferensi :
> Sejumlah pria dewasa berusia 48 tahun dilibatkan dalam satu program penelitian selama 18 tahun, berdasarkan data pengamatan diprediksi bahwa 70% dari pria yang tidak menikah akan bertahan hidup pada usia 65 tahun, dan 90% pria yang menikah akan hidup pada usia 65 tahun.

Contoh Statistika Deskriptif :
> Berdasarkan data sampel yang diperoleh dari Wall Street, didapati kesalahan yang dilakukan oleh analisis dalam melakukan prediksi dalam perusahaan IT pada tahun ini mencapai 44%

Add

Jumat, 30 Juli 2021

CONDITIONAL PROBABILITY DAN ATURAN PERKALIAN

PROBABILITAS DASAR

PENGUKURAN POSISI DATA

PENGUKURAN SEBARAN DATA

Sabtu, 24 Juli 2021

Sabtu, 17 Juli 2021

DESAIN EKSPERIMEN dalam STATISTIKA

STUDI STATISTIK (statistical Study)

Jumat, 16 Juli 2021

KLASIFIKASI DATA

Skala Pengukuran Nominal

Skala Pengukuran Interval

Skala Pengukuran Rasio (Ratio)

Jumat, 09 Juli 2021

Mengapa perlu belajar statistika ?

Data Set dalam Statistika dapat dibagi menjadi 2, yaitu Populasi dan Sampel,

Statistika Deskriptif (Descriptive Statistics)

Statistik Inferensi(Inferential Statistic)

Social Profiles

Adsense

Archive

Labels

Blog Archive

Back Link

Sosial media