Sei sulla pagina 1di 25

EKSPLORATORY

DATA ANALYSIS
Pengertian Statistika
Statistika adalah ilmu yang mempelajari bagaimana data
dikumpulkan, disajikan, dianalisis dan diinterpretasikan
untuk mengambil kesimpulan keseluruhan populasi
berdasarkan data sampel (generalisasi)

Pada dasarnya statistika dibagi menjadi dua bagian yaitu :

Stastistika Deskriptif : statistika yang mempelajari


bagaimana data disajikan dan diringkas.

Statistika Inferensial : statistika yang mempelajari


populasi berdasarkan sampel
STATISTIK DESKRIPTIF
Statistik yang mempelajari bagaimana data
disajikan dan diringkas.

 MENYAJIKAN DATA
 MERINGKAS DATA

3
MENYAJIKAN DATA

TABEL FREKUENSI

ARTIKAN TABEL DI ATAS 4


6
TABULASI SILANG UNTUK 2 VARIABEL KATAGORIK

9
PENYAJIAN DATA KONTINU
HISTOGRAM

10
MEASURES OF CENTRAL TENDENCY
MODE
Mode of a set of measurements is defined to be
the measurement that occurs most often (with
the highest frequency)

Weight data (in pounds)


962 1005 1033 980 965
963 989 955 1015 1000
1042 1005 995 1030 970

MODUS = 1005
11
MEDIAN
The median of a set of measurements is defined to be the
middle value when the measurements are arranged from
lowest to highest
SAT score :
95 86 78 90 62 73 89 92 84 76

Arranged SAT score


62 73 76 78 84 86 89 90 92 95

Median = (84 + 86) / 2 = 85

12
ARITHMATIC MEAN OR MEAN

Mean of a set of measurements is defined to be the sum of


the measurements divided by the total number of
measurements
µ is mean of population

X is mean of a sample
Find mean for grouped data !!!!

MEAN IS SUBJECT TO DISTORTION DUE TO THE PRESENCE OF


ONE OR MORE EXTREME VALUES IN THE SET OF MEASUREMENTS

13
UKURAN PENYEBARAN DATA

• Ukuran pemusatan data tidak berarti jika


tidak disertai ukuran penyebaran data
• Perlu diketahui bagaimana data menyebar
sekitar ukuran pemusatan

• Jika ukuran penyebaran data kecil berarti


data terletak di sekitar pusat dan pusat dapat
mewakili data dengan baik
Jika ukuran penyebaran data besar berarti
data terletak jauh dari pusat dan pusat
tersebut kurang mewakili data
14
So far, you have learned about mean, median, and mode. These are
essential items in statistics, but they are by no means the only important
statistical measures.

There is a joke that goes, "If a statistician had her hair on fire and her
feet in a block of ice, she would say that 'on the average' she felt good."
Of course, this is a silly example, but to what is this unfortunate
statistician referring? What is she ignoring?

15
The NATIONAL WEATHER SERVICE O'HARE AIRPORT (Chicago, IL)
reported the following temperature information for June 15, 1996.

Temperature Information for Chicago (in degrees Fahrenheit)

Mean
71 (21.7 C)
Temperature
High Temperature 84 (28.8 C)
Low Temperature 57 (13.9 C)

Knowing this information, how would you dress for the day? 21.7 degrees is a fairly
comfortable mean temperature, but 13.9 can be a little on the chilly side and 28.8 is
a little warm. So, can you see how it is important to know more than just the mean
of a data set?

On this day, there was a range of 27 degrees Fahrenheit. The highest point was 84
and the lowest was 57. Thus, the range is found by subtracting 57 from 84.
16
MEASURES OF VARIABILITY
RANGE
Range of a set of measurements is defined to be the difference
between the largest and the smallest measurements of the set
For grouped data, because we do not know the individual
measurements, the range is taken to be the difference between the
upper limit of the last interval and the lower limit of the first interval.

17 18 21 25 31 45 50 Range = 33
17 17 17 17 17 17 50 Range = 33
17 50 50 50 50 50 50 Range = 33

RANGE DOESN’T CARE WITH THE DETAIL OF THE


DATA. IT DEPEND ONLY ON THE LARGEST AND THE
SMALLEST OF THE DATA 17
VARIANSI DAN STANDAR DEVIASI
Variansi data sampel (biasanya diberi simbol S2)
memperhitungkan simpangan setiap data dari
meannya

 X X
n
2
i
S2  1
n 1
Standar deviasi data sampel (S) adalah akar
dari variansi

18
COEFFICIENT OF VARIATION
Coefficient of variation measures the variability in the
values in a population relative to the magnitude of the
population mean. σ
CVpopulasi =
|μ|
S
CVsampel = *100%
X

CV measures degree of variability.

19
BAGAN
PENGARUH

VARIABEL DEPENDENT VARIABEL METODE


BEBAS
Kontinu Katagorik Anova/ Non Parametrik

Kontinu Kontinu Regresi

Katagorik Katagorik Tabulasi Silang


Khusus

Katagorik Kontinu Regresi Logistik


HUBUNGAN

KATAGORIK KATAGORIK TABULASI SILANG

NUMERIK NUMERIK KORELASI


UJI HIPOTESIS

Hipotesis adalah pernyataan tentang parameter populasi


Hipotesis bisa benar, bisa juga salah
Hopotesis benar jika apa yang dinyatakan dalam hipotesis
sama dengan kenyataan dalam populasi

Dalam statistika Hipotesis dibedakan menjadi Ho dan H1


Ho: adalah hipotesis yang memuat pengertian sama
H1: adalah komplemen dari Ho

CONTOH:
Ingin diketahui apakah rata-rata IQ mahasiswa Departemen
Matematika UI > 160
Ho : rata-rata IQ <= 160
H1 : rata-rata IQ > 160
Ingin diketahui apakah temperamen mempengaruhi tingkat
kemarahan
Ho : temperamen tidak mempengaruhi tingkat kemarahan
H1 : temperamen mempengaruhi tingkat kemarahan

Ingin diketahui apakah ada perbedaan EQ antara remaja


pria dan wanita
Ho : tidak ada perbedaan EQ remaja pria dan wanita
H1 : ada perbedaan EQ antara remaja pria dan wanita

Ingin diketahui apakah ada hubungan antara gender dengan


cara coping stress
Ho: tidak ada hubungan antara gender dan coping stress
H1 : ada hubungan antara gender dan coping stress
LANGKAH-LANGKAH UJI HIPOTESIS

1. Menentukan Ho dan H1

2. Menentukan  : probabilitas kesalahan sampel yang


masih dapat diterima
(1-) adalah jaminan atas kebenaran hasil

3. Tentukan Statistik Uji. Setiap kasus akan mempunyai


statistik uji yang berbeda-beda

4. Menentukan apakah Ho diterima (data mendukung


Ho) atau Ho ditolak (data tidak mendukung Ho)

5. Mengambil kesimpulan
TERIMA - KASIH

Potrebbero piacerti anche