Please download to get full document.

View again

of 24
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.

IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ Verilerin(data) toplanması. Analizlerin yapılması

Category:

Sports

Publish on:

Views: 114 | Pages: 24

Extension: PDF | Download: 0

Share
Related documents
Description
IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ İstatistiksel bir çalışma yaparken sırasıyla aşağıdaki adımlar izlenir: Verilerin(data) toplanması Analizlerin yapılması Analiz
Transcript
IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ İstatistiksel bir çalışma yaparken sırasıyla aşağıdaki adımlar izlenir: Verilerin(data) toplanması Analizlerin yapılması Analiz sonuçlarının yorumlanıp değerlendirilmesi Yrd.Doç.Dr. Fazıl GÖKGÖZ 1 KAVRAMLAR DATALARIN TOPLANMASI ÖRNEK:İnceleme altındaki popülasyonlardan alınan bir parçayı temsil eder. POPÜLASYON:İnceleme yapılan ve hakkında bilgi toplanmaya çalışılan birimlerin toplamıdır. İSTATİSTİK TÜRLERİ TARİFSEL(descriptive) İSTATİSTİK:Nümerik(sayısal) verileri düzenleyip özetlemek için kullanılan istatistik türüdür. Sayısal veriler üzerinden hareketle popülasyon için istatistiki sonuçlara ulaşılır. TÜMEVARIMSAL(inferential) İSTATİSTİK:Popülasyondan alınan örnekler incelenerek grubun tümü için istatistiksel sonuçlar elde edilir. Yrd.Doç.Dr. Fazıl GÖKGÖZ 2 KULLANILAN DEĞİŞKEN TÜRLERİ KANTİTATİF (quantitative) DEĞİŞKEN:Sayısal ölçeklerle ifade edilebilen ve miktar ile ilgili bilgileri veren değişkenlerdir. #öğrenci sayısı, hesaptaki bakiye,pilin ömrü,... 1-sürekli kantitatif değişken(boy uzunluğu,kargo ağırlığı,...) 2-süreksiz kantitatif değişken(çocuk sayısı,satılan ürün adedi,...)... KUALİTATİF (qualitative) DEĞİŞKEN:Nümerik olmayan görsel değişkenlerdir. rengi,doğum yeri,ırk,... #göz Yrd.Doç.Dr. Fazıl GÖKGÖZ 3 DATALARIN TOPLANMASI Datalar toplanmaya başlamadan önce; İncelenecek popülasyon iyi ve açık bir şekilde belirlenmeli Toplanacak örneklerin popülasyonun tamamını net bir şekilde temsil etmesinedikkat edilmeli (uygun örnekleme tekniği) Tüm popülasyon(sayım) yerine neden örneklem üzerinden inceleme yapıyoruz? Düşük maliyet Zaman tasarrufu Dikkatlice alınmış bir örneklem bazı durumlarda bir sayım'dan daha iyi sonuçlar verebilir. Bazı durumlarda sayım imkansız olabilir. Yrd.Doç.Dr. Fazıl GÖKGÖZ 4 ÖRNEKLEME PLANI ÖZELLİKLERİ: Yüksek kalite; toplanan verilerin doğruluk ve popülasyona uyumluluğu ile ilişkilidir. Savunabilirlik; örneklem planını açıklayıcı ve savunucu belgelerin mevcut olması Tekrarlanabilirlik; örnek planı kullanılarak gerekli verilere tekrar ulaşılabilmesi Temsil edici özelliği;incelenen popülasyonu tamamen yansıtması Faydalı olması;toplanan verilerin planın uygulanmasına uygun ve elverişli olması ÖRNEKLEME ŞEKİLLERİ Bir örnek; random(rastgele) sistematik karara dayalı(judgemental) Yrd.Doç.Dr. Fazıl GÖKGÖZ 5 ÖRNEKLEME HATASI Örneklerin daimi ortak özelliği tüm popülasyonu her yönüyle karışlayamamasıdır. Bu özellik örnekleme ile yapılan tahminlerin popülasyonun gerçek karakteri ile birebir uyuşmamasını sağlar. Buna göre örneklem hatası istatistiksel reel bir hata değil örneklerin birbirine göre doğal değişkenliklerinden kaynaklanan hataları temsil eder. DATA GRAFİKLEME TÜRLERİ Çalışmalarda kullanmak üzere toplanılan verilerin ve elde edilen sonuçların birbirleri ile daha rahat kıyaslanabilmeleri, analizlerin daha sistematik yapılabilmesi için bu bilgiler çeşitli grafikler üzerinde gösterilir. 1.Pasta diyagramlar 2.Bar grafikler 3.Kartezyen(x-y) grafikleri 4.Frekans dağılım grafikleri 5.Histogramlar Yrd.Doç.Dr. Fazıl GÖKGÖZ 6 1.PASTA DİYAGRAMLAR Oran veya yüzde kullanılarak kuantitatif (farklı) dataların sunulmasını sağlayan grafiklerdir. Örneğin; 2. BAR GRAFİKLERİ Faktör ya da verilerin sıralanmasıyla oluşturulan grafiklerdir.örneğin; -yatay bar grafiğiuçak cinayet trafik Sütun 1 alkol sigara Yrd.Doç.Dr. Fazıl GÖKGÖZ 7 ... -düşey bar grafiğix ekseni:yaş grupları y ekseni:gelir dağılımı erkek bayan X-Y GRAFİKLERİ Eksenler veri özelliklerini göstermek üzere bu özelliklerin birbirlerinin değişiminden nasıl etkilediğini belirtirler.örneğin; x ekseni:yıllar y ekseni:ülkelerin dünya marketindeki yüzdeleri Yrd.Doç.Dr. Fazıl GÖKGÖZ 8 KAVRAMLAR VERİLERİN ORGANİZE EDİLİP SUNULMASI TASNİF:Özelliklere göre elde edilen grubun sınıflara ayrılması ile yapısal özelliğinin belirlenmesi işlemidir. Belirlenen özelliklere göre kümeler oluşturulur ve aynı kümeye ait özellik aynı sınıfta yer alır. Sınırlı veri sayısının olduğu durumlarda mevcut yapıyı net bir şekilde ortaya koyabilen bir işlemdir.... Örneğin; 100 kişilik bir grubu yaş dağılımlarına göre tasnif edersek: YAŞ FREKANS TOPLAM:100 Yrd.Doç.Dr. Fazıl GÖKGÖZ 9 GRUPLAMA: Tasnif edilecek veri sayısının çok olduğu durumlarda başvurulan bir yöntemdir. Bu şekilde veri sayısı çok iken aynı vasfı taşıyan birbirine yakın özellikteki veriler aynı başlık altında toplanılarak gruplama yapılır. Örneğin; dünyadaki en büyük 29 şehir nüfuslarına göre bir frekans dağılımına(veya gruplamaya) tabi tutulabilir.... NÜFUS SINIFLARI ŞEHİR SAYISI (1000 KİŞİ) (FREKANS) 'den az ve üzeri 4 TOPLAM:29 Yrd.Doç.Dr. Fazıl GÖKGÖZ 10 GRUPLAMAYA HATALI BİR ÖRNEK; Bir endüstri dalında faaliyet gösteren işletmelerde çalıştırılan işçi sayısına göre gruplamak istersek; ÇALIŞAN SAYISI FREKANS ve üzeri 68 TOPLAM: FREKANS DAĞILIMLARI VEYA BÖLÜNMELERİ(frequency distributions) KAVRAMLAR: SINIF ARALIĞI:Belirlenen sınıfın alt ve üst sınırları arasındaki farkı gösterir. SINIF SINIRLARI:O sınıfa ait maksimum (üst sınır) ve minimum (alt sınır) sınır değerleridir. SINIF ORTA NOKTASI veye NOKTASI:Sınıfın maksimum ve minimum sınır değerlerinin ortalamasıdır. Yrd.Doç.Dr. Fazıl GÖKGÖZ 11 O halde frekans bölünmeleri kavramını şöyle tanımlayabiliriz: Verilerin her bir sınıf aralığı içindeki gözlem sayısını(frekans) gösterecek şekilde gruplandırılması işlemidir. FREKANS DAĞILIMININ OLUŞTURULMASI Bir taşıtın yıl içerisindeki satış fiyatlarının düzenlenmemiş hali (HAM DATA) Yrd.Doç.Dr. Fazıl GÖKGÖZ 12 Sınıf Sayısının Belirlenmesi Genel olarak frekans dağılımları oluşturulurken kullanılacak sınıf sayısı 5 ile 15 arasında olmalıdır. Eldeki toplam veri sayısı kullanılarak gerekli sınıf sayısını belirlemek mümkündür. k:sınıf sayısı n:toplam veri sayısı eşitsizliği sağlanmalıdır.... Örnekte ham data olarak bize verilen tabloya göre n=80 veri bulunmaktadır. Yukarıda bize verilen eşitsizliği sağlayan minimum k değeri ise k=7 olarak tespit edilir. O halde; tavsiye edilen minimum sınıf sayısı k=7 Yrd.Doç.Dr. Fazıl GÖKGÖZ 13 Sınıf Aralığının Belirlenmesi Sınıf aralığı seçerken yuvarlak rakamlar kullanılmalı Birinci sınıfın alt limiti sınıf aralığının çift bir katı olmalı Sınıf aralıkları birbirleri ile örtüşmemeli Açık sınıf aralıklarından kaçınılmalı = $2635 ~ $ Frekans Dağılım Tablosu ARABA SATIŞ FİYATI(bin $) FREKANS TOPLAM:80 Yrd.Doç.Dr. Fazıl GÖKGÖZ 14 Frekans Dağılım Grafiği (Histogram) Frekans dağılım tablosundaki veriler yardımı ile aşağıdaki grafik oluşturulabilir. Frekans Dağılımlarının Oluşturulmasında Dikkat Edilecek Noktalar Mümkün olduğunca eşit sınıf aralıkları seçilmelidir. Çok sayıda boş sınıf oluşması vb. durumlarda eşit olmayan sınıf aralıklı frekans dağılımları oluşturulabilir. Eşit olmayan sınıf aralıkları grafik aşamasında bazı sorunlar doğurabilir. Uygun olarak seçilmemiş sınıf sayısına göre oluşturulmuş frekans dağılımları, verinin frekans dağılımı hakkında faydalı ve net bildiler sunmayabilir. Örneğin; ARAÇ SATIŞ FİYATI ARAÇ SAYISI (FREKANS) $ $ $ TOPLAM=80 Yrd.Doç.Dr. Fazıl GÖKGÖZ 15 ... Bir önceki histogramda sınıf sayısı 8 iken bu histogramda 3 sınıf kullanılmıştır. Buna karşılık sınıf aralıkları genişlemiş ve araçlar daha yüzeysel bir gruplamaya tabi tutulmuştur. Nisbi Frekans Dağılımları(relative frequency distributions) Sınıfın nisbi frekansı:o sınıfın frekansının toplam frekansa oranı ile tanımlanabilir. Örneğin; $ sınıfının nisbi frekansı 8/80=0.1 ya da yüzde olarak ifadesi ile %10 Genellikle sınıfın mutlak frekansından çok nisbi frekansını bilip buna göre işlem yapmak daha gerekli olmaktadır. Yrd.Doç.Dr. Fazıl GÖKGÖZ 16 ... Nisbi frekans dağılım grafiği; Kümülatif Frekans Dağılımları Farklı sınıf aralıklarında bulunan serilerin nisbi frekansları ile kıyaslanmalarını kolaylaştıran bir yöntemdir. Kümülatif frekans dağılımlarının en önemli özellikleri belirli bir düzeyin altında ve üstünde bulunan birimlerin frekansını gösterebilmeleridir. Yrd.Doç.Dr. Fazıl GÖKGÖZ 17 Kümülatif Frekans Dağılımlarının Oluşturulması: ÖRNEK:Bir sınıftaki öğrencilerin boy uzunluklarının frekans dağılımları aşağıda verilmiştir. BOY UZUNLUKLARI(CM) FREKANS TOPLAM:200 KÜMÜLATİF FREKANS DAĞILIM TABLOSU -den az frekans -den çok frekans Yrd.Doç.Dr. Fazıl GÖKGÖZ 18 -den çok ve -den az kümülatif grafiklerinin oluşturulması FREKANS POLİGONLARI Sınıf orta noktasının sınıf frekansına göre grafiklendiği yapılardır. Frekans dağılımlarının sınıf sayısı ve aralığı eşit olması koşulu ile iki veya daha fazla frekans dağılım grafiğinin kıyaslanması aşamasında oldukça avantajlıdırlar. Bu özellik frekans poligonlarına histogramlara göre avantaj kazandırır. Yrd.Doç.Dr. Fazıl GÖKGÖZ 19 Öğrencilerin boy uzunluklarını gösteren frekans poligonu;??? EldekiVERİ'yi BİLGİ'yedönüştürebilmek ve analizleri yapabilmek amacıyla ileri istatistik yöntemleri kullanılır. Verilerin kullanış tarzlarına göre çeşitli istatistiksel yöntemlerden bahsetmek mümkündür. Yrd.Doç.Dr. Fazıl GÖKGÖZ 20 İSTATİSTİKSEL YÖNTEMLER Betimleyici(descriptive) yöntemler **verili herhangi bir dağılım bir ya da daha fazla katsayılarla ifade edilebilir. #şirkette çalışan kişilerin yaş ortalaması maaşları arasındaki ilişki Açıklayıcı(explanatory) yöntemler **Bir veri setinde olması olası ilişkileri açıklar. #şirkette çalışan personelin ayakkabı numaraları ile... Bu istatistiksel yöntemler uygulanırken çeşitli hesaplamalar yapılır. Bu hesaplamalar sayesinde değişkenler ve veriler arasında kurulan ağ bize raporlama aşaması için faydalı bilgiler sunacaktır. Yöntemler sırasında (daha sonra ayrıntılı incelemek üzere) hesaplanması gereken bazı terimler şunlardır: Yrd.Doç.Dr. Fazıl GÖKGÖZ 21 ... Veriler için ortalama,medyan,mod Değişkenlere ait varyans ve standart sapmalar Değişkenlerin kovaryansı ve korelasyon Regresyon analizi veee amaç-sonuç... Eldeki dağılımı en iyi şekilde temsil eden veriler sayesinde görünenin ötesine gidip görünmeyeni de meydana çıkarmak Olası ilişkileri açıklayabilmek[y=f(x) formu için X ve Y nin birbirlerinin değişimlerinden ne kadar ve nasıl etkilendiklerini görebilmek] Eldeki hipotezleri test edebilmek Yrd.Doç.Dr. Fazıl GÖKGÖZ 22 KÜMELEME VE BİRLEŞTİRME ANALİZLERİ Eldeki olguların birbirleriyle bağını kullanarak yapılan birleştirme analizleri sayesinde Mevcut veri sayısı azaltılabilir Olası durum sayısı azaltılabilir Boyut sayısı azaltılabilir Birleştirme analizi ile hesap ve rapor aşamasında işlemler oldukça kolaylaşır 1-) FAKTÖR ANALİZİ=DEĞİŞKEN SAYISINI AZALTMAK Analizi yapılacak olan değişkenlerin hepsi daima birbirleriyle ilişki içerisindedirler. Birbiriyle diğerlerine göre daha kuvvetli bir ilişki içinde bulunan değişkenler birleştirilerek tek bir değişken gibi işlem görebilirler. Bu birleşim işlemi sırasında o değişkenler arasındaki korelasyon matrisleri hesaplanır. Bu matrisler sayesinde faktör ler oluşturularak değişken sayısı azaltılabilir. Yrd.Doç.Dr. Fazıl GÖKGÖZ 23 2-)CLUSTERING=CASE (OLAY) SAYISINI AZALTMAK Mevcut değişkenlerle yapılan analizlerdeki 'case'ler birbirlerine bir ya da daha fazla boyutta benzerlik gösterebilirler. Case'ler arasındaki benzerlikler metrik olarak tanımlanabilmelidir. Bu benzerlikleri kullanarak olaylar arasında clusters (bir araya getirme) yapılabilir. 3-) BOYUT SAYISINI AZALTMAK = MDS Analizde göz önünde tutuğumuz her değişken bir 'boyut' sayılabilir. Değişkenler arasındaki metrik uzaklıktan faydalanılarak bu boyut sayısı azaltılabilir. Fakat bu işlem sırasında iki veya üç boyuttan fazlasını visualize etmek kolay olmayacaktır. Yrd.Doç.Dr. Fazıl GÖKGÖZ 24
Search Related
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks