Prof. Dr. Ecevit EYDURAN

Iğdır Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, İşletme Bölümü, Sayısal Yöntemler Anabilim Dalı, Iğdır, Türkiye

Regresyon Tipi Problemlerin Çözümlenmesi: R yazılımı ile MARS (Multivariate Adaptive Regression Splines) Algoritması

Bilgisayar teknolojisindeki ilerlemelere paralel olarak, regresyon ve sınıflandırma problemlerinin daha sofistik çözümlenmesi açısından veri madenciliği (data mining) algoritmalarına ilgi artmaktadır. Bu kapsamda düşünüldüğünde, CHAID (Chi-Square Automatic Interaction Detector), Exhaustive CHAID (Chi-Square Automatic Interaction Detector) ve CART (Classification and Regression Tree) karar ağaç algoritmaların kullanımı yaygın olarak tercih edilmektedir. Üzerinde durulan verim (bağımlı değişkeni) özelliğini etkileyen bağımsız değişkenlere ilişkin alt grupların tespit edilmesi önem arz etmektedir.

Sadece regresyon tipi problemlerin değil aynı zamanda sınıflandırma tipi problemlerin çözümlenmesi bakımından yüksek boyutlu ilişkilerin modellenmesi amacıyla kullanılan yapay sinir ağları algoritmalarının oldukça yüksek tahmin performansı gösterdiği bilinmektedir. Özellikle, son zamanlarda yapılan modelleme çalışmalarında, karar ağaçları, sinir ağları ve MARS (Multivariate Adaptive Regression Splines) algoritmalarının tahmin doğruluklarının karşılaştırılmalı olarak değerlendirilmektedir.

İkili bölünme (binary splitting) kuralı esasına dayalı olarak CART algoritmasının modifiye edilmiş bir formu olan ve ünlü Amerika’lı İstatistikçi Prof. Dr. Jerome H. FRIEDMAN tarafından geliştirilmiş olan MARS algoritması, ele alınan değişkenler arasındaki yüksek boyutlu ilişkilerin doğru ve güvenilir bir şekilde tanımlanması bakımından araştırıcıların ilgisini çekmektedir.

Gerek değişkenlerin dağılımına ilişkin gerekse değişkenler arasındaki fonksiyonel ilişkilere ilişkin varsayıma gerek duymaması ve bunlara ilaveten model katılan değişkenler arasındaki yüksek boyutlu ilişkileri anlaşılır bir şekilde gösteren bir denklem sağlaması MARS algoritmasının popülaritesini günden güne artırmaktadır. Bu üstün yönlerinden dolayı, etki faktörü (impact factor) yüksek olan SCI kapsamındaki dergilerde MARS algoritmasının yaygın olarak kullanıldığı belirlenmiştir. Ancak, MARS algoritmasının uygulamasına ilişkin Türkçe literatür incelendiğinde, referans kaynakların olmadığı dikkat çekmektedir. Bu nedenle, MARS algoritmasına ilişkin uygulamaların yapılacağı bu kurs programı kapsamında;   

(1) MARS algoritmasına ve uyum iyiliği ölçütlerine ait teorik bilgilerin verilmesi,

(2) MARS çözümlemesi için earth ve caret paketlerinin kullanılması ile ilgili önemli bilgilerin verilmesi,

(3) Tek ya da birden fazla sürekli bağımlı değişken için MARS modellemesinin nasıl yapılacağı, analiz sonuçlarının nasıl yorumlanacağı ile ilgili detayların verilmesi,

(4) Caret paketinde farklı yeniden örnekleme yöntemleri ile ayar parametrelerinin optimizasyonuna ilişkin yararlı bilgilerin verilmesi ve

(5) Regresyon tipi problemler kapsamında kurulan modellere ait uyum iyiliği ölçütlerin hesaplanması için tarafımızca geliştirilen ehaGoF paketinin tanıtılması amaçlanmıştır.

 

Doç.Dr. Şenol ÇELİK

Bingöl Üniversitesi Ziraat Fakültesi Zootekni Bölümü, Bingöl/Türkiye

Zaman Serileri Analizi

 

Zaman serileri hakkında kasaca bir giriş yapıldıktan sonra kullanıldığı alanlar açıklanacaktır.

Box-Jenkins modelleri anlatılacaktır. Autoregressive model (AR), Moving Average (MA) modeli ve ARMA (Autoregressive Moving Average) modeli kısaca tanıtılacaktır. Modellerin tanımı, denklemleri, özellikleri, otokorelasyon ve kısmi otokorelasyon katsayıları belirtilecektir. Durağanlık hakkında bilgi verilecektir. Seri durağan olmadığında ARIMA modeli hakkında bilgi verilecektir.

Bir veri seti üzerinde ARIMA modeli üzerinde SPSS paket programı ile örnek bir uygulama yapılacaktır.

 

Süre: 40 dakika (Maksimum 40 dakika)

 

Doç. Dr. Şenol Çelik