Gretl, açık kaynaklı, çapraz-platform bir ekonometri programıdır. Gelişimine sourceforge ev sahipliği yapmaktadır.
A.B.D. Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) bir istatistiksel başvuru veri seti takımı yayınlamıştır. Bu projenin amacı, "istatistiksel yazılımların tarafsız değerlendirmesine olanak sağlayacak tasdikli hesaplama sonuçlarına sahip başvuru veri setleri sağlayarak istatistiksel yazılımların doğruluğunu iyileştirmek"tir.
Mayıs 2000 tarihi ile, proje Internet sitesi şu adreste bulunabilir:
http://www.nist.gov/itl/div898/strd/general/main.html
veri setleri ise şuradadır:
http://www.nist.gov/itl/div898/strd/general/dataarchive.html
Gretl'ı sınamak için, Doğrusal Bağlanım ve Tekdeğişkenli Özet İstatistikler'e ilişkin veri setlerinden yararlandık (diğerleri VARÇÖZ ve doğrusal-dışı bağlanım ile ilgilidirler).
Tasdikli hesaplama sonuçlarına ilişkin olarak, "Tasdikleme Yöntem & Tanımları" başlıklı NIST metninden alıntı yapalım: (vurgular eklenmiştir):
Tüm veri setleri için, önişlemci ve Bailey FORTRAN altyordam paketi (1995, NETLIB'den edinilebilir) kullanılarak çoklu kesinlikli hesaplamalar (500 basamağa kadar doğru) yapılmıştır. Veriler tamamen çoklu kesinlikli sayılar olarak okutulmuş ve tüm hesaplamalar bu çok yüksek kesinlikle yapılmıştır. Sonuçlar çoklu kesinlikli olarak çıkartılmış, ve ancak bundan sonra onbeş anlamlı basamağa yuvarlanmıştır.Bu çoklu kesinlikli sonuçlar bir ülküleştirmedir. Hesaplamalar yuvarlama veya diğer hatalar olmadan yapılırsa neyin elde edileceğini göstermektedirler. Türüne özgü her sayısal çözümyolu (yani çoklu kesinlikle gerçekleştirilmemiş), sayısal hatalılıklar getirecek ve buradaki tasdikli değerlerden biraz farklı sonuçlar üretecektir.
Sıradan istatistiksel paketlerden elde edilen sonuçların NIST'in çoklu kesinlikli karşılaştırma değeleriyle tamamen uyuşmasını beklememek gerekir. Ancak bu karşılaştırma, korkunç hata ve farklılıklar için çok yararlı bir sınama sağlamaktadır.
Aşağıda yer alan Çizelge 1, hem gretl'ın normal bağlanım aracı, hem de Gnu Çoklu Kesinlik (GMP) kütüphanesini temel alan gretl eklentisi başarımlarını göstermektedir. Gretl sütunundaki "enaz doğru anlamlı basamak" değeri, her model için, gretl'ın o model ile ilişkili çeşitli istatistik sonuçları (bağlanım katsayıları ve ölçünlü hatalar, artık kareler toplamı, artık ölçünlü hataları, F istatistiği ve R2), NIST'in tasdik ettiği değerler ile karşılaştırıldığında ortaya çıkan en az sayıdaki doğru anlamlı basamakları göstermektedir. GMP eklentisi sütunu yalnızca gretl sonuçlarının tüm istatistikler için en az 12 anlamlı basamak için doğru olup olmadığını kaydetmektedir. Bu sınamalar için gretl, -O2 eniyileştirme bayrağı ile birlikte gcc 2.95.3 kullanılarak ve glibc-2.2.5'e karşı bağlanarak derlenmiş ve Pentium III işlemcili bir IBM ThinkPad üzerinde çalıştırılmıştır.
Çizelge 1. NIST doğrusal bağlanım sınamaları
Veri seti | Model | Gretl (enaz doğru anlamlı basamak) | GMP eklentisi (enaz 12 basamak için doğru mu?) |
---|---|---|---|
Norris | Yalın doğrusal bağlanım | 9 | Evet |
Pontius | Kareli | 8 | Evet |
NoInt1 | Yalın bağlanım, sabit terim yok | 9 (ama metne bakınız) | Evet |
NoInt2 | Yalın bağlanım, sabit terim yok | 9 (ama metne bakınız) | Evet |
Filip | 10. derece çokterimli | 0 (metne bakınız) | Evet |
Longley | Çoklu bağlanım, altı bağımsız değişken | 8 | Evet |
Wampler1 | 5. derece çokterimli | 7 | Evet |
Wampler2 | 5. derece çokterimli | 9 | Evet |
Wampler3 | 5. derece çokterimli | 7 | Evet |
Wampler4 | 5. derece çokterimli | 7 | Evet |
Wampler5 | 5. derece çokterimli | 7 | Evet |
Çizelgede görülebileceği gibi, gretl tasdikli sonuçları izleme konusunda iyi bir iş çıkartmaktadır. Modelin
olduğu Filip veri setinde, gretl yüksek derece bir çoklueşdoğrusallıktan dolayı tahmin üretmeyi reddetmektedir (yaygın ticari ekonometri programı Eviews 3.1 de bu bağlanımda takılmaktadır). Bunun dışında, program tüm durumlarda doğru katsayı tahminleri üretmektedir.NoInt1 ve NoInt2 veri setleri için, bağlanımda sabit olmadığı zaman belirleme katsayısı R2'nin hesaplanması üzerinde yöntembilimsel bir anlaşmazlık bulunmaktadır. Bu durumda, NIST değeri
iken, gretl, bağımlı değişkenin gerçek ve yakıştırılmış değerleri arasındaki ilintinin karesini vermektedir. İstatistikçiler arasında "doğru" formül üzerinde evrensel bir anlaşma bulunmamaktadır (örnek olarak, bakınız Ramanathan, 2002, pp. 163–4). Yine, Eviews 3.1 farklı bir değer üretmektedir (NoInt sınama dosyaları için eksi değerli). Bu bağlanımlar için, NIST tarafından tercih edilen değergenr r2alt = 1 - $ess/sum(y * y)
komutu kullanılarak elde edilmiştir ve böylece elde edilen sayılar, gretl'ın kesinlik düzeyinde, tasdikli değerler ile anlaşma halindedirler.
Tekdeğişkenli özet istatistikler ile ilgili olarak, NIST tarafından verilmiş tasdikli değerler örneklem ortalaması, örneklem ölçünlü sapması ve örneklem gecikme-1 özilinti katsayısı için olanlardır. NIST, bu sonuncu istatistik ile ilgili olarak "birkaç tanımı olabilir" hatırlatmasında bulunmuştur. gretl, yt ve yt−1 arasındaki ilinti katsayısını verirken, tasdikli değer
şeklinde hesaplanmıştır. Karşılaştırma amacı ile, NIST değeri gretl'da şu şekilde bulunmuştur:genr y1 = y(-1) genr ybar = mean(y) genr devy = y - ybar genr devy1 = y1 - ybar genr ssy = sum(devy * devy) smpl 2 ; genr ssyy1 = sum(devy * devy1) genr rnist = ssyy1 / ssy |
Daha sonra, rnist değeri tasdikli değer ile karşılaştırılmıştır.
Bu değişiklik ile, tüm veri setleri (PiDigits, Lottery, Lew, Mavro, Michelso, NumAcc1, NumAcc2, NumAcc3 ve NumAcc4) için tüm özet istatistikler, (gretl tarafından verilen kesinlikte) uyuşmuşlardır.