Başarım analizini yapmak için kullanılan yöntemlerden birisi de "Mean Average Precision". Bu terimi Türkçe'ye çevirmek çok da zor olmamalı aslında, ama mesela "ortalama kesinlik" diye çevirsek tam karşılamıyor sanki. Neyse konumuz bu değil. Unutmamak için bu yöntemin kullanımı ile ilgili bir örnek vereyim. Örnek uygulamamız ise verilen bir kelime icin alakali metinleri bulmak olsun.
Kullanılan sınıflandırma yöntemi K1 konusu için mevcut tüm metinlere birer puan versin. Biz de metinleri puanlarına göre sıralayalım. Buna göre sadece en yüksek puanlı metinin K1 için doğru konu seçilmesi durumunda hesaplanan kesinlik (precision) Kes_1 olsun. Kesinlik, eğer en yüksek puanlı 2 metin icin hesaplanirsa Kes_2, 3 konu seçilirse Kes_3,...., n metin seçilirse Kes_n olsun.
Hemen kesinliğin tanımını verelim:
kesinlik = (bulunan sonuçlar içinde doğru olanların sayısı)/(tüm bulunan sonuçların sayısı)Kullanılan sınıflandırma yöntemi K1 konusu için mevcut tüm metinlere birer puan versin. Biz de metinleri puanlarına göre sıralayalım. Buna göre sadece en yüksek puanlı metinin K1 için doğru konu seçilmesi durumunda hesaplanan kesinlik (precision) Kes_1 olsun. Kesinlik, eğer en yüksek puanlı 2 metin icin hesaplanirsa Kes_2, 3 konu seçilirse Kes_3,...., n metin seçilirse Kes_n olsun.
Hemen kesinliğin tanımını verelim:
Teker teker tüm olası kesinlikleri elde ettikten sonra, m toplam konu sayısı olmak üzere M1 için ortalama kesinlik söyle hesaplanır:
Yukardaki formulde, a_k, k=1,2,...,n, k'inci metinin sozkonusu konuyla alakali olup olmadigini gosteren belirtectir. Yani eger k'inci metin alakaliysa ak=1, degilse ak=0'dir. Bunu izleyen adım ise, m toplam konu sayısı olmak üzere her konu için elde edilen ortalamaların ortalamasını almak:
Buradaki amaç, yüksek puanlı metinlerin değerlendirilmesine öncelik vermek. Mesela metinlerden sadece bir tanesinin metinle alakasız (Y), diğerlerinin ise alakalı (D) olduğu durumu ele alalım. Bu durumda hayali 2 adet sınıflandırma yönteminin sonuçlarını (S1 ve S2) değerlendirelim:
S1 => D D D Y => OrtKes = ort(1,1,1) = 1
S2 => Y D D D => OrtKes = ort(0.5, 0.66, 0.75) = 0.64
Doğal olarak S1 burada S2'ye göre daha yüksek bir sonuç verdi. Burada görmemiz gereken şey bu başarım ölçümü yönteminin doğru sonuçların sıramada üst yerlere yerleştirilme başarımını
ölçmesidir.
No comments:
Post a Comment