t.c. sÜleyman dem rel Ün vers tes fen b l mler enst …tez.sdu.edu.tr/tezler/tf01139.pdf ·...
TRANSCRIPT
T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ
FEN BİLİMLERİ ENSTİTÜSÜ
GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ
HALİME BOZTOPRAK
Danışman: Prof.Dr. Mustafa MERDAN
YÜKSEK LİSANS TEZİ
ELEKTRONİK ve HABERLEŞME MÜHENDİSLİĞİ ANABİLİMDALI
ISPARTA – 2007
1
Fen Bilimleri Enstitüsü Müdürlüğüne
Bu çalışma jürimiz tarafından ELEKTRONİK HABERLEŞME ANABİLİM
DALI'nda oybirliği/oyçokluğu ile YÜKSEK LİSANS TEZİ olarak kabul edilmiştir.
Başkan : Prof.Dr.Mustafa MERDAN (İmza)
SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü
Üye : Yrd.Doç.Dr.Bayram CETİŞLİ (İmza)
SDU Müh.Mim.Fak.Bilgisayar Müh.Bölümü
Üye : Yrd.Doç.Dr.Mesud KAHRİMAN (İmza)
SDU Müh.Mim.Fak.Elekt.ve Hab.Müh.Bölümü
ONAY
Bu tez 22/11/2007 tarihinde yapılan tez savunma sınavı sonucunda, yukarıdaki jüri
üyeleri tarafından kabul edilmiştir.
Prof. Dr. Fatma GÖKTEPE
Enstitü Müdürü
2
İÇİNDEKİLER Sayfa
İÇİNDEKİLER......................................................................................................... i
ÖZET ..................................................................................................................... iii
ABSTRACT............................................................................................................vi
TEŞEKKÜR .............................................................................................................v
ŞEKİLLER DİZİNİ .................................................................................................vi
ÇİZELGELER DİZİNİ ......................................................................................... viii
SİMGELER VE KISALTMALAR DİZİNİ..............................................................ix
1. GİRİŞ ............................................................................................................11
2. KURAMSAL TEMELLER............................................................................15
2.1.1 Gerçek renk-gri skala dönüşümü .................................................................15
2.1.2 Eşikleme .....................................................................................................15
2.1.2.1 Otsu Eşik Belirleme Yöntemi ...................................................................16
2.2. Geometrik Dönüşümler ..................................................................................18
2.3. Bölgelerin Etiketlenmesi ................................................................................19
2.4. Morfolojik İşlemler ........................................................................................20
2.5. Top-Hat Dönüşümü........................................................................................25
2.6. Hough Dönüşümü ..........................................................................................27
2.7. Karakter Tanıma ............................................................................................30
2.7.1 Karakter Tanıma Ön İşlemler ......................................................................30
2.7.1.1 Eşikleme ..................................................................................................31
2.7.1.2 İnceltme ...................................................................................................31
2.7.1.3 Onarım .....................................................................................................32
2.7.1.4 Normalleştirme.........................................................................................32
2.7.2 Korelasyon ile Karakter Tanıma..................................................................32
2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi ..................................33
3
2.7.3.1 Lineer Öğrenme Makineleri......................................................................33
2.7.3.1.1 Lineer Sınıflandırma..............................................................................33
2.7.3.1.2 Kernel Tabanlı Özellik Uzayı ................................................................35
2.7.3.1.3 Özellik Uzayları ve Kerneller ................................................................35
2.7.3.1.4 Özellik Uzayında Öğrenme....................................................................36
2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu............................37
2.7.3.1.6 Langrangian Teorisi...............................................................................38
2.7.3.2 Destek Vektör Makineleri (Support Vector Machines).............................39
2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri .....40
2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar...............................................................41
2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar ...............................................43
2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları ...........................44
2.7.3.2.5 Çok Sınıflı Sınıflandırma.......................................................................46
2.7.3.2.6 Bire-karşı-biri Metodu...........................................................................47
2.7.3.2.7 Bire-karşı-diğerleri Metodu ...................................................................47
3. MATERYAL VE YÖNTEM..........................................................................48
3.1. Plaka Bölgesinin Bulunması...........................................................................48
3.1.1 Bölgelerin Etiketlenmesi .............................................................................51
3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar....................................52
3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi ......................................54
3.1.4 Plaka Çerçevesinin Çıkarılması ...................................................................56
3.2. Karakterlerin Ayrıştırılması............................................................................58
3.2.1 Plakanın Normalize Edilmesi ......................................................................58
3.3. Karakterlerin Tanınması.................................................................................61
4. ARAŞTIRMA BULGULARI VE TARTIŞMA..............................................63
5. SONUÇLAR..................................................................................................67
6. KAYNAKLAR ..............................................................................................69
ÖZGEÇMİŞ............................................................................................................70
4
ÖZET
Yüksek Lisans Tezi
GERÇEK ZAMANLI TAŞIT PLAKA TANIMA SİSTEMİ
Halime BOZTOPRAK
Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü
Elektronik-Haberleşme Anabilim Dalı
Plaka tanıma sistemleri araç tanıma otomasyonunda kullanılan tekniklerden biridir.
Trafik denetleme, giriş otomasyonu ve denetimli saha giriş kontrolü uygulamalarında
verimli olarak kullanılırlar.
Bu çalışmada, Türk araç plakaları için plaka tanıma sistemi geliştirilmiştir. Tanıma
işlemi üç aşamada gerçekleştirilmiştir; plaka bölgesinin bulunması, karakterlerin
ayrıştırılması ve karakterlerin tanınması. Plaka bölgesinin bulunmasında, plaka
olamayacak bölgeleri bastıran, plaka bölgesi olabilecek bölgeleri ön plana çıkartan
top-hat dönüşümü kullanılmıştır. Bu dönüşümle plaka bölgesini kolaylıkla belirgin
haline getirilerek doldurma işlemi ile de plakayı içeren bölge tespit edilir. Karakter
ayrıştırma işlemi için yatay ve dikey izdüşümlerinden faydalanılmıştır ve Ayrıştırılan
karakterler, destek vektör makineleri kullanılarak tanımlanmıştır. Ayrıca, kamera
görüş açısından dolayı plaka bölgesi dikdörtgeninde meydana gelen bozulmalarda
düzeltilmeye çalışılmıştır.
Çalışmada plaka bölgesinin bulunması için %98, karakter ayrıştırma ve tanıma için
%91 doğruluk oranlarına ulaşılmıştır.
Anahtar Kelimeler: Plaka tanıma, morfolojik işlemler, top-hat dönüşümü, karakter
tanıma, destek vektör makineleri. 2007, 70 sayfa
5
ABSTRACT
M.Sc. Thesis
REAL TIME VEHICLE LICENSE PLATE RECOGNITION
Halime BOZTOPRAK
Süleyman Demirel University Graduate School of Applied and Natural Sciences
Electronic-Telecommunication Department
Vehicle license plate recognition systems are used for automated recognition of
vehicles. They can be efficiently employed for traffic monitoring of roads, automated
till collection.
In this study, a license plate recognition system for the vehicles which have license
plates, conform to Turkish Plates has been developed. The recognition process can
be done in three major steps; Extraction of plate region, segmentation of plate
characters and recognition of plate characters. For extraction of plate region have
been used Top-hat transform and fiilling process. Vertical and horizontal projections
are used for character segmentation. Character recognition has been achieved by
support vector machines. Any deformation on the plate region of rectangular shape
caused by an improper camera viewing parameters has been recovered.
An accuracy of 98% is achieved for license plate localization and %91 for character
segmentation and recognition.
Key Words: License plate recognition, morphology processing, top-hat transform,
character recognition, support vector machines.
2007, 70 pages
6
TEŞEKKÜR
Bu tez için beni yönlendiren, bilgi ve tecrübesi ile bana yardımcı olan danışman
hocam Prof. Dr. Mustafa MERDAN’a teşekkür ederim.
Ayrıca tezimin her aşamasında beni yalnız bırakmayan ve destekleyen aileme ve
arkadaşlarıma sonsuz sevgi ve saygılarımı sunarım.
Halime BOZTOPRAK
ISPARTA, 2007
7
ŞEKİLLER DİZİNİ
Şekil 1.1 Plaka örnekleri .........................................................................................13
Şekil 2.1 Genişletme işlemi.....................................................................................21
Şekil 2.2 Aşındırma işlemi......................................................................................21
Şekil 2.3 Açma işlemi .............................................................................................22
Şekil 2.4 Kapatma işlemi ........................................................................................22
Şekil 2.5 Yapısal eleman örnekleri..........................................................................23
Şekil 2.6 Gri seviyedeki genişleme işlemi ...............................................................24
Şekil 2.7 Gri seviyedeki aşındırma işlemi ...............................................................24
Şekil 2.8 Yeniden oluşturulma işlemi (Vincent, 1993).............................................25
Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi ....26
Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal
resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu...........................................27
Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması .................................28
Şekil 2.12 Bir doğrunun ifadesi...............................................................................29
Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar .....................................................29
Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi ...............................................30
Şekil 2.15 Karakter ön işlemleri ..............................................................................31
Şekil 2.16 İnceltme işlemi için yapısal elemanlar ....................................................31
Şekil 2.17 İnceltme işlemi.......................................................................................31
Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi .......................34
Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm...............................................36
Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası .................................37
Şekil 2.21 Sınır değerleri.........................................................................................43
Şekil 3.1 Plaka bölgesinin bulunması ......................................................................49
Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü ..................................................49
Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü.............50
Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin
uygulanmış hal, (c) ikilik seviyedeki görüntü ..........................................................51
Şekil 3.5 İkilik seviyedeki görüntü..........................................................................51
8
Şekil 3.6 Etiketlenen görüntü ..................................................................................52
Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme......................................................53
Şekil 3.8 Plakası bulunacak görüntü........................................................................54
Şekil 3.9 Bulunan plaka bölgesi ..............................................................................54
Şekil 3.10 Hough dönüşümü ..................................................................................55
Şekil 3.11 Plaka bölgesinin eğriliğin tespiti............................................................55
Şekil 3.12 Shear dönüşümü.....................................................................................55
Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi.............................................56
Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm .........57
Şekil 3.15 Plaka karakterlerini içeren görüntü .......................................................57
Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü .........................................58
Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü .........................................58
Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü ...........................................58
Şekil 3.19 Karakterlerinin izdüşümü .......................................................................59
Şekil 3.20 Karakter olmayan bölgelerin silinmesi....................................................59
Şekil 3.21 Birleşen karakterlerin ayrıştırılması ........................................................60
Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi .............60
Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması ...............................................61
Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen
görüntüler ...............................................................................................................64
Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü ..............................65
9
ÇİZELGELER DİZİNİ
Çizelge 2.1 Geometrik dönüşümler .........................................................................18
Çizelge 4.1 Plaka tanıma sisteminin test sonuçları...................................................63
Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi...............................................65
Çizelge 4.3 Karakter tanıma başarısı .......................................................................66
10
SİMGELER VE KISALTMALAR DİZİNİ
ai Langrange çarpanları
b Bias terimi
D Herhangi bir nokta ile hiperdüzlem arasındaki mesafe
DVM Destek vektör makineleri
DV Destek vektörleri
f(x) Hiperdüzlem denklemi
iF Gösterge fonksiyonu
k Sınıf sayısı
L(w,b) Langrangian fonksiyonu
n Eğitim örnekleri sayısı
PST Plaka tanıma sistemi
PYS Plaka yer saptama
VC Vapnik chervonenkis boyutu
x Serbestlik değişkenleri
xi Giriş verileri
yi Giriş verilerine uyan çıkış etiketleri
w Ağırlık terimi
11
1. GİRİŞ
Görüntü işleme uygulamalarından biri olan plaka tanıma, günümüzde trafikteki araç
sayısı göz önüne alındığında oldukça popüler uygulama alanlarındandır. Araç
sayısının artması ve trafikte oluşan sorunlar, otomatik araç tanıma ve trafik akış
kontrolü sistemlerinde duyulan ihtiyacı arttırmıştır. Bu amaca yönelik çalışmalar
temel olarak araçları özel bir noktadan geçerken tanımlamak, aracın konumunu
belirlemek, davranışlarını gözlemlemek ve bu verileri kullanarak trafik denetimini
sağlamaya yöneliktir. Otomatik taşıt plakası tanıma sistemlerini (PTS-Plaka Tanıma
Sistemi) kullanışlı ve pratik yapan; aracı belirlemek için hali hazırda aracın üzerinde
olan plakayı kullanmasıdır. Plaka araca ait her türlü bilgiyi içermektedir. Ek hiç bir
bilgiye ya da araca takılacak ek donanıma gerek kalmadan, aracın belirlenmesi bu
PTS sistemleri ile mümkündür.
Giriş-çıkışların sınırlanması ve kontrol altına alınması gereken tesisler, ücretli
otoyollar, otopark uygulamaları, akan trafikte araçların takibi ve otoyol otomatik
geçiş plaka tanıma sistemlerinin başlıca uygulama alanlarıdır. Giriş-çıkışların kontrol
altına alınması gereken yerlerde, işlemin insan tarafından yapılması, işlem süresini
artırmakta ve güvenilirliğini azaltmaktadır.
Araç plaka tanıma günümüzde otomatik park sistemleri, trafik denetimi, araç takibi,
köprü ve otoyol otomatik geçiş sistemleri gibi birçok alanda kullanılmaktadır. Bu
nedenle plakaların tanınması ve plaka yerinin saptanması ile ilgili literatürde pek çok
çalışma bulunmaktadır. Örneğin, kenar ayrıştırma (Boroujeni, 2000; Hongliang ve
Changping, 2004), Hough dönüşümü (Kamat ve Ganesan, 1995; Shapiro vd., 2003),
simetri özelliği (Kim ve Chien, 2001), morfolojik işlemler (Hsieh vd., 2001;
Hongliang ve Changping, 2004), renk özelliği, histogram analizi v.s gibi sayısız
teknikler önerilmiştir. Yaygın olarak kullanılan plaka yer saptama yöntemlerini ayrıt
12
temelli ya da bölge temelli yaklaşımlara dayanmaktadır. Plakanın dikdörtgen olduğu
varsayımına dayalı olarak yatay ve düşey doğrultudaki ayrıtlara Hough dönüşümü
uygulanarak plakayı çevreleyen sınırları saptayan yöntemler önerilmiştir (Kamat ve
Ganesan, 1995). Bu yöntem yüksek işlem yükü ve bellek ihtiyacı nedenleriyle gerçek
zamanlı sistemlerde tercih edilmemektedir. Ayrıca, yöntem, karmaşık artalana sahip
görüntülerde yüksek negatif hata oranı vermektedir. Ayrıca çizgi histogramlarını
analiz ederek plaka örüntüsüne özgü imzayı arayan (Barroso vd., 1997) veya plaka
renk bilgisini kullanan (Kim vd.) plaka yer saptama yöntemleri mevcuttur. Ancak bu
yöntemler gürültü ve perspektif bozulmalarına karşı oldukça duyarlıdır. Kenara bağlı
yaklaşım normal olarak basit ve hızlıdır. Ancak istenmeyen kenarlara çok hassastır.
Plaka yerinin tespit edildiği ve bunun için arka plan renginin kullanıldığı
uygulamalarda, başarı oranı düşmekte ve en fazla %70’lerde kalmaktadır. Renkleri
kullanılarak plaka bölgesi bulan yöntemlerde, yalnızca plakanın fon rengi
aranmasının performansı düşürdüğü gözlenmiştir. Plakanın fon rengi ile aracın aynı
renk olması durumunda ise plaka bölgesi bulunamamaktadır (Çamaşırcıoğlu, 2007).
Literatürdeki birçok yöntem, plaka görüntülerinin hemen hemen tam karşıdan
çekildiği varsayımı veya kısıtı altında çalışmaktadır. Genel olarak ayrıt saptama ve
eşikleme tabanlı plaka yer saptama yöntemleri, plakanın belirli bir açı ile x-y
düzleminde dönmesinden ve kameranın konumundan dolayı oluşan perspektif
bozulmalardan kaynaklanan düşük başarıma sahiptir. Literatürde, x-y düzlemindeki
dönme açısı, histogram analizi ve karakterlerin altından geçtiği varsayılan baz
çizgisinin bularak saptamaya çalışan yöntemler bulunmaktadır. Bu yöntemler
belirledikleri bu açıyı kullanarak giriş görüntüsünü dönmeden bağımsız hale
getirirler.
Plaka karakterlerinin ayrıştırılması için çeşitli yöntemler önerilmiştir: İzdüşüm
histogramları (Yong vd., 2000) ve dikey kenarlar, morfoloji (Hsieh vd., 2000;
13
Hongliang vd., 2004), bağlantılı bileşen analizi kullanan yöntemleri sayabiliriz. Bu
yöntemlerin kendine göre kazanımları ve yitimleri bulunmaktadır. Ayrıca bu
yöntemler belirli kısıtlar altında çalışmaktadır. Örneğin izdüşüm histogramına dayalı
yöntemler plaka doğrultusunun, morfoloji temelli yöntemler ise plaka karakterlerinin
boyutlarının bilindiğini varsayar (Kahraman vd., 2003).
Araç plakalarının standartları ülkeden ülkeye ve hatta aynı ülke içerisinde dahi
geometrik şekilleri itibariyle farklılık gösterebilmektedir. Plakalarının ortak
özellikleri, sabit arka planları ile karakterler arasında yüksek kontrast olmasıdır.
Değişik format ve renkte plakaların olması plaka yer saptama ve plaka tanıma
problemini zorlaştıran etkenlerden biridir.
Şekil 1.1 Plaka örnekleri
Türkiye trafik denetleme kurumlarına kayıtlı yasal plakalar; sivil, resmi, askeri,
diplomatik vs. gibi değişik renk ve biçimlerde olabilmektedir. Bu çalışmada,
plakaların açık renkteki arkalan üzerindeki koyu karakterler veya koyu arkalan
üzerindeki açık renkteki karakter içeren plaka tiplerinin tanınması amaçlanmıştır
(Şekil 1.1).
Plakaların resmi bir standardı olmasına rağmen, trafikte araçların bir kısmında
standartlara uygun olmayan plakalar bulunmaktadır. Bununla birlikte, plakalar
üzerinde çeşitli yabancı maddelerin; damgalar, çıkartmalar, fosforlar, pullar, vidalar,
çamur v.b gibi bulunması ve kameradan elde edilecek görüntülerin kalitesinin
14
aydınlatmaya bağlı olarak değişkenlik göstermesi ve aracın hızı, taşıt tanıma
sisteminin yapılmasını güçleştiren faktörlerdir. Yukarıda belirtilen problemleri
aşmak için, bazı görüntü işleme teknikleri kullanılmıştır.
Bu tez çalışmasında, kuramsal temeller bölümde sistemde kullanılan gerekli bazı
algoritmalardan bahsedilmiş, materyal ve yöntem bölümünde plaka tanıma sistemin
çalışması açıklanmıştır. Daha sonra araştırma bulguları ve tartışma kısmında sistemin
başarısı tartışılmıştır.
15
2. KURAMSAL TEMELLER
Bu bölümde yararlanılan görüntü işleme algoritmaları ve kullanılan yöntemler
hakkında bilgi verilmiştir.
2.1.1 Gerçek renk-gri skala dönüşümü
İnsan görme sistemi, RGB (kırmızı, yeşil, mavi - red, green, blue) renk bölgesinde
algılama yapar. Kırmızı, yeşil ve mavi ana renk bileşenlerinin her biri ayrı ayrı üç
farklı matriste tutulur. Bahsi geçen üç matrisin bir arada, üst üste görüntülenmesi ile
gerçek renk bileşenleri oluşur.
Gerçek renk-gri skala dönüşümü, (2.1) denklemiyle bulunur.
0.299 0.587 0.114Y R G B= + + (2.1)
Gerçek renk bileşenlerine sahip bir resmin işlenmesi, işlem sayısını artırır. Bu
sebeple, resmin gri seviyeye ve hatta işlemin amacına göre siyah beyaz ikili forma
dönüştürülmesi işlem sayısının asgaride tutulmasını sağlayacaktır.
2.1.2 Eşikleme
Gri seviye bir resim, her bir piksel için 0 ile 255 arasında bir parlaklık değeri alır. Ve
gri tonda görüntü işte bu farklı parlaklık değerlerine göre oluşur. 0 değeri siyah 255
ise beyazdır. Eşikleme işlemi, görüntü işlemenin önemli işlemlerinden biridir.
Eşikleme işlemi, değişik gri ton seviyelerine sahip bir resmi ikilik seviyeye yani; 0
siyah, 1 beyaz rengi göstermek üzere resmi 0 ve 1’lerden oluşan bir matris haline
getirir. Eşikleme yaparken bir eşik değeri belirlenir ve bu değerin üstündeki değerler
için çıkış imgesindeki ilgili piksele 1, altındaki değerler içinde 0 değeri atanır.
Eşiklemenin genel ifadesi denklem (2.2)’de verilmiştir.
( , ) 1 ( , )
( , ) 0 ( , )
G i j f i j T için
G i j f i j T için
= ≥
= < (2.2)
16
Burada:
T = Eşik
( , ) 1G i j = Nesnenin görüntü elemanları
( , ) 0G i j = Arka planın görüntü elemanlarıdır.
Eğer görüntüdeki nesneler temassız ve gri seviyeleri açıkça arka planın gri
seviyesinden farklı ise eşikleme uygun bir ayrıştırma metodudur. Doğru eşik seçimi
başarılı bir görüntünün ayrıştırılabilmesi için gereklidir. Bu seçim etkileşimli veya
çeşitli eşik tanımlama algoritmalarıyla yapılır.
2.1.2.1 Otsu Eşik Belirleme Yöntemi
Resmin etkili ve hızlı bir şekilde işlenebilmesi için en temel model olan siyah-beyaz
modele dönüştürülmesi gerekir. Her gri resmin parlaklık değeri, çekildiği atmosfer
koşullarına ve çevresel koşullara göre farklılık göstereceğinden, bu eşik seviyesinin
değişken olarak belirlenebiliyor olması önem kazanır. Otsu’nun bölgesel eşikleme
algoritması (Otsu, 1979) bu değişken eşik seviyesini bulmak için kullanılır. Bulunan
eşik seviyesi [0,1] aralığında, parlaklık parametresidir. Bu eşik değerini bulduktan
sonra ise gri resim, siyah beyaza çevrilir.
Otsu’nun bölgesel eşikleme algoritması; kendi içinde ağırlıklandırılmış ve
sınıflandırılmış değişintiyi (varyansı) minimize edecek şekilde çalışır. Bu sınıfların
birbiri ile olan değişintisini ise maksimize edecektir. Bölgesel eşikleme algoritması,
gri skala resimlerinde (0, 256) arasında değer alan pikseller için, P(i) çalışır.
Sınıfların birbiri arasındaki değişintisi:
2 2 2
1 1 2 2( ) ( ) ( ) ( ) ( )
wt q t t q t tσ σ σ= + (2.3)
17
Tahmin edilen sınıfsal olasılıklar
1 21 1 1
( ) ( ) ( ) ( )t I
i i
q t P i q t P i= = +
= =∑ ∑ (2.4)
Sınıfların ortalamaları:
1 21 11 2
( ) ( )( ) ( )
( ) ( )
t I
i i t
iP i iP it t
q t q tµ µ
= = +
= =∑ ∑ (2.5)
Ve son olarak sınıfların değişintisi:
22
1 11 1
( )( ) ( )
( )
t
i
P it i t
q tσ µ
=
= − ∑ (2.6)
22
2 21 2
( )( ) ( )
( )
I
i t
P it i t
q tσ µ
= +
= − ∑ (2.7)
t değerleri içinden (1,256 aralığı) en küçük ( )w
tσ değerini verenler seçilir.
Toplam değişinti, belirlenen eşik seviyesinden bağımsızdır. Sınıfların birbiri
arasındaki değişintisi ile sınıflar arası değişintinin toplamıdır.
22 2
1 1 1 2( ) ( ) 1 ( ) ( ) ( )
wt q t q t t tσ σ µ µ = + − − (2.8)
Yukarıdaki formülden bakıldığında ağırlıklandırılmış değişinti değerinin azaldığı
durumda sınıflar arası değişintinin artacağı daha net bir biçimde ifade edilmektedir.
Sınıflar arası değişintinin değerleri; t değerleri iteratif olarak formülde yerine
konarak hesaplanabilir.
İterasyonun Başlangıcı:
1 1(1) (1); (0) 0q P µ= = (2.9)
Ağırlıklandırılmış
değişinti
Sınıflar arası değişinti: 2 ( )B
tσ
18
Tekrarlayan Kısım için:
1 1( 1) ( ) ( 1)q t q t p t+ = + + (2.10)
1 11
1
( ) ( ) ( 1) ( 1)( 1)
( 1)
q t t t P tt
q t
µµ
+ + ++ =
+ (2.11)
1 12
1
( 1) ( 1)( 1)
1 ( 1)
q t tt
q t
µ µµ
− + ++ =
− + (2.12)
2.2. Geometrik Dönüşümler
İşlenmemiş görüntüler genellikle geometrik bozulmaları içerir. Bu çalışmada, 2-D
veya N-D boyutlar için kullanılan affine dönüşümüne ait bazı geometrik dönüşümler
Çizelge 2.1’de gösterilmiştir.
Çizelge 2.1 Geometrik dönüşümler
Affine Dönüşümü Örnek Dönüşüm Matrisi
Translation
(Yer değiştirme)
1 0 0
0 1 0
1x y
t t
tx : x ekseni boyunca yer
değiştirme
ty : y ekseni boyunca yer
değiştirme
Ölçekleme
(skalama)
0 0
0 0
0 0 1
x
y
s
s
sx: x ekseni boyunca
ölçekleme değeri
sy: y ekseni boyunca
ölçekleme değeri
Shear
1 0
1 0
0 0 1
y
x
sh
sh
shx: x ekseni boyunca
shear değeri
shy: y ekseni boyunca
shear değeri
Döndürme
cos( ) sin( ) 0
sin( ) cos( ) 0
0 0 1
q q
q q
−
q: dönme açısı
19
2.3. Bölgelerin Etiketlenmesi
İkilik bir resim içerisinde birbiri ile hiçbir piksel komşuluğu olmayan nesnelerin
değişik renklere boyanması ile resim içerisindeki bu nesnelerin birbirinden ayrılması
işlemine etiketleme (labeling) denir (Karaman, 2001).
Etiketleme işlemini gerçekleştirmek için, ikili seviyedeki bir resmin (0,0) orjin
noktasından itibaren yani sol üst köşesinden başlamak suretiyle piksel piksel taranır.
Taranan resimdeki nesneler beyaz, artalan ise siyah renkte olan bu ikilik resimde
tarama esnasında beyaz bir piksele rastlandığında, bu pikselin tüm komşuluklarına
bakılır. Ve komşulukları arasında önceden etiketlenmiş başka bir piksel varsa bu
beyaz piksele de aynı etiket atanır. Eğer bu beyaz pikselin komşuları arasında
birbirinden farklı etiketlere sahip birden fazla piksel varsa bu etiketlerden en küçük
değerlere sahip olanı bu beyaz piksele etiket değeri olarak atanır. Aynı zamanda
birbirine komşu oldukları halde farklı etiket değerleriyle etiketlendirilmiş olan
piksellere ait etiketler bir eşitlik tablosunda birbirine eşitlenir. Böylelikle bu
piksellerin etiket değerleri farklı olsa da, aslında bu piksellerin aynı nesnenin bir
parçası olduğu eşitlik tablosunda belirtilmiş olur. Eşitlik tablosundaki bu bilgiler bir
sonraki tarama işleminde kullanılmak üzere saklanır (Oral, 1996). Eğer tarama
esnasında rastlanan beyaz etiketlenmemiş pikselin komşuları arasında daha önceden
etiketlenmiş bir piksel yoksa bu piksele yeni bir etiket değeri atanır. Böylece bu
pikselin yeni bir nesneye ait bir piksel veya daha önceden etiketlendirilmiş bir
nesnenin alt çıkıntılarından birine ait bir piksel olduğuna karar verilmiş olur.
Tarama bu şekilde resmin tamamını kapsayacak biçimde yapılır. Tarama sonunda
eşitlik tablosunda hangi etiketlerin aslında aynı nesneyi temsil ettiği eşitlik
tablosundaki bilgiler ışığında tespit edilir. Bu yeni veriler göz önünde tutularak resim
baştan sona tekrar taranır ve eşitlik tablosunda aynı nesneye verilen değerler arasında
20
en küçük değere sahip olan pikselin etiketi, aynı nesnenin tüm piksellerine etiket
değeri olarak atanır. Bu işlem tüm resim taranacak şekilde yapılır. Tarama işlemi
tamamlandıktan sonra resim içerisinde birbirlerine piksel komşulukları olmayan tüm
nesneler farklı bir renge boyanmış, yani etiketlendirilmiş olur.
Etiketleme işlemi sonunda elde edilen resim içerisinde kullanılan farklı etiketlerin
adetinin sayısının tespiti bize o resim içerisinde toplam (birbirine piksel komşuluğu
olmayan) nesne olduğunu bildirir. Böylelikle resim içerisindeki nesneleri otomatik
olarak saydırmış oluruz.
2.4. Morfolojik İşlemler
Morfolojik imge işlemede temel olarak kullanılan iki işlem vardır: Genişletme
(dilation) ve Aşındırma (erosion). Diğer morfolojik işlemler, bu temel iki işlem
kullanılarak elde edilir.
Genişletmek (Yayma): İkili imgedeki nesneyi büyütmeye ya da kalınlaştırmaya
yarayan morfolojik işlemdir. Sayısal bir resmi genişletmek demek resmi yapısal
elemanla kesiştiği bölümler kadar büyütmek demektir. Kalınlaştırma işleminin nasıl
yapılacağı yapı elemanı (structure element) belirler. Yapısal eleman resim üzerinde
piksel piksel dolaştırılır. Eğer yapısal elemanın orjini resim üzerinde "0" değerli bir
piksel ile karşılaşırsa herhangi bir değişiklik meydana gelmez. Eğer değeri "1" olan
bir piksel ile karşılaşırsa yapısal elemanla yapısal elemanın altında kalan pikseller
mantıksal "veya" işlemine tabi tutulurlar. Yani herhangi "1" değeriyle sonuç "1" e
çevrilir. Genişletme ile resim üzerindeki nesneler şişer. Nesne içinde delikler var ise
bunlar kapanma eğilimi gösterirler. Ayrık nesneler birbirine yaklaşır ya da bağlanır.
Şekil 2.1’de 3x3 yapısal elemanı ile sayısal resim üzerine genişletme işleminin
uygulanması gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.
21
Şekil 2.1 Genişletme işlemi
Aşındırma işlemi, ikili imgedeki nesneyi küçültmeye ya da inceltmeye yarayan
morfolojik işlemdir. Aşındırma işlemi bir bakıma genişletmenin tersi gibi görülebilir.
Burada yine aynı şekilde yapısal eleman resim üzerinde piksel piksel dolaştırılır fakat
bu defa yapısal elemanın merkez pikseli "1" değeri ile karşılaşırsa yapısal eleman
içerisindeki piksellerin durumuna bakılır. Eğer yapısal eleman içerisindeki "1" olan
piksellerden herhangi biri altında resme ait "0" değeri varsa yapısal elemanın diğer
"1" lerinin altındakilerle beraber bu piksel "0"’a dönüştürülür.
Aşındırma (erozyon, erosion) işlemi ile sayısal resim aşındırılmış olur. Yani resim
içerisindeki nesneler ufalır, delik varsa genişler, bağlı nesneler ayrılma eğilimi
gösterir.
Şekil 2.2’de 3x3 yapısal elemanı ile sayısal resim üzerine aşındırma uygulanması
gösterilmiştir. 3x3 lük yapısal elemanın tüm değerleri "1" dir.
Şekil 2.2 Aşındırma işlemi
22
Açma işlemi, sayısal bir resme önce aşındırma daha sonra genişletme uygulanırsa
resme açma işlemi uygulanmış olur. Açma işlemine tabi tutulmuş bir görüntü ve
değişimi Şekil 2.3’de gösterilmiştir. Burada yine 3x3 lük yapısal eleman
kullanılmıştır.
Şekil 2.3 Açma işlemi
Kapatma işlemi, sayısal resme önce genişletme daha sonra aşındırma uygulanırsa
Kapatma işlemi uygulanmış olur. Şekil 2.4‘de kapatma işlemi uygulanmış bir
görüntünün önce ve sonrası durumları incelenmiştir.
Şekil 2.4 Kapatma işlemi
Açma işlemi ile birbirine yakın iki nesne görüntüde fazla değişime sebebiyet
vermeden ayrılmış olurlar. Kapatmada ise birbirine yakın iki nesne görüntüde fazla
değişiklik yapılmadan birbirine bağlanmış olur.
A ⊕ B ↔Genişletme
A Θ B ↔ Aşındırma
23
A o B = ( A Θ B ) ⊕ B ↔ Açma işlemi
A ● B = ( A ⊕ B ) Θ B ↔ Kapama işlemi
Yapısal eleman, birçok morfoloji işleminin gerçekleştirilmesinde en önemli öğedir.
Sayısal resimler matematiksel ifade oldukları için matematiksel morfoloji özellikleri
kullanılır.
Aslında yapısal eleman olarak adlandırılan ifade istenilen boyutlarda ve istenilen
şekilde hazırlanmış küçük ikilik bir resimdir. Yapısal eleman çeşitli geometrik
şekillerden biri olabilir; en sık kullanılanları kare, dikdörtgen ve dairedir. Yapısal
eleman örnekleri Şekil 2.5’de gösterilmektedir.
Şekil 2.5 Yapısal eleman örnekleri
Yapısal elemanın merkez pikselinin ikili seviyede bir resim içerisindeki nesnelere (1
lere) temas etmesiyle ortaya çıkan nesne ile yapısal elemanın kesişim kümesi
"nesneden çıkartılarak" veya "nesneye eklenerek" birçok morfolojik işlem
gerçekleştirilir. Buradaki en önemli nokta nesneye eklenen ya da nesneden çıkarılan
kısmın yapısal eleman tarafından belirlenmesidir.
Eğer morfolojik işlemin sonucunda resimdeki nesnelerin keskin hatları silinip
yerlerine kavisli veya daha yumuşak hatlar getirilmek isteniyorsa dairesel yapısal
eleman kullanılmalıdır. Örneğin erozyon işleminde resim içerisindeki nesnelerin en
ve boyları aynı oranda azaltılmak (erozyona uğratılmak) isteniyorsa yapısal eleman
kare seçilmelidir.
24
Gri seviyeli morfolojik işlemler: Gri seviyeli bir görüntünün b yapısal elemanı ile
genişletme işlemi denklem (2.13) ile ifade edilir (Gonzalez ve Woods, 1993).
( )( ) ( ) )}','(|)','(','max{, bDyxyxbyyxxfyxbf ∈+−−=⊕ (2.13)
Burada Db: b’nin etki alanıdır. Genişletme işleminden sonra resim genelde daha
parlaktır.
Şekil 2.6 Gri seviyedeki genişleme işlemi
Gri skalalı aşındırma işlemi (2.14) denklem ile ifade edilir. Aşındırma işleminden
sonra resim genelde daha koyudur.
( )( ) ( ) )}','(|)','(','min{, bDyxyxbyyxxfyxbf ∈+−−=Θ (2.14)
Şekil 2.7 Gri seviyedeki aşındırma işlemi
25
( ) bbfbf ⊕Θ=� ↔ Açma
( ) bbfbf Θ⊕=• ↔ Kapama
Doldurma işlemi: Doldurma işlemi gri skaladaki bir resimde bulunan boşlukları
kapatmak için kullanılan morfolojik işlemlerin yeniden oluşturulmasıyla
(reconstruction) meydana gelen bir algoritmadır.
Yeniden oluşturulma işlemi: Bir resim ve yapısal elemandan ziyade işaretleyici
(marker) ve maske (mask) olmak üzere iki resme bağlı olarak elde edilir. İşlemler,
kararlılık sağlanıncaya kadar tekrar eder, resim artık değişmez.
L ve I iki gri skalalı resim olsun, piksel değerleri {0,1,…,N} kümesinden seçilmiş
olsun ve J<=I (her piksel için p ∈DI, J(p) ≤ I(p)). Gri skala yeniden
oluşturulması )(JIρ ile ifade edilir.
,Ip D∈∀
))}((|],0[max{))(( )( JTpNkpJ kITI kρρ ∈∈= (2.15)
Burada, DI I gri skalalı resminin tanımlı olduğu etki alanıdır.
Şekil 2.8 Yeniden oluşturulma işlemi (Vincent, 1993).
2.5. Top-Hat Dönüşümü
Top-hat dönüşüm arka plandan farklı aydınlık seviyeli nesneleri ayrıştıran gri
seviyeli resimlerin bölütlenmesinde kullanılan bir araçtır. Gri seviyeli morfolojik
26
işlemler kullanılarak elde edilir. Tepe veya çukur bölgeleri belirginleştirme
özelliğine sahiptir (Karp, 2005).
Aydınlık nesneler için,
TopHat [A, B] = A - (A○B) (2.16)
karanlık nesneler için de,
TopHat[A, B] = (A●B) - A (2.17)
verilmiştir. Burada,
B : Yapı elemanı
(a) Orijinal görüntü
Şekil 2.9 TopHat dönüşümün aydınlık ve koyu nesneler için parlaklık gösterimi
Şekil 2.9.a’da orijinal görüntünün pozisyona göre parlaklık değeri görülmektedir. Bu
görüntüye TopHat uygulanmasıyla Şekil 2.9.b,c’de aydınlık ve koyu nesneler için
ayrı ayrı elde edilen parlaklık değişimleri gösterilmiştir.
27
TopHat dönüşümü, açma veya kapama işlemleri uygulanmasıyla elde edilir; aydınlık
nesneler için, orijinal resimden açma işleminin çıkarılması ile karanlık nesneler
içinse kapama işleminin orijinal resimden çıkarılmasıyla. Şekil 2.10’da her iki durum
için top-hat dönüşümü işlemleri gösterilmiştir (Candeas, 1997).
Şekil 2.10 Top-Hat dönüşümünün elde edilmesi: a,e) yapı elemanı; b,f) orijinal
resim; c,g) açma (diğeri kapama); d,h) çıkarma sonucu
Şekil 2.10.c’de f orijinal sinyale düz yapı elemanıyla (Şekil 2.10.a) uygulanan açma
işlemi görülmektedir. Şekil 2.10.d’de orijinal resimden açma işlemi uygulanmış
resmin çıkarılmasıyla elde edilen tepe noktalarının saptanması gösterilmiştir. Şekil
2.10.b’de de kapama işleminden orijinal resimden çıkarılmasıyla çukur bölgelerin
saptanması görülmektedir.
2.6. Hough Dönüşümü
Hough Dönüşümü sayısal görüntü işlemede matematiksel olarak ifade edilebilen
şekillerin varlığının, yerinin, açılarının vs bulunmasında kullanılabilir. Yöntem 1962
yılında Paul Hough tarafından bulunmuştur. IBM tarafından patentlidir.
Yöntem daha çok resimdeki doğruların tespitinde kullanılır ancak genelleştirilmiş
Hough dönüşümü matematiksel olarak ifade edilebilen bütün şekillerde çalışır.
28
Şekil 2.11 Hough Dönüşüm metodu ile doğruların bulunması
Bu çalişmada, Hough Dönüşüm metodu ile doğru bulunması ve metodun algoritması
incelenecektir.
Hough Dönüşüm yöntemi Edge (kenar) bilgisi elde edilmiş Gri-seviye imgeler
üzerine uygulanır. Yöntem imge uzayındaki bilgiyi parametre uzayına taşıyarak şekil
bulma problemini bir yoğunluk bulma problemine dönüştürür.
Bir doğru genel olarak,
y ax b= + (2.18)
şeklinde ifade edilir. Parametre uzayında her farklı (a,b) çifti farklı bir doğruyu
temsil etmektedir. Bu gösterimle dikey doğrular ifade edilemez.
Doğruyu ifade etmenin bir başka yöntemi:
.cos .sin – 0x y pΘ + Θ = (2.19)
şeklindedir. ( p : ifade edilen doğruya orjinden çizilen dikme)
29
Şekil 2.12 Bir doğrunun ifadesi
Her farklı (Θ,r) çiftimiz farklı bir doğruyu ifade etmektedir. Görüntü üzerindeki her
noktadan farklı (Θ,r) şeklinde ifade edilebilen sonsuz sayıda doğru geçer. Parametre
uzayında (x,y) şeklinde olan noktamızı her farklı Θ ye karşı gelen p şeklinde çizersek
bu noktayı ifade eden bir sinus eğrisi elde ederiz.
(a) (b)
Şekil 2.13 (a) Sinüs eğrisi, (b) Kesişen noktalar
Bütün noktalarımıza bu yöntemi uygularsak eğrilerimiz Şekil 2.13.b’de görüldüğü
gibi bazı noktalarda kesişecektir. Bu kesişim noktaları aynı Θ ya karşılık gelen aynı
p’lerdir. Yani farklı noktaların oluşturduğu aynı doğrulardır. (Bir doğru üzerindeki
faklı noktalar).
( , )pΘ
Θ
p
y
cos sin
y ax b
x y p
= +
Θ + Θ =
)Θ x
30
Şekil 2.14 Kesişen doğruların grafiksel gösterilmesi
Şekil 2.14’deki grafikte bir noktadan geçen sinüs eğrilerinin sayısının fazla olması o
noktanın bir doğru ifade etmesi ihtimalini güçlendirir. Buradaki darbe bölgeleri
doğruların bulunduğu bölgelerdir.
2.7. Karakter Tanıma
Bilgisayarın, bir resmin içindeki bilgiyi kullanabilmesi için yorumlaması
gerekmektedir. Başka bir deyişle, karakter tanıma, bir resimdeki yazıların
bilgisayarın anlayacağı, daha kolay ve verimli saklayıp, bulabileceği sembollere
çevrilmesidir.
Ön işleme algoritmaları, ihtiyaç duyulan verileri, ileriki aşamalar için uygun hale
getirmeyi sağlar. Diğer bir değişle, gerçek dünya ile tanıma motorları arasındaki
köprüyü sağlar.
2.7.1 Karakter Tanıma Ön İşlemler
Karakter tanıma işlemi genel olarak ön işlemleri gerektirmektedir. Ön işlemlerden
bazıları eşikleme, inceltme, onarma ve normalleştirmedir.
31
Şekil 2.15 Karakter ön işlemleri
2.7.1.1 Eşikleme
Eşikleme giriş karakterinin ikilik görüntüsünü elde etmek için kullanılır.
2.7.1.2 İnceltme
İnceltme (iskelet alma ya da skeleton) işlemi ikilik bir resme aşağıdaki 8 yapısal
elemanın uygulanması ile yapılır. Ve bu uygulamalar kaynak görüntüde ciddi bir
değişikliğe sebebiyet vermeyene kadar tekrarlanır.
0 0 0 X 0 0 1 X 0 X 1 X 1 1 1 X 1 X 0 X 1 0 0 X
X 1 X 1 1 0 1 1 0 1 1 0 X 1 X 0 1 1 0 1 1 0 1 1
1 1 1 X 1 X 1 X 0 X 0 0 0 0 0 0 0 X 0 X 1 X 1 X
Şekil 2.16 İnceltme işlemi için yapısal elemanlar
Burada X durumu önemli değildir. X ne olursa olsun aynı sonuç alınacaktır.
Şekil 2.17’de inceltilme öncesi ve sonrası farklı tonlar ile gösterilmiş aslında ikilik
seviyede olan bir resim örneği yer almaktadır. Gri ile gösterilmiş (aslında resmin ilk
hali olan) alanlar inceltme işlemi sonrasında siyah olarak ifade edilmişlerdir.
Şekil 2.17 İnceltme işlemi
32
İnceltme işlemi tanıma işlemini daha kolay ve hızlı bir hale getirir. Ayrıca
oluşabilecek hataları en aza indirir. Çerçevelenmiş karakterdeki bilgi taşıyan siyah
piksel sayısını en aza indirdiği için, isleme sokulacak nokta sayısı azalmış olur. Bu
da program hızını artırır.
2.7.1.3 Onarım
Onarım işleminde, kalınlaştırma işlemi kullanılarak kopuk çizgilerin birleştirilmesi,
eğri ve doğruların biçimlerinin düzenlenmesi sağlanır. Morfolojik işlem uygulanarak
elde edilir.
2.7.1.4 Normalleştirme
Normalleştirme, yazı karakterlerinden kaynaklanan farklılıkların ortadan kaldırılarak
standart bir şekle getirilmesidir. Genellikle karakter geometrisindeki değişim olarak
tanımlanabilir. Değişimler, pozisyon, boyut ve konumda olabilir. Örneğin 12x7 ve
14x8 boyutlarında bir karakterin 25x25 bir alana taşınması bir normalleştirme
(ölçekleme) işlemidir. Böylece, karakter belli bir standart ölçüye getirilir
2.7.2 Korelasyon ile Karakter Tanıma
Tek başına, sabit boyutlu, düzlemle açısı sıfır olan karakterleri tanımak için etkili bir
yöntemdir (Kittler, Pattern Recognition, 1988). Iki rastlantısal değişkenin birbiri ile
doğrusal olarak benzerliğinin bir ölçüsüdür.
,
(( )( ))cov( , ) X Y
X Y
X Y X Y
E X YX Y µ µρ
σ σ σ σ
− −= = (2.20)
Burada;
,X Yρ : X,Y’nin korelasyonu
Xµ : Beklenen değer
Xσ : Standart sapma
33
E :Değişkenlerin beklenen değeri
cov :Kovaryans
( )X
E Xµ = ve 2 2 2( ) ( )X
E X E Xσ = − olarak yazılabildiğinden, yukarıdaki eşitlik şu
şekilde de yazılabilir:
, 2 2 2 2
( ) ( ) ( )
( ) ( ) ( ) ( )X Y
E XY E X E Y
E X E X E Y E Yρ
−=
− − (2.21)
Korelasyon, standart sapma değerlerinin sıfırdan farklı ve sonlu olması durumunda
hesaplanabilir. Birbiri ile ilintisi olmayan iki değişkenin korelasyon sonucu “0”dır.
Benzerliğin alabileceği maksimum değer “1”dir.
2.7.3 Destek Vektör Makineleri Ve Öğrenme Metodolojisi
2.7.3.1 Lineer Öğrenme Makineleri
Makinelerin öğrenebilme yetenekleri uzun yıllardan beridir insanların merakını alan
bir konudur. Sistemlerin öğrenebilme yetenekleri, herhangi bir matematiksel modeli
olmayan problemlerin çözümünde önemli bir yer tutmaktadır.
2.7.3.1.1 Lineer Sınıflandırma
İkili sınıflandırma sıklıkla bir : nf x R R⊆ → gerçek-değerli fonksiyonu şu şekilde
uygulanarak yapılır: x=(x1, x2, … , xn) girişi eğer f(x) ≥0 pozitif sınıfa, değilse
negatif sınıfa atanmıştır. f(x), x X∈ ’in bir lineer fonksiyonu ise,
1
( ) .
( )n
i i
i
f x w x b
f x w x b=
= ⟨ ⟩ +
= +∑ (2.22)
olarak yazılabilir.
34
Burada ( , ) *nw b R R∈ parametreleri, fonksiyonu ve sgn(f(x)) ile verilen karar
kuralını kontrol eder (sgn(0)=1). Öğrenme metodolojisi bu parametrelerin, veriden
öğrenilmesi gerektiğini belirtir.
Şekil 2.18 İki boyutlu eğitim seti için bir (w,b) ayırıcı hiperdüzlemi
Bu tür bir varsayımın geometrik bir açıklaması X giriş uzayının <w.x>+b = 0 eşitliği
ile tanımlanan hiperdüzlem ile ikiye bölündüğüdür. Bir hiperdüzlem iki ayrı sınıfı
barındıran uzayı ikiye böler. Şekil 2.18’deki hiperdüzlemin üst kısmı pozitif bölgeyi,
alt kısmı ise negatif bölgeyi gösterir. X vektörü hiperdüzleme dikey bir yön tanımlar.
b’nin değişen değeri hiperdüzlemi kendisine paralel taşır. w ve b nicelikleri nöral ağ
literatüründeki gibi ağırlık vektörü ve bias (eğilim, verev) olarak kullanılacaktır.
X giriş uzayını ve Y çıkış alanını gösterecektir. Genellikle nx R⊆ , ikili sınıflandırma
için Y={-1,+1}, m-sınıflı sınıflandırma için Y={1, 2, … , m} ve regresyon için
Y R⊆ ’dir. Bir eğitim kümesi eğitim örneklerinden oluşmuştur ve bunlar eğitim
verisi olarak adlandırılır. Genellikle
1 1(( , ),...( , )) ( * )n
n nS x y x y X Y= ⊆ (2.23)
olarak belirtilir. n : örnek sayısıdır.
35
xi’ler örnek, yi’ler ise etiketleri olarak gösterilir. S eğitim kümesi, eğer tüm
örneklerin etiketleri eşit ise önemsizdir. Eğer x bir vektör uzayı ise giriş vektörleri
ağırlık vektörleri olarak sütun vektörleridir.
Bir (xi, yi) örneğinin sınırı (fonksiyonel), (w,b) düzlemi için
( . )i i iy w x bγ = ⟨ ⟩ + (2.24)
şeklinde tanımlanır.
0iγ > , (xi, yi)’nin doğru sınıflandırmasını ifade eder. S eğitim kümesinin sınırı,
bütün hiperdüzlemlerin üzerindeki maksimum geometrik sınırdır. Bu en büyük
değeri gerçekleştiren hiperdüzlem, en büyük sınır hiperdüzlemi olarak bilinir.
Kendisinin sınırının boyutu, lineer ayrılabilen eğitim kümesi için pozitif olacaktır.
2.7.3.1.2 Kernel Tabanlı Özellik Uzayı
Kompleks gerçek-dünya uygulamaları lineer fonksiyonlardan daha anlamlı varsayım
uzayları gerektirir. Kernel ifadeleri, lineer öğrenme makinelerinin hesapsal gücünü
artırmak için veriyi yüksek boyutlu bir özellik uzayını düşürerek alternatif bir çözüm
sunar. Lineer makinelerin ikili ifadedeki kullanımı bu adımı gerçekleştirmeyi
mümkün kılar.
2.7.3.1.3 Özellik Uzayları ve Kerneller
Şekil 2.19, giriş uzayından özellik uzayına dönüşümü temel alan DVM’lerin temel
fikrini göstermektedir.
36
Şekil 2.19 Giriş uzayından özellik uzayına dönüşüm
:
( , ) ( ( ), ( ))
NR F
K x y x y
Φ →
= Φ Φ (2.25)
Eğer F yüksek-boyutluysa yukarıdaki eşitliğin sağ tarafının hesabı çok uğraştırıcı
olacaktır. Bununla birlikte hesabı verimli kılan kerneller mevcuttur. Örneğin
polinomal kernel;
K(x,y) = (x,y)d (polinomal kernel) (2.26)
d=2 ve 2,x y R∈ için, örneğin 2( , ) ( ( ). ( ))x y x x= Φ Φ oluyorsa;
2 2
1 1 2 2( ) ( , 2 , )x x x x xΦ = olacaktır. (2.27)
Polinomal kernelin yanı sıra en çok kullanılan kerneller sigmoid kernel, RBF (Radial
Basis Function) kernelleridir.
( , ) tanh( ( . ) ))K x y x y Фκ= + Sigmoid Kernel (2.28)
2 2( , ) exp( || || /(2 ))K x y x y σ= − − RBF Kernel (2.29)
2.7.3.1.4 Özellik Uzayında Öğrenme
Öğrenilecek hedef fonksiyonun karmaşıklığı gerçekleştirme yoluna dayanır ve
bundan dolayı öğrenme işinin zorluğu değişir. İdeal olarak spesifik öğrenme
Giriş Uzayı Özellik Uzayı
37
problemine uyan ifade seçilebilir. Dolayısıyla makine öğrenmesinde yaygın bir
önişleme stratejisi verinin ifadesinde değişim içerir.
1 1( ,..., ) ( ) ( ( ),..., ( ))n Nx x x x x x= → Φ = Φ Φ (2.30)
(2.29) ifadesi X giriş uzayını yeni bir uzaya haritalamaya eşittir.
{ ( ) | }F x x X= Φ ∈ (2.31)
Veriyi başka bir uzaya haritalamak, makine öğrenmesindeki işi çok basitleştirir ve
verinin en iyi ifadesinin seçimi için teknik sayısını artırır. Veriyi anlatmak için
tanıtılan nicelikler genellikler özellik olarak adlandırılır, en uygun ifadeyi seçme işi
ise özellik seçimi olarak bilinir. X uzayı giriş uzayı olarak alınır ve
{ ( ) | }F x x X= Φ ∈ özellik uzayı olarak adlandırılır.
Şekil 2.20 iki boyutlu bir giriş uzayından, iki boyutlu bir özellik uzayına haritalamayı
gösteren bir örnektir. Veri giriş uzayında lineer bir fonksiyonla ayrılamazken, özellik
uzayında ayrılabilir.
Şekil 2.20 Sınıflandırma işini basitleştiren bir özellik haritası
2.7.3.1.5 Vapnik ve Chervonenkis (VC) Teorisi ve VC Boyutu
Lineer ve nonlineer DVM ifadelerinde, sınır (margin) ifadesinin büyük bir rol
oynadığı görülür.
φ( )
φ(.)
φ( )
φ( ) φ( )
φ( ) φ( )
φ( ) φ( ) φ( )
φ( )
φ( )
φ( )
φ( ) φ( )
38
VC boyutu genellikle h ile ifade edilir. VC boyutu sınıflandırma fonksiyonlarının
kapasitesini ölçer. Fonksiyonlar kümesi için bir VC boyutu h ile parçalanan eğitim
örneklerinin maksimum sayısı olarak tanımlanır.
( , ) {0,1}Fi x w ∈ ya da ( , ) { 1,1}Fi x w ∈ − (2.32)
iF gösterge fonksiyonlarını belirten bir ifadedir. İki sınıflı sınıflandırma işlemlerinde
( , )F
i x w gösterge fonksiyonlarının bir kümesinin VC boyutu, bütün olağan
durumlarda ayrılabilecek noktaların en büyük h sayısını gösterir. İki sınıflı örüntü
tanıma problemlerinde, n tane nokta kümesi 2n mümkün yolla etiketlenebilir. Eğer
kümenin üyeleri, bütün etiketleri doğru olarak işaret ediyorsa, bu fonksiyonlar
kümesinin VC boyutu h=n’dir
İki boyutlu sınıflandırma problemlerinde, R2(x1,x2) özellik uzayında, hiperdüzlemin
bir tarafındaki bütün noktalar +1, diğer tarafındaki noktalar da -1 değerini alır.
Üç noktanın bir hiperdüzlem tarafından nasıl ayrıldığı 23=8 şeklinde hesaplanır.
Bir n-boyutlu giriş uzayında, yönlü hiperdüzlem gösterge fonksiyonunun VC boyutu
h=n+1 (2.33)
olarak hesaplanır.
VC boyutu istatistiksel öğrenme teorisindeki bütün sonuçlarda kullanılır. Kolay bir iş
değildir. Bu nicelik, spesifik tahmin fonksiyonuna ve çözülecek öğrenme
probleminin tipine bağlıdır (sınıflandırma veya regresyon problemlerinden biridir).
2.7.3.1.6 Langrangian Teorisi
Langrangian teorisinin amacı başlangıçta hiçbir eşitsizlik sabiti olmayan bir
optimizasyon probleminin çözümünü karakterize etmektedir. Bu teorinin ana
39
konsepti Langrangian çarpanları ve Langrangian fonksiyonudur. Bu metot 1797’de
mekaniksel problemler için Langrange tarafından geliştirilmiştir.
f(w) amaç fonksiyonlu ve hi(w)=0, i=1,…,m eşitlik sabitli verilen bir optimizasyon
problemi için
1
( , ) ( ) ( )m
i i
i
L w f w h wβ β=
= +∑ (2.34)
Langrangian fonksiyonudur ve iβ katsayılarını Langrangian çarpanları olarak
adlandırılır.
2.7.3.2 Destek Vektör Makineleri (Support Vector Machines)
Destek Vektör Motoru - DVM bir öğrenme algoritması olarak Vapnik tarafından
geliştirilen İstatiksel Öğrenme Teorisi (Vapnik, 1998) nin bir uygulaması olarak
ortaya çıkmıştır. DVM’ler yapısal risk minimizasyon prensibi etrafında
formülleştirilmiştir. Beklenen riskin üst sınırını küçüklemeye çalışır.
Destek Vektörü öğrenme iki bakımdan çok kullanışlıdır. Birincisi Destek Vektörü
öğrenme basit fikirler üzerine kurulmuştur. İkincisi yüksek performanslı pratik
uygulamalarda kullanılabilir (Yıldırım, 2006).
DV algoritması öğrenmesi teorisinin ve pratiğinin kesiştiği bir uygulamadır; bazı
belirli algoritma tipleri için istatistiksel öğrenme teorisinde hesaplamaların başarılı
olması için faktörler tam olarak istenir. Gerçek dünya uygulamaları, sık sık teorik
olarak çözülmesi zor ve kompleks olan uygulamalardır. DV algoritması iki zorluğu
da basitçe kaldırabilir. Yeterince kompleks olan modellere çözüm getirebilir.
Matematiksel olarak analizi basittir, çünkü nonlineer giriş uzayındaki verileri
dönüşümler yaparak özellik uzayına düşürür ve çözüm kolaylaşır.
40
Özellikle iki sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı
büyükleyen optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt
etme yüzeyine en yakın noktaların arasındaki mesafeyi en büyüklemektir. Ayrıca,
optimal ayırt etme yüzeyi, destek vektörleri olarak adlandırılan veri noktaların küçük
bir kümesinde merkezlenmiş kernel fonksiyonların doğrusal bir kombinasyonu
olarak ifade edilmektedir. Genelde destek vektörleri çok az miktarda olduğu için
optimal ayırt etme yüzeyinin gösterimi seyrektir, bir anlamda veri noktalarının
sadece bir bölümü sınıflandırma görevi ile ilgilidir. Buna ilaveten, doğrusal
kombinasyon katsayıları doğrusal eşitsizlik ve kısıtları dahilinde bir konveks ikinci
dereceli (quadratic) programlama probleminin çözümü ile belirlenmektedir. Çok
katmanlı perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde
edilen DVM ağların özel durumları olarak gösterilebilir.
2.7.3.2.1 En Büyük Sınırlı Sınıflandırma ve Lineer Destek Vektör Makineleri
DVM’lerin en basit modeli en büyük sınırlı sınıflandırma olarak bilinmektedir.
DVM’lerin bu kısmı sadece lineer olarak ayrılabilen özellik uzayı için geçerlidir. Bu
nedenle, çoğu gerçek-dünya uygulamalarında kullanılması oldukça zor bir
yöntemdir. Ama anlaşılması en kolay algoritmadır ve daha karmaşık DVM için temel
kısmı inşa etmektedir. DVM için geçerli olan çoğu anahtar özellikleri içinde
bulundurur.
Giriş verilerinin kernel fonksiyonlarından geçirilip özellik uzayına düşürülmesi gerek
yoktur. Sadece verileri birbirinden en iyi şekilde ayıran ve en büyük sınırlı
sınıflandırmayı yapan hiperdüzlemi bulmak yeterli olacaktır.
Hiperdüzlem tarafından ayıran veriler x+ ve x- ise
. 1w x b+⟨ ⟩ + = + (2.35)
. 1w x b−⟨ ⟩ + = − (2.36)
41
Sınıflandırıcının sınırı γ ile gösterilecek olursa;
2 2
1. .
2 || || || ||
w wx x
w wγ + −
= −
(2.37)
2
1( . . )
2 || ||w x w x
w
+ −= −
2
1
|| ||w= ifadesi geometrik sınırı verecektir. (2.38)
1 1(( , ),..., ( , ))n nS x y x y= ile verilmiştir bir lineer olarak ayrılabilen eğitim kümesinde
optimizasyon problemini çözen (w,b) hiperdüzlemi en büyük değerli sınırlı
hiperdüzleminde geometrik sınırı 21/ || ||wγ = olarak hesaplanır.
2.7.3.2.2 Lineer Ayırt Edilebilir Sınıflar
N boyutlu bir 1
{( )}N
i i iS x y
== + eğitim kümesi verilmiş olsun, burada i=1, 2 ,…, N
için n
ix R∈ ve iy { 1, 1}∈ − + . Diğer değişle, S’teki örneklerin iki sınıftan birine ait
olduğu varsayılmıştır. Bununla beraber sınıfların hiperdüzlemin aynı tarafındaki bir
sınıfın bütün elemanlarının yer aldığı bir hiperdüzlem ile ayırt edilebildiği kabul
edilmiştir. Amaç iki sınıfı ayıran hiperdüzlemin eşitliğini bulmaktadır. Sınıflandırma
için DVM yapısında çözümü zorlayan kısıt, optimal ayırt etme yüzeyinin eğitim
kümesine en yakın noktalar ile birlikte mesafeyi büyüklemek zorunda olmasıdır. Bu
kavramları daha anlaşılır hale getirmek amacıyla bir takım tanımlara ihtiyaç vardır.
Eğer nw R∈ ve w R∈ olursa, aşağıdaki durumları sağlayacak şekilde S kümesi
doğrusal olarak ayrılabilir:
1,2,...,i N= için ( )i iy w.x b 1+ ≥ (2.39)
(w,b) çiftinin w.x+b = 0 eşitliğine ait ayırt etme hiper uzayını tanımlamaktadır. di,
ayırt etme hiper uzayından xi noktasına kadar olan mesafeyi göstersin:
42
( . )
|| ||i
i
w x bd
w
+= (2.40)
burada ||w|| sembolü, w’nin normunu göstermektedir. Böylece bütün ix S∈ ’ler için
aşağıdaki eşitsizlik sağlanır:
1
|| || i iy dw
≤ (2.41)
yi di her zaman pozitif bir niceliktir. Buna ilaveten, 1/||w||, xi noktaları ve ayırt etme
hiperdüzlemi (w,b) arasındaki mesafenin alt sınırıdır; yani S noktaları ve en az
1/||w||’ye eşit olan ayırt etme hiperdüzlemi arasındaki mesafedir.
Doğrusal bir şekilde ayrılabilen S kümesi için optimal ayırt etme hiperdüzlemi, S’e
ait en yakın noktanın mesafesini en büyükleyen hiperdüzlemdir.
Optimal ayırt etme hiperdüzlemi ve S’e ait en yakın nokta arasındaki mesafe 1/||w||
olduğu için optimal ayırt etme hiperdüzlemi, 1/||w|| niceliğini en büyükleyen S için
ayırt etme hiperdüzlemi olarak yorumlanabilir.
1/||w||’nin en büyüklenmesi, ||w||’nin en küçüklenmesine eşit olduğu için bu
problemin çözümü S’in optimal ayırt etme hiperdüzlemine eşittir. 2/||w|| niceliği
sınıflar arsındaki sınır olarak adlandırılır ve optimal ayırt etme hiper yüzeyi sınırı en
büyükleyen hiperdüzlem olarak yorumlanabilir. Sınır, S kümesinin ayırt edilebilirlik
ölçütüdür veya diğer bir değişle sınıflandırma problemlerinin karmaşıklığının bir
ölçütüdür.
43
Şekil 2.21 Sınır değerleri
Lineer olarak ayrılabilen durumlarda, sınıfları birbirinden ayıracak birkaç
hiperdüzlem bulunabilir. Önemli olan bu hiperdüzlemler içinde en iyisini
seçebilmektedir. Lineer olarak ayrılabilen verilen sınıflandırılması durumunda, bütün
hiperdüzlemler içinde eğitim arızasını minimize eden, en büyük sınır değerine sahip
olan hiperdüzlem seçilir. Büyük değerli sınıra sahip olmayan hiperdüzlemin
beklenen riski yüksek olacaktır.
2.7.3.2.3 Lineer Olarak Ayırt Edilemeyen Sınıflar
Gerçek hayatta karşılaşılan çoğu problemler ya lineer ya da nonlineer durumlarda
ayırt edilemez. Genellikle mümkün olduğu kadar sınıfları ayırabilen giriş kümeleri
bulmaya çalışır, fakat çoğunlukla ilgili girişler kayıptır, veri tam değildir, güvenilir
değildir veya gürültülüdür.
Doğrusal olarak ayırt edilebilen sınıflar hipotezi pratik uygulamalar için oldukça
sınırlıdır. Bu nedenle önceki sonuçları düzenlemeye gerek vardır. Bu durum,
( . ) 1i i i
y w x b ξ+ + < ifadesini sağlayacak şekilde bir takım ( , )i ix y S∈ noktalarının var
olduğu anlama gelir. Negatif olmayan bir iξ serbestlik değişkeninin girilmesi
w.x+b = -1 w.x+b = 0
w.x+b = +1 Sınır
44
( . ) 1i iy w x b+ ≥ ile aynı formda doğru şekilde sınıflandırılmamış bir nokta için kısıt
belirtmeye ve doğrusal olarak ayırt edilemeyen eğitim kümesi durumunda önceki
analizleri genişletmeye izin verir. Bu amaçla, aşağıdaki ifadeyi sağlayacak şekilde N
adet negatif olmayan serbestlik değişkeni (S’deki her nokta için) 1 2( )Nξ ξ ξ ξ= + +
verilirse;
( . ) 1i i iy w x b ξ+ + ≥ i=1,2,…,N, (2.42)
xi noktası doğru bir şekilde sınıflandırılmış ise iξ =0 eşitliğine göre
( . ) 1i i iy w x b ξ+ + ≥ ’dir ve ( . ) 1i i iy w x b ξ+ + ≥ kısıtı ( . ) 1i iy w x b+ ≥ ’e dönüşür. xi
noktası doğru bir şekilde sınıflandırılmamış ise ( . ) 1i i iy w x b ξ+ + ≥ ’in sağlanması
için serbestlik değişkenine uygun şekilde bir iξ >0 değeri varsayılacaktır.
Lineer metottan, nonlineer tekniğe geçişi yapabilmek için Vapnik verisini çok
boyutlu özellik uzayına haritalamayı gerçekleştirmiştir. Giriş değerleri özellik
uzayına düşürülerek lineer ayırıcı hiperdüzlem yapılmıştır.
( )K x,z ( ). ( )x z= Φ Φ uygulaması sıklıkla kernel oyunu diye adlandırılır. Bu bize
kesin hesaplamalar yapmadan çok boyutlu özellik uzayında çalışma kolaylığı sunar.
Bu kernel oyununu uyguladıktan sonra hesaplamalar başka uzayda gerçekleştirilir.
DVM’lerde (.)Φ dönüşümleri yapılarak çok boyutlu özellik uzayında
formülasyonlar yapılır.
2.7.3.2.4 Nonlineer Destek Vektör Makineleri Sınıflandırıcıları
Lineer Destek Vektör Makineleri Sınıflandırıcılarından nonlineer DVM
sınıflandırıcılara genişletme basittir. X ile ( )xΦ biçimsel olarak yer değiştirebilir ve
kernel oyunu uygulanabilir.
45
Nonlineer DVM’leri dizayn etmek için temel fikir, giriş uzayındaki verileri yüksek
boyutlu özellik uzayına düşürmektedir.
1 1 2 2( ) [ ( ), ( )..., ( )]n T f
n nx R z x a x a x a x Rφ φ φ∈ → = ∈
Yukarıdaki gösterimde n fR R→ ’e bir dönüşüm gösterilmiştir. Bir ( )xφ eşleştirmesi
önceden seçilen, sabit bir fonksiyondur. Bir x-giriş uzayı, x giriş vektörünün xi
bileşenlerinden oluşur ve bir f-özellik uzayı (z-uzayı) z vektörünün ( )i xφ
bileşenlerinden oluşur. Bu dönüşüm yapıldıktan sonra z- uzayında lineer algoritma
uygulanarak çözüme ulaşılması beklenilir.
Bir x-giriş uzayından, yüksek dereceli z-uzayına düşürme işleminde iki problemle
karşılaşabiliriz: ( )i xφ eşleştirmesinin seçimi ve eğer f özelliklerinin sayısı çok fazla
ise hesaplanması gözü korkutan bir ( ). ( )Tz x z x skaler çarpımının hesaplama
işlemidir. Bu işlemlerden de kurtulabilmenin yolu kernel fonksiyonlarının
kullanımıdır.
Bir özellik uzayındaki ( ). ( )T
i jx xφ φ skaler çarpımlarını, herhangi bir kernel
fonksiyonu seçildikten sonra K(xi, xj) hesaplamasını yaparak bulabiliriz. Bu çok
uğraştırıcı bir işlem değildir.
En çok kullanılan kernel fonksiyonları şunlardır:
( , ) ( . )dK x y x y= polinomal kernel (2.43)
( , ) tanh( ( . ) )K x y x y Фκ= + ) sigmoidal kernel (2.44)
2 2( , ) exp( || || /(2 ))K x y x y σ= − − RBF Kernel (2.45)
Nonlineer durumlarda da Langrange çarpanlarını kullanıp gerekli işlemler yapılır ve
özellik uzayına düşürülen veriler sınıflandırılır.
46
1 1
1( )
2
n nT
d i i j i j i j
i j
L y y z zα α α α= =
= −∑ ∑ (2.46)
1 1
1( ) ( , )
2
n n
d i i j i j i j
i j
L y y K x xα α α α= =
= −∑ ∑ (2.47)
Burada 0iα ≥ , i=1, … , n ve 1
0n
i i
i
yα=
=∑ ’dir.
2.7.3.2.5 Çok Sınıflı Sınıflandırma
DVM’ler aslında ikili sınıflandırıcılardır. Sadece iki sınıfı birbirinden ayırmak için
tasarlanmışlardır. Bununla birlikte, çoğu gerçek uygulamalarda, çok-sınıflı
sınıflandırma gerekmektedir.
Bir çözüm çok-sınıflı bir problemi birkaç 2-sınıflı probleme ayrıştırmak,
sınıflandırıcıları bu problemleri çözmek için eğitmek ve çıkış için bunları tekrar
yapılandırmaktır. En kolay çok-sınıflı sınıflandırma yapılarından biri birine-karşı-
diğerleri yaklaşımıdır. Bu metotta, K sınıflandırıcı, her sınıflandırıcı diğerlerinden bir
sınıf ayıracak şekilde oluşturulmuştur. Bununla birlikte, çoğu uygulamalarda, bu
yaklaşım diğerlerine göre alt seviye kalmaktadır.
İkişerli sınıflandırıcıların çözümlerinin çıkışlarından son sınıflandırma çözümünü
yapılandırmak için çeşitli planlar vardır. En basit metotlar çoğunluk oylamasına
bakar. İkişerli sınıflandırıcılar sınıflar için oylar verir ve en çok oyu alan sınıf dikkate
alınan örnek için son karar sınıfı olarak seçilir. Eğer tekrar oluşturma kullanılmışsa,
sınıflandırıcılar sadece ikili oylar (-1 ya da 1) kullanılabilir, fakat yumuşak
oluşturmada sınıflandırıcıların kesin çıkışları oy olarak göz önüne alınmıştır. DVM
tabanlı bir sınıflandırıcının kesin çıkışı ne kadar yüksekse, sınıflandırılacak örnek
pozitif sınıfa aittir ve çıkış ne kadar küçükse örnek negatif sınıfa aittir. Eğer çıkış
sıfıra yakınsa sınıflandırma kararı güvenilmezdir.
47
Çoğunluk oylaması uygularken önemli bir problem meydana gelir. Verilen bir x
örneği için, oylama planı bütün çift sınıflandırıcıların çıkışlarını değerleri dikkate
alınmadan eşit olarak ağırlıklandırır. Tabi ki, sınıflandırıcının başarısıyla ilgilenen
konu ile ilgili sınıflandırıcılar gelişmede bilinmemektedir. Bununla birlikte, bazı çift
sınıflandırıcıların fazlalığı bir karışım matrisiyle birlikte düşünülebilir. Bu yaklaşımla
birlikte, sınıflandırıcıların çıkışları karışım matrisiyle lineer olarak birleştirilir.
2.7.3.2.6 Bire-karşı-biri Metodu
Bu metotta k tane sınıf varsa eğer k.(k-1)/2 tane sınıflandırıcı yapılandırılır ve
aşağıdaki ikili sınıflandırma problemi çözülür.
,
1( ) ( )
2minij ij
ij T ij ij ij
n
tw b
w w C w Tξ+ ∑ (2.48)
( ) ( ) 1ij T ij ij
n nw x bφ ξ+ ≥ − , eğer yn=i ise (2.49)
( ) ( ) 1ij T ij ij
n nw x bφ ξ+ ≤ − eğer yn=j ise (2.50)
Bütün M tane sınıflandırıcının yapılandırılmasından sonra bir sonraki testi yapmak
için farklı metotlar vardır.
2.7.3.2.7 Bire-karşı-diğerleri Metodu
Bu metotta da, k sınıflı bir problem için k tane ikili sınıflandırıcı oluşturulur. i.
sınıftaki veriyi pozitif etiketli, diğerlerini negatif etiketli olarak alır. i. DVM
aşağıdaki problemi çözer.
, ,
1( )
2minij ij i
i T i i
j
tw b
w w Cξ
ξ+ ∑ (2.51)
( ) ( ) 1i T i
j i jw x bφ ξ+ ≥ − , eğer i
y i= ise (2.52)
( ) ( ) 1i T i
j i jw x bφ ξ+ ≤ − + , eğer i
y i≠ ise (2.53)
48
3. MATERYAL VE YÖNTEM
Plaka tanıma uygulaması MATLAB® programı kullanılarak gerçekleştirilmiştir.
Mathworks firması tarafından geliştirilen bu program, MATrix LABoratory
kelimelerinin kısaltılmasıdır. MATLAB hazır fonksiyonlar ve programlama yoluyla
birçok alandaki yoğun matematiksel algoritma ve işlemlerin gerçekleştirilmesini
sağlayan bir matematiksel çözüm platformudur. MATLAB, görüntü işleme
gereçlerinin yanı sıra kontrol sistemleri, haberleşme, yapay sinir ağları, istatistik gibi
birçok alanda uygulama geliştirmeye imkân sağlamaktadır.
Değişik mekânlarda rasgele seçilen yaklaşık 200 adet aracın 340 adet görüntüsü
dijital kamerayla jpg formatında kaydedilmiştir. Görüntüler plakanın işlenebilirliği
göz önünde tutularak yaklaşık 2-5m mesafeden alınmıştır. Çalışmada kullanılan
görüntüler, günün farklı saatlerinde, farklı açılardan çekilmesine önem verilmiştir.
Bunun için tasarlanan program ile plaka bilgisi, giriş olarak verilen görüntüden
çıkışta değişik platformlarda kullanılmaya hazır metin bilgisine çevrilmektedir. Plaka
tanıma üç ana başlık altında ele alınmıştır.
• Plaka Bölgelerinin Bulunması,
• Karakterlerin Ayrıştırılması,
• Karakterlerin Tanınması.
3.1. Plaka Bölgesinin Bulunması
Bu çalışmada şimdiye kadar denenen yöntemlere alternatif olarak farklı bir yöntem
denenmiştir. Uyguladığımız yöntem ile hem özel ve resmi plaka tarzları hem de kare
(çift satırlı) tarzı plakalar saptanmıştır. Bu aşamada uygulanan adımlar Şekil 3.1’ de
gösterilmiştir.
49
. Şekil 3.1 Plaka bölgesinin bulunması
Şekil 3.2.a’da orijinal görüntü ve Şekil 3.2.b’de Top-hat dönüşümü uygulanmış
görüntü gösterilmiştir. Şekil 3.2’de görüldüğü gibi arabanın beyaz olması plaka
bölgesinin ayrıştırılması herhangi bir dezavantaja yol açmamaktadır. Düz olan
bölgeler yani arka plan ile zıtlık içermeyen bölgeler, koyu renge dönüşmüştür.
Burada da görülebileceği gibi plaka bölgesi olduğu gibi kalmıştır.
Şekil 3.2 (a) Giriş görüntü, (b) Top-hat dönüşümü
Kontrol Birimi Görüntü işleme birimi
Top-hat
Dönüşümü
Doldurma
+
Eşikleme
Etiketleme Aday plaka
bölgeleri
50
Şekil 3.3 Resmi plakaya uygulanan koyu nesneler için Top Hat dönüşümü
Şekil 3.3’de resmi bir plakaya sahip görüntüye koyu nesneler için top-hat dönüşümü
(bknz.bölüm 2) uygulanmış görüntü gösterilmiştir. Şekil 3.3’de görüldüğü gibi beyaz
karakterler siyah karakterlere, arka planda beyaza dönüşmüştür. Dolayısıyla burada
bu görüntüde elde edilen plaka bilgisi Şekil 3.2’de elde edilen plaka bilgisiyle aynı
özelliğe sahip olmaktadır. Bundan dolayı sonraki aşamalarda faklı plaka tarzları için
farklı işlemler uygulanmasına gerek kalmamıştır.
TopHat dönüşümünden sonra doldurma işlemi ile plaka bölgesinde bulunan
karakterler doldurularak plaka bölgesi bütün olarak elde edilir (Şekil 3.4.b). Bu
sayede plakayı içine alan bir bölge oluşturulmuş ve bu bölgenin içi tamamen
doldurulmuş olur. Bu yöntem, çift satırlı (motorsiklet v.s) plakaların yerini bulmakta
oldukça kolaylık sağlar (Şekil 3.4).
(a) (b)
51
(c)
Şekil 3.4 (a) Orijinal görüntü, (b) Top hat dönüşümü ve doldurma işleminin
uygulanmış hal, (c) ikilik seviyedeki görüntü
Doldurma işleminden sonra gri düzeye sahip görüntü, otsu eşikleme yöntemi ile ikili
imge haline çevrilir ve plaka bölgesi olamayacak kadar küçük alanlar silinir (Şekil
3.5).
Şekil 3.5 İkilik seviyedeki görüntü
3.1.1 Bölgelerin Etiketlenmesi
Elde edilen ikili görüntüye etiketleme işlemi uygulanarak her öbek ayrı bir renk ile
etiketlenir (Şekil 3.6). Bölgelerin sınıflandırılabilmesi için birbirileri ile komşu olan
noktaların etiketlenmesi açısından önem taşır.
52
Şekil 3.6 Etiketlenen görüntü
En sol üst köşeden başlanarak, birbiriyle temas etmeyen bütün bölgeler
numaralandırılır. Bundan sonra yapılacaklar her işlemde, bölgeler bu etiketleri
yardımıyla işlenecektir.
Etiketlenen her bölgenin boy, genişlik, alan, en-boy oranı ve görüntü içerisindeki
koordinat bilgileri bulunur. Bu bilgiler kullanılarak plaka bölgesi olabilecek aday
bölgeler belirlenir. Plaka bölgesinin plaka özelliği taşıyıp taşımadığına kural tabanlı
çalışan bir yöntemle karar verilir.
3.1.2 Aday Plaka Bölgelerin Sağlaması Gereken Koşullar
Plaka bölgesi olabilecek bölgeler, belirli bir en boy oranına sahip olması gerekir. Bu
bölgelerin en-boy oran kriteri incelenerek dikdörtgensel veya kare bir alan olup
olmadığını kontrol edilir. En ve boy uzunluğunun 2-5m mesafeden çekilen
fotoğraflarda belirli ölçülerde olmasından dolayı, plakanın işlenebilirliği göz önünde
tutularak plakanın genişliği 12, boyu 40 pikselden az olmamalıdır. Daha az olması
durumunda plaka karakterlerin belirsiz olacağından tanımlanması çok zordur.
Plakanın özelliklerini, sabit arka plan üzerinde yüzen, birbirine benek komşuluğu
olmayan ve arka planda yüksek kontrasta sahip, genellikle aynı ebatlardaki karakter
ve rakamlardan oluşmuş dikdörtgensel veya kare alan olarak ifade edebiliriz
53
Plaka olabilecek bölge belirlendikten sonra, bu bölgenin içinde yer alan karakter
sayısını ve özellikleri inceleyerek bulunan bölgenin plaka bölgesi olup olmadığı
tespit edilir. Çoklu karakter kriteri nedeniyle doğruluk oranı yüksektir.
(a) (b)
Şekil 3.7 (a) Aday plaka bölgesi, (b) Etiketleme
Her bir olası plaka bölgesi için, Şekil 3.7.b’de görüldüğü gibi etiketleme işlemi
uygulanır. Her bir karakter için, karakter öznitelikleri elde edilir.
Karakter öznitelikleri;
• Karakterler arası uzaklık
• Karakter alanı
• Yüksekliği
• Sayısı
• Genişliği
• Yerleşkesi
Bu özellikler kullanılarak plaka bölgesi olabilecek bölgeler için son karar
verilmektedir. Beyaz fon üzerindeki, siyah karakterlerin sorgulandığı bu aşamada;
üçten fazla karakter bölgesi olması durumunda bölge, plaka bölgesi olarak belirlenir.
Yeterli şartlara uymayan ve yeterli karakter içermeyen aday plaka bölgeleri elenir.
Plaka olma kurallarına uyan tüm bloklar plaka bölgeleri olarak adlandırılır. Bundan
sonraki işlemler bulunan bütün bölgeler için uygulanır. Dolayısıyla bir görüntünün
içinde birden fazla araç varsa hepsinin de plakalarının tanımlanması amaçlanmıştır.
54
3.1.3 Plaka Bölgesinin Yatayla Paralel Hale Getirilmesi
Bulunan plaka bölgesi, her zaman düzleme paralel olmayabilir. Düzleme paralel
olmayan görüntüden, karakterleri ayrıştırma işleminin başarısı önemli ölçüde
azalacaktır.
Şekil 3.8 Plakası bulunacak görüntü
Şekil 3.9 Bulunan plaka bölgesi
Bulunan plaka bölgesine hough dönüşümü uygulanır (Şekil 3.9).
55
θ
ρ
-50 0 50
-150
-100
-50
0
50
100
150
Şekil 3.10 Hough dönüşümü
Şekil 3.11 Plaka bölgesinin eğriliğin tespiti
Hough dönüşümü ile görüntüdeki en belirgin çizgi dikkate alınarak, yatay eksenle
oluşturduğu açı değeri ( Θ ) belirlenir.
Şekil 3.12 Shear dönüşümü
56
Shear dönüşümü (3.1) denklemi kullanılarak plaka bölgesi düzlemle paralel hale
getirilir.
1 0
0 1 0
0 0 1r
r
S
=
(3.1)
Burada tan( )r = Θ ’dir
Şekil 3.13 Shear dönüşümü uygulanmış plaka bölgesi
3.1.4 Plaka Çerçevesinin Çıkarılması
Bulunan plaka görüntüsü gri seviyeye dönüştürüldükten sonra otsu eşikleme yöntemi
kullanılarak ikilik görüntü elde edilir. Böylece arkalan beyaz ve karakterler siyah
olarak ayrıştırılmış olur. Plaka bölgesi, plakaya ait karakterleri/rakamları karakter
tanımlamada en yüksek başarım verecek şekilde ayrıştırmak gerekir. plaka
çerçevesinin çıkarılması ve sadece karakter bilgisinin kalması için yatay ve düşey
izdüşümden faydalanılmıştır (Şekil 3.14).
57
(a) (b)
Şekil 3.14 Plaka çerçevesinin çıkarılması için dikey (a) ve yatay (b) izdüşüm
Şekil 3.14’de gösterilen düşey izdüşüm değerlerinin ortalaması hesaplanır.
İzdüşümün başından ve sonundan başlanarak bu ortalama değere yaklaştığı kısımdan
önceki ve sonraki alanlar çıkarılır. Şekil 3.14’deki yatay izdüşümden görüldüğü gibi
yatay düzleme paralel olduğundan iki minimum değer arasında kalan kısım plaka
karakterlerini içereceğinden diğer kısımlar silinir. Böylelikle plaka bölgesinden,
plaka çerçevesi ayrıştırılarak Şekil 3.15’de görülen plaka karakterleri elde edilmiş
olur.
Şekil 3.15 Plaka karakterlerini içeren görüntü
58
3.2. Karakterlerin Ayrıştırılması
Plaka bölgesi bulunmasının ardından, karakterler ayrıştırılarak tanıma işlemine hazır
hale getirilmesi gerekmektedir. Karakterlerinin doğru bir şekilde ayrıştırılması için,
plaka bölgesine ait görüntü normalize edilir.
3.2.1 Plakanın Normalize Edilmesi
Bulunan ve düzleme paralel hale getirilen plaka bölgesinde, karakterlerinin
ayrıştırılabilmesi için plakanın belirli bir ebada getirilmesi gerekir. Yapılan
denemeler sonucu 40x180 matrisin yeterli olduğu görülmüştür. Daha büyük olması
çözünürlüğü artıracaktır ancak, işlem sayısını artıracaktır. Gerekenden küçük olması
ise çözünürlük çok azaltacağından karakterlerin ayırt edici özellikleri kaybolacaktır.
Şekil 3.16 [40 180] ebadında normalize edilmiş görüntü
Şekil 3.17 [20 100] ebadında normalize edilmiş görüntü
Şekil 3.18 [15 80] ebadında normalize edilmiş görüntü
Karakterlerin ayrıştırılması için normalize edilen plaka bölgesinin tersi alınır. Şekil
3.19’da gösterildiği gibi dikey doğrultudaki izdüşüm bilgisi kullanılır.
59
0 20 40 60 80 100 120 140 160 1800
5
10
15
20
25
30
35
40
Şekil 3.19 Karakterlerinin izdüşümü
Şekil 3.19‘daki karakterlerin izdüşümü grafiğinden vadi ve tepeler tespit edilerek,
minimum değerler arasında kalan genişlik ve yükseklik değerleri dikkate alınır ve
karakter olabilecek kısımlar belirlenir. Belli bir eşik değer altında olan kısımlar
gürültü kabul edilir (Şekil 3.20).
Şekil 3.20 Karakter olmayan bölgelerin silinmesi
60
Hesaplanan karakter genişliği 30’dan büyük ise iki karakterin birleştiğine karar
verilerek ayrıştırma işlemi uygulanır. Şekil 3.21’deki gibi dikey izdüşümünden
faydalanarak belli bir aralıkta, birleşmenin minimum noktasından bölünür.
Şekil 3.21 Birleşen karakterlerin ayrıştırılması
Yapılan gözlemler sonucunda “1” rakamının alabileceği en küçük aralık değerinin
9’dan büyük olması sebebiyle karakter genişliği 9-29 aralığında seçilmiştir. Karakter
olamayacak kadar küçük olan bölgeler silinir.
(a) (b)
(c) (d)
Şekil 3.22 Plaka görüntüsünden plaka karakteri harici nesnelerin silinmesi, (a) Araç
görüntüsünden elde edilen plaka bölgesi, (b) Karakterlerin plaka çerçevesinden
ayrıştırılması, (c) İkili seviyedeki Plaka bölgesinin görüntüsü, (d) Plaka karakteri
harici bölgelerin temizlenmesi
TC plaka standartlarına göre karakter sayısı 6-8 arasında olması gerekir. Ayrıştırılan
karakter sayısını kontrol edilerek bu değerler arasında ise karakter tanıma aşamasına
gönderilir.
61
Karakter ayrıştırma işlemi, her bir karakterin etiketlenmesi yöntemiyle de
bulunabilir. Plaka bölgesi içinde birbirine komşuluğu olan bölgeler bir sayı değeri ile
etiketlenirler. Böylece komşu olmayan bölgeler birbirinden ayrılmış olur. Belirli bir
ebatın altında kalan bölgeler ise otomatik olarak silinir. Bu yöntem ile karakter
ayrıştırmanın en büyük dezavantajı; birbiri ile birleşen iki karakteri, tek bir karakter
olarak belirlenmesidir. Bu durumda birlikte çıkarılan bu karakterler, tanıma
aşamasında tanımlanamamaktadır. Aynı zamanda karakterin çerçeveyle birleşmesi
durumunda karakterin belirlenmesi zordur.
Şekil 3.23 Etiketleme ile karakterlerin ayrıştırılması
3.3. Karakterlerin Tanınması
Plaka bölgesinden ayrıştırılan her bir karakterler, ikilik seviyeyede, izdüşüm işlemi
yapılarak karakterin ana hattı (contour) belirlenir ve 25x20 boyutlarında yeniden
boyutlanır. Daha sonra inceltme ve kalınlaştırma işlemi yapılarak tanıma aşaması
için hazır hale getirilir.
Bu çalışmada karakter tanıma için destek vektör makineleri kullanılmıştır. Destek
Vektör Makineleri (DVM), V.N. Vapnik tarafından geliştirilen istatistiksel öğrenme
teorisi üzerine kurulu olan modern hesaba dayalı bir öğrenme metodudur.
DVM’lerde giriş uzayı yüksek boyutlu bir özellik uzayına düşürülür ve özellik
uzayında sınıflandırıcının genelleme yeteneğini arttırmak için optimal bir
hiperdüzlem seçilir. Bu hiperdüzlem aracılığıyla özelliklerin hangi sınıfa ait olduğu
tespit edilir. DV sayısının çokluğu hesapsal kolaylığı ortadan kaldırır. Oysaki DVM
yönteminin önemli bir özelliği hesapsal kolaylık sağlamasıdır. DV’ler dışındaki giriş
örneklerinin Lagrange çarpanları 0’a eşittir. DV’lerin Lagrange çarpanları 0’a eşit
62
olmadığı için ne kadar çok DV olursa işleme alınacak örnek sayısı da artacak ve
işlemleri zorlaştıracaktır. DV’lerin sayısının çok olması iyi bir sınıflandırma
yapılmadığını göstermektedir. Bu durum seçilen kernel fonksiyonuna ve C yaptırım
parametresine bağlıdır.
Karakter tanıma için destek vektör makinelerin çoklu sınıflandırma yöntemlerinden
birine-karşı-biri metodu kullanılmıştır. Birine-karşı-biri metodunda önce iki sınıf
alınır, bu iki sınıf birbirinden ayrılır, daha sonra diğer ikili gruplar sınıflandırılır.
Son olarak da birbirinden ayrılan bütün sınıflar birleştirme yöntemi kullanılarak
çoklu sınıflandırma işlemi gerçekleştirilmiş olur.
Bu uygulamada kernel fonksiyonu olarak RBF kerneli kullanılmıştır. C yaptırım
parametresi de sonsuz olarak ayarlanmıştır.
Plaka hem harfler hem de rakamlardan oluştuğu için, bu karakter kümeleri arasında
yüksek tanıma oranı elde etmek için özellikle B ve 8, O ve sıfır(0), G ve 6 ve bunun
gibi durumlarda olduğu gibi. Plakanın özelliklerine göre karakter tanıma işlemi 2
kısma ayrılabilir. Bu ön bilgiyle, harfler ve rakamlar bağımsız olarak tanınacak ve O
ve 0 (sıfır), 8 ve B arasında olduğu gibi karakterler arasındaki karışıklık çözülecektir.
63
4. ARAŞTIRMA BULGULARI VE TARTIŞMA
Geliştirilen yöntemin performansı TC araç test görüntü verileri ile sınanmıştır.
Görüntüler plakanın işlenebilirliği göz önünde tutularak yaklaşık 2-5m mesafeden
alınmıştır. Çalışmada kullanılan görüntüler, günün farklı saatlerinde, farklı açılardan
çekilmesine önem verilmiştir. Kontrollü geçişlerde kullanılacağı göz önüne alınarak
duran ya da yavaş seyreden araçlardan görüntüler alınmıştır.
Sistem tarafından test edilen değişik mekânlarda rasgele seçilen yaklaşık 120 adet
aracın 240 adet görüntüsünün, plaka yerini saptama test sonuçları Çizelge 4.1
verilmiştir.
Çizelge 4.1 Plaka tanıma sisteminin test sonuçları
Görüntü sayısı Yüzdelik oran
Plaka yerini saptama 237/240 98.75
Karakterlerin tanımlanması 215/237 % 91
Sistemin plaka yerini bulmada başarısız olmasının nedeni, alınan görüntüde plaka
bölgesinin büyük bir alanın çok karanlık olmasından veya plaka üzerindeki ışık
şiddetinin çok az olmasından kaynaklanmaktadır. Bundan dolayı eşikleme
algoritması plaka bilgisini yok etmektedir. Sitemin plaka yerini saptama başarısı %
98.75 olarak belirlenmiştir.
Şekil 4.1‘de plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen
görüntüler gösterilmiştir.
64
Şekil 4.1 Plaka yer saptama biriminin başarılı olduğu farklı zamanlarda çekilen
görüntüler
65
Şekil 4.2 Plaka yer saptama biriminin başarısız olduğu görüntü
Şekil 4.2’de karakterlerin yazı renginin silikleşmesinden kaynaklanan plaka yer
saptama biriminin başarısız olduğu görüntüye örnek gösterilmiştir.
Başarılı bir şekilde çıkarılan, plaka bölgesinde, izdüşüm bilgisi kullanılarak karakter
ayrıştırma işlemi yapılır. Çizelge 4.2’de görüldüğü gibi, plaka bölgesinin düzlemle
paralel hale getirilerek karakter ayrıştırma işleminin başarısı artırılır.
Çizelge 4.2 Plaka bölgesinin döndürülmesinin etkisi
Karakter
Ayrıştırma %
Döndürülmüş görüntü %98
Döndürülmemiş
görüntü %75
DVM’ ye girdi olarak sütun vektörü istediği için, 25x20 olan matrisler 500x1’lik
vektörlere dönüştürülür. Daha küçük matrislerle çalışmak karakterlerin tanınmasını
güçleştirirken, daha büyük boyutlarda olması ise işlem süresini artırmaktadır. Şekil
olarak birbirine çok benzerlik gösteren karakterlerinin ayrıntılarının çok olması
tanıma oranlarını artıracaktır.
66
Korelasyon ile karakter tanıma yönteminde, bilinmeyen karakter şablondaki
karakterler ile teker teker korelasyona sokulur ve sonuçları kıyaslanır. Kıyaslanan iki
görüntünün doğrusal ilişkileri incelenir. En yüksek korelasyon sonucu ile bilinen
karakter eşleştirilir. Bu yöntemde karakter kendisi ile korelasyona sokulduğunda
gözlenen en yüksek değer olan “1”i verir. Çalışmada denenmiş olan korelasyon
işlemi sonuçları Çizelge 4.3’de verilmiştir. İşlem sayısının çok fazla olduğu bu
yöntemde veri bankasındaki şablon sayısı x, plakadaki alfa nümerik sayısı y ise; x y
× kadar işlem yapılması gerekir. Yüksek doğruluk elde etmek için, karşılaştırılan iki
karakterin birbirine büyük oranda benzemesi gerekmektedir. Kaldı ki, günün farklı
saatlerinde, farklı açılardan çekilen birbirinin aynısı iki plakada bile bu oranlar
birbirine yakınsamayacaktır. Bu yöntemle “8” ile “B”nin ve “0”, “O” ve “D”
karakterlerinin tanınması çok zordur.
Çizelge 4.3 Karakter tanıma başarısı
Karekter tanıma %
Destek Vektör Makineleri %91
Korelasyon %84
Plaka yeri doğru olarak tespit edilen 237 görüntünün plakalarının tanınması için
plaka karakterlerini tanıma modülünde test edilmiştir. Test sonuçları çizelge 4.3’de
gösterilmiştir. Kimi harf ve rakam ikililerinin, D-O, A-R, H-N gibi, birbirlerine olan
benzerlikleri sınıflandırma hatalarına yol açmaktadır. Plaka karakterlerin hepsinin
doğru okunması dikkate alınarak karakter tanıma başarısı %91 olarak belirlenmiştir.
67
5. SONUÇLAR
Gerçek zamanlı taşıt görüntülerinden taşıt plakasını tanıyan bir sistem geliştirilmiştir.
Geliştirilen yöntemin performansı Türkiye tarzı plaka test görüntü verileri ile
sınanmıştır. Bu işlemler MATLAB® yazılım paketi görüntü işleme ve DVM araç
kutuları kullanılarak gerçekleştirilmiştir.
Test görüntü verileri, günün farklı saatlerinde, rastgele mekânlarda, belirli bir
mesafeden, 640x480 çözünürlükte alınarak elde edilmiştir. Bu görüntüler içerisinde
sadece araba değil aynı zamanda kamyon, motosiklet, tır görüntüleri de vardır. Bu
test verileri üzerinde yapılan testlerde, plaka yerini saptamada %98.75, plaka
karakterlerinin tanınmasında %91 başarı sağlanmıştır. Elde edilen sonuçlara
bakıldığında önerilen sistemin araç plaka bölgelerini saptamada yeterince başarılı
olduğu görülmüştür. Birçok karmaşık yöntemlere gerek duyulmadan sadece
morfolojik işlemler yardımıyla plaka yer saptama işlemi basitçe bu çalışmayla
gerçekleştirilmiştir. Önerilen yöntem ile plaka olmayan bölgeler elenerek, daha
detaylı işlem gerektiren bölge sayısı en aza indirilir ve doldurma işlemiyle çift satırlı
plakaları tespitinde avantaj sağlanır.
DVM’ler istatistiksel öğrenme teorisinde iyi şekilde kurulmuş bir teoriye sahiptir ve
sınıflandırma ile regresyon problemlerine yaklaşım için uygundur. Özellikle iki
sınıflı sınıflandırma probleminde DVM iki sınıf arasındaki sınırı büyükleyen
optimal ayırt etme yüzeyini belirlemekte, yani eğitim kümesi ile ayırt etme yüzeyine
en yakın noktaların arasındaki mesafeyi en büyüklemektedir. Çok katmanlı
perseptron ve radyal tabanlı ağlar, uygun çekirdek fonksiyonları ile elde edilen
DVM ağların özel durumları olarak gösterilebilir. Sistemde çoklu-sınıflı
metotlardan en kullanışlısı olan birine-karşı-biri metodu ve RBF (Radial Basis
Function) kerneli kullanılmıştır.
68
Gerçek zamanlı taşıt görüntülerinin yanlardan ya da farklı açılardan alınması durumu
söz konusudur. Bu durumun; hem plakanın sınır bölgesini bulma aşamasında hem de
karakter ayrıştırma işleminde performansı azalttığı gözlenmiştir. Bu sebeple hough
dönüşümü kullanılarak, çıkarılan plaka bölgesinin düzlem ile paralel olması
sağlanmıştır.
69
6. KAYNAKLAR
A.U. Özkaya, M.E. Kaya, F. Gürgen, Destek Vektör Makineleri Kullanılarak Aritmi
Sınıflandırması, Intelligent Arrhythmia Classification Based On Support
Vector Machines.
Burges, J.C.,1998 “A Tutorial on Support Vector Machines for Pattern Recognition”,
Data Mining and Knowledge Discovery 2,21-167,
Çamaşırcıoğlu E., 2007. Araç Plakası Algılama Ve Tanıma. Ankara Üniversitesi
Yüksek Lisans Tezi.
Demiröz B. E., 2005. Bakış Açısından Bağımsız Gürbüz Plaka tanıma sistemi.
Bitirme Ödevi, İstanbul Teknik Üniversitesi.
Duman Ş., Öktem R., Çetin A.E., 2005. Plaka Tanıma Amaçlı Alternatif Öznitelik
Çıkarma Yaklaşımları. IEEE.
DVM Yazılımı, Statistical Pattern Recognition Toolbox for Matlab,
http://cmp.felk.cvut.cz/cmp/software/stprtool
E. Dougherty, Editor, Marcel-Dekker, 1994, Morphological Segmentation for
Textures and Particles, Published as Chapter 2 of Digital Image Processing
Methods, New York, Pages 43-102.
Hernes D. l., 2005. Feature Extraction And Classification Of Precancerous Cervix
Lesions. Master of science.
Hsieh C., Juan Y., Kuo-Ming Hung , Multiple License Plate Detection for Complex
Background.
Hua, S., Sun, Z., “Support vector machine approach for protein subcellular
localization prediction,” Bioinformatics.,cilt 17, sayı 8, sayfa 721-728, 2001.
Kahraman F., Gökmen M., 2003. Gabor Süzgeçler Kullanılarak Taşıt Plakalarının
Yerinin Saptanması, Sinyal İşleme ve Uygulamaları Kurultayı, sayfa 317-
322, Koç Üniversitesi.
Kamat, V. and Ganesan, S., 1995. An efficient implementation of the Hough
transform for detecting vehicle license plates using DSP'S, Real-Time
Technology and Applications Symposium.
70
Kim S., Daechul Kim, Younbok Ryu, and Gyeonghwan K., A Robust License-Plate
Extraction Method under Complex Image Conditions.
Kwaśnicka H. and Bartosz Wawrzyniak, 2002. License plate localization and
recognition in camera pictures. AI-METH– Artificial Intelligence Methods
Gliwice, Poland.
Martín F., Maite García, José Luis Alba, New Methods For Automatıc Readıng Of
Vlp's (Vehıcle Lıcense Plates).
Wei-gang Z., Hou Guo-jiang, Jia Xing, 2002. A Study of Location Vehicle License
Plate Based on Color Feature and Mathematical Morphology. ICSP’02
Proceedings.
Ozbay S., Ercelebi E., 2005. Automatic Vehicle Identification by Plate Recognition,
Transactions on Engineering. Computing and Technology V9.
Rafael C. GGonzalez, Richard E. Woods, Steven L. Eddins, 2004, “Digital Image
Processing Using MATLAB”.
Sonka, Milan, Hlavac, Vaclav, Boyle, Roger, Image Processing, Analysis, and
Machine Vision, PWS Publishing, Pacific Grove, 1999, p574-575.
U. Çelik, 2003. Motorlu Araçlar İçin Plaka Tanıma Sistemi. Yüksek Lisans Tezi,
Mustafa Kemal Üniversitesi, Antakya.
Vapnik , V., 1998. “Statistical Learning Theory”, Wiley.
V. Koval, V. Turchenko, V. Kochan, A. Sachenko, G. Markowsky, 2003. Smart
License Plate Recognition System Based on Image Processing Using Neural
Network. IEEE International Workshop on Intelligent Data Acquisition and
Advanced Computing Systems: Technology and Applications, Lviv, Ukraine.
Yang F., Zheng Ma, Vehicle License Plate location Based on Histogramming and
Mathematical Morphology.
Yıldırım S., 2006. Arıza Teşhisinde Destek Vektör Makinelerinin Kullanımı. Fırat
Üniversitesi Yüksek Lisans Tezi
Zheng D., Yannan Zhao, Jiaxin Wang, 2005. An efficient method of license plate
location. Pattern Recognition Letters 26 (2005) 2431–2438
71
ÖZGEÇMİŞ
Adı Soyadı : Halime BOZTOPRAK
Doğum Yeri ve Yılı: Seydişehir - 1982
Medeni Hali : Bekar
Yabancı Dili : İngilizce
Eğitim Durumu (Kurum ve Yıl)
Lise : Yabancı Dil Ağırlıklı Enis Şanlıoğlu Lisesi, 2000
Lisans : Süleyman Demirel Üniversitesi, 2004
Yüksek Lisans : Süleyman Demirel Üniversitesi, 2007
Yayınları (SCI ve diğer makaleler)
1- H. Boztoprak, M. F. Çağlar, M. Merdan,"Alternatif Morfolojik Bir Yöntemle
Plaka Yerini Saptama", XII. Elektrik, Elektronik, Bilgisayar, Biyomedikal
Mühendisliği Ulusal Kongresi, Kasım 2007, Eskişehir.