Türkçe dilinde görüntü altyazısı: Veritabanı ve model

Yıldız, Tuğba; Sönmez, Elena; Yılmaz, Berk Dursun; Demir, Ali Emre

Türkçe dilinde görüntü altyazısı: Veritabanı ve model

dc.contributor.author	Yıldız, Tuğba
dc.contributor.author	Sönmez, Elena
dc.contributor.author	Yılmaz, Berk Dursun
dc.contributor.author	Demir, Ali Emre
dc.date.accessioned	2022-02-11T06:11:01Z
dc.date.available	2022-02-11T06:11:01Z
dc.date.issued	2020
dc.description.abstract	Özet: Otomatik görüntü altyazısı, yapay zekânın hem bilgisayarla görme hem de doğal dil işleme alanlarını kapsamaktadır. Makine çevirisi alanındaki gelişmelerden ilham alan ve bu alanda başarılı sonuçlar veren kodlayıcı-kod çözücü tekniği, özellikle İngilizce için otomatik görüntü altyazısı oluşturma konusunda kullanılan mevcut yöntemlerden biridir. Bu çalışmada ise, Türkçe dili için otomatik görüntü altyazısı oluşturan bir model sunulmaktadır. Bu çalışma, verilen görüntülerin özelliklerini çıkarmaktan sorumlu olan, Evrişimsel Sinir Ağı (ESA) mimarisine sahip bir kodlayıcıyı, altyazı oluşturmaktan sorumlu olan, Tekrarlayan Sinir Ağı (TSA) mimarisine sahip bir kod çözücüsü ile birleştirerek, Türkçe MS COCO veri kümesi üzerinde Türkçe görüntü altyazısı kodlayıcı-kod çözücü modelini test etmektedir. Modelin performansı, yeni oluşturulan veri kümesinde insanlar tarafından değerlendirilirken, bir taraftan da BLEU, METEOR, ROUGE ve CIDEr gibi en yaygın değerlendirme ölçütleri kullanılarak değerlendirilmiştir. Sonuçlar, önerilen modelin performansının hem niteliksel hem de niceliksel olarak tatmin edici olduğunu göstermektedir. Çalışma sonunda hazırlanan, herkesin kullanımına açık bir Web uygulaması (http://mscococontributor.herokuapp.com/website/) sayesinde Türkçe dili için MS COCO görüntülerine ait Türkçe girişlerin yapıldığı bir ortam kullanıcıya sunulmuştur. Tüm görüntüler tamamlandığında, Türkçe diline özgü, karşılaştırmalı çalışmaların yapılabileceği bir veri kümesi tamamlanmış olacaktır.	en_US
dc.description.abstract	Abstract: Automatic image captioning is a challenging issue in artificial intelligence, which covers both the fields of computer vision and natural language processing. Inspired by the later advances in machine translation, a successful encoder-decoder technique is currently the state-of-the-art in English language captioning. In this study, we proposed an image captioning model for Turkish Language. This paper evaluates the encoderdecoder model on MS COCO database by coupling an encoder Convolutional Neural Network (CNN) -the component that is responsible for extracting the features of the given images-, with a decoder Recurrent Neural Network (RNN) -the component that is responsible for generating captions using the given inputs- to generate Turkish captions. We conducted the experiments using the most common evaluation metrics such as BLEU, METEOR, ROUGE and CIDEr. Results show that the performance of the proposed model is satisfactory in both qualitative and quantitative evaluations. Finally, this study introduces a Web platform (http://mscoco-contributor.herokuapp.com/website/), which is proposed to improve the dataset via crowdsourcing and free to use. The Turkish MS COCO dataset is available for research purpose. When all the images are completed, a Turkish dataset will be available for comparative studies.	en_US
dc.fullTextLevel	Full Text	en_US
dc.identifier.doi	10.17341/gazimmfd.597089	en_US
dc.identifier.issn	1300-1884
dc.identifier.issn	1304-4915
dc.identifier.scopus	2-s2.0-85091869186	en_US
dc.identifier.trdizinid	390935	en_US
dc.identifier.uri	https://hdl.handle.net/11411/4447
dc.identifier.uri	https://doi.org/10.17341/gazimmfd.597089
dc.identifier.uri	https://search.trdizin.gov.tr/yayin/detay/390935	en_US
dc.identifier.wos	WOS:000552077900027	en_US
dc.identifier.wosquality	Q2	en_US
dc.indekslendigikaynak	Web of Science	en_US
dc.indekslendigikaynak	Scopus	en_US
dc.indekslendigikaynak	TR-Dizin	en_US
dc.issue	4	en_US
dc.language.iso	tr	en_US
dc.national	National	en_US
dc.numberofauthors	4	en_US
dc.pages	2089 - 2100	en_US
dc.publisher	Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi	en_US
dc.relation.ispartof	Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi	en_US
dc.relation.publicationcategory	Makale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı	en_US
dc.rights	info:eu-repo/semantics/openAccess	en_US
dc.snmz	20240718_Mükerrer
dc.subject	Turkish image captioning	en_US
dc.subject	Turkish MS COCO	en_US
dc.subject	Computer vision	en_US
dc.subject	Natural language processing	en_US
dc.subject	CNN, RNN	en_US
dc.subject	Türkçe görüntü altyazısı	en_US
dc.subject	Türkçe MS COCO veri kümesi	en_US
dc.subject	bilgisayarla görme	en_US
dc.subject	doğal dil işleme	en_US
dc.subject	ESA	en_US
dc.subject	TSA	en_US
dc.title	Türkçe dilinde görüntü altyazısı: Veritabanı ve model	en_US
dc.type	Article	en_US
dc.volume	35	en_US

Dosyalar

Orijinal paket

Listeleniyor 1 - 1 / 1

İsim:: 2020YıldızSönmez.pdf
Boyut:: 873.52 KB
Biçim:: Adobe Portable Document Format
Açıklama:

İndir

Lisans paketi

Listeleniyor 1 - 1 / 1

İsim:: license.txt
Boyut:: 1.71 KB
Biçim:: Item-specific license agreed upon to submission
Açıklama:

İndir

Koleksiyon

Faculty of Engineering and Natural Sciences
Scopus Indexed Publications
TR Dizin Indexed Publications
Web of Science Indexed Publications