ISSN: 1304-7191 | E-ISSN: 1304-7205
Automatic Tag Cloud Generation from Turkish Contents
1
2
Sigma J Eng Nat Sci 2011; 29(2): 156-169
Full Text PDF (Turkish)

Abstract

Every day we are faced with an intense traffic of information that is caused by the communication medium, shaping by the growth and development of information technologies and the Internet. Users can access to information in a more comfortable way by the help of text summarization, information extraction and document tagging operations. Tag clouds are visual tools that direct users to the information provided on the internet by taking advantage of text mining techniques. Generally the users prefer to follow the agenda from a single newspaper web site. But a large number of unimportant news items that are not published in newspaper printed version, find place for themselves on internet sites and cause information pollution. Considering the needs posed by these and other problems, a research on information retrieval systems, text mining and tag clouds, has been made in this study. With the aid of gathered information, a news compilation and retrieval tool called Agenda Cloud is developed, which makes it more functional to access news on the Internet. The main benefits of the application are; it allows users to access a lot of information in a short amount of time and provides historical information besides daily agenda.


Türkçe İçeriklerden Otomatik Etiket Bulutu Oluşturma
1Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Yıldız, İSTANBUL
2Yıldız Teknik Üniversitesi, Elektrik-Elektronik Fakültesi, Bilgisayar Mühendisliği Bölümü, Yıldız, İSTANBUL
Sigma Journal of Engineering and Natural Sciences 2011; 2(29): 156-169

Bilgi teknolojileri ve internetin gelişmesiyle şekillenen iletişim ortamı, her geçen gün daha da yoğun bir bilgi trafiği ile karşı karşıya kalmamıza neden olmaktadır. Metin özetlerinin çıkarılması ve dokümanların etiketlenmesi gibi işlemler sayesinde, kullanıcılar bilgiye daha rahat bir şekilde ulaşabilmektedir. Etiket Bulutları, metin madenciliği tekniklerinden faydalanarak, kullanıcıları internet ortamında sunulan bilgilere yönlendiren görsel erişim araçlarıdır. Genel olarak kullanıcılar haberleri, tercih ettikleri tek bir gazete sitesinden takip ederler. Ancak basılı ortamda yayınlanmayan düşük öneme sahip çok sayıda haber, gazetelerin internet sitelerinde kendilerine yer bulmakta ve bilgi kirliliği oluşturmaktadır. Bu ve benzeri sorunların ortaya çıkardığı ihtiyaçlar göz önüne alınarak, bu çalışmada, bilgiye erişim sistemleri, metin madenciliği ve etiket bulutları konularında araştırma yapılmıştır. Elde edilen bilgiler ışığında, internet ortamındaki günlük haberlere erişimi daha işlevsel hale getiren Gündem Bulutu adında bir haber derleme ve erişim aracı geliştirilmiştir. Kullanıcıların kısa sürede çok daha fazla bilgiye erişmesine olanak sağlaması ve anlık gündem dışında geçmişe dönük tarihçe sunuyor olması uygulamanın en önemli faydalarıdır.