Genel Proje Bilgisi:
Zemberek (Turkish)


Zemberek (Onceki adi ile Tspell) projesi ile Turkce diline iliskin cesitli bilgi islem problemlerinin cozumlenmesi icin acik kodlu, platform bagimsiz bir kutuphane olusturulmasi amaci ile baslatilmistir. Turkce yapi itibari ile Ingilizce, Almanca gibi Hint Avrupa dillerinden cok farklidir. Ulamali bir dil olmasindan dolayi baska dillerde kolayca gerceklestirilebilecek bilgisayarla kelime dogruluk tespiti, hata-oneri sistemi gibi islemler Turkce icin son derece guc bir hale gelmistir. Zemberek, Java'nin sagladigi kutuphane, hiz, dil ve platform avantajlari ile bu tur zorluklarin ustesinden gelmeye calisacaktir. Zemberek projesinin hedefledigi, yada gelecekte bu kutuphane kullanilarak gelistirilebilecek bazi konular sunlardir:
 

  • Hizli kelime dogruluk tespiti.
  • Bir kelimeyi kok ve eklerine ayirma. Kelime cozumleme.
  • Kok, ek ve cesitli kavram bilgileri ile kelime olusturma
  • Heceleme
  • Hizli dil tespiti, bir yazinin turkce olup olmadiginin belirlenmesi (turkce karakter kullanilmasa bile)
     
  • Yanlis bir kelime icin muhtemel dogru kelimeler onerme
  • Bir yazi icin istatistiksel bilgi toplama, turkcenin genel kullanimina iliskin istatistikler (kelime, ek, harf bilgileri)
  • Cumle analizi. kelimelerin birbirleri ile kullanim olasiliklarinin belirlenmesi
  • Daginik kok ve kavram bilgilerinden Cumle olusturma.
  • Rasgele anlamli kelime ve cumle olusturma.
  • Deyim ve atasozlerinin belirlenmesi
     
  • Halk dili - Resmi dil  - Osmanlica - Argo  donusum.
  • Istatistiksel bilgiye dayali yazar tespiti.
  • ASCII  - Turkce donusumu. (yani turkce tus takimi olmadan turkce yazilan yazilari gercek turkceye donusturmek)
  • HTML icerisinden turkce ayiklama.
  • Dil servisleri. Herhangi bir yazilim dilinden ya da uygulamadan kutuphaneye erisim icin web servisleri ve dogrudan soket erisimi.
  • Open Office ile butunlestirme.
  • Turkce metin iceren sayisal dokumanlarin kok ve ek bilgileri kullanilarak sIkistirilmasi
  • Otomatik konu belirleme.
  • Ceviri
  • Turkceye akraba diller icin benzeri konularda yapilacak calismalar.
     

           https://zemberek.dev.java.net/