* Türkçe Ulusal Derlemi Oluşturma
TÜBİTAK tarafından 2008-2011 yılları için desteklenen bir SOBAG (108K242) projesidir.
2011 yılında sürümü yapılacak Tükçe Ulusal Derlemi:
• 50 milyon sözcüklük
• 1990-2008 döneminini içeren
• %95 yazılı, %5 sözlü Türkçe kullanımından oluşan
• Sözcük türü etiketlemesi yapılmış
• Bağlam içinde anahtar kelime gösterebilen
• İstatistik bilgi sunabilen
• Kullanıcı dostu, internet üzerinden ulaşılabilen bir grafik arayüze sahip
bir dil derlemi olacaktır.
* Türkçe Ulusal Derlemi
Genel bir Derlem: Özel bir konu alanıyla ya da türle sınırlı olmayacaktır.
Karma bir Derlem: Hem yazılı hem de sözlü dilden örnekler içerecektir.
Örneklem Derlemi: Sözcük sayısı 15.000’i geçmeyecek metin örneklemlerini içerecektir.
Eşzamanlı bir Derlem: Günümüz Türkçesinden, 1990-2009 yılları arasında üretilmiş kurgusal ve bilgilendirici metinlerden oluşacaktır.
28/04/2009
Proje web sitesi açıldı.