Bir Metin Corpus Nedir?
Bir metin topluluğu, sözlü veya yazılı metinlerden oluşan
bir koleksiyon olup, bu, dilbilimsel dilbilim araştırmasının temelidir . Bu
büyük banka metinlerini saklamak, araştırmacıların herhangi bir dilin çeşitli
yönlerini analiz etmelerini sağlar. Bir metin corpus araştırmayı yürütmenin
etkili bir yoludur, çünkü materyal toplandıktan sonra, morfoloji , sözdizimi
dahil çeşitli dil ile ilgili konuları araştırmak için kullanılabilir.kelime ve
pragmatik. düşük faizli ihtiyaç kredisi Dilbilimsel araştırma yürütmenin eski
yöntemlerinden farklı olarak, bir metin corpus, araştırmacıların, varsayımsal
olarak nasıl kullanılabileceğinden ziyade, gerçekte bağlamda nasıl
kullanıldığına göre dilde bakmalarına izin verir. Dilbilimciler, sınırlı
finansal kaynaklarla sınırlı bir süre içinde kendilerini toplayabilecekleri
verilere sınırlamak zorunda olduklarından çok daha büyük veri örneklerine
erişebilirler.
Corpora genellikle bir bilgisayarda saklanır, bu nedenle
araştırmayı kolaylaştırmak için bilgisayar yazılımı programları
oluşturulabilir. Metin corpus kullanmanın yaygın bir yolu, metinlerdeki toplam
sözcük sayısını saymak, ardından belirli kelimelerin sayısının kaç kez
sayılacağını ve sıralanmasını sağlamaktır. Toplam kelime sayısı ile belirli
kelimeler arasında yaratılan oran, Zipf Yasası olarak bilinir. Bu oran, bir
dildeki sözcük sıklığını açıklamaya yardımcı olur. Zipf Yasası'nı anlamak,
bilgisayar programcılarının belirli bir dilin taleplerini karşılayan bilgisayar
yazılımı tasarlamasına yardımcı olur. Bazı kelimeler ve ifadelerin hangi
sıklıkla girdi olarak kullanılacağını sayabilir ve tahmin edebilirler.
Metin corpus kullanmanın başka bir yolu, araştırmacının
çalışmak istediği belirli öğeleri etiketlemektir. Bunun nasıl kullanılacağına
dair bir örnek, farklı metin türlerinde pasif sesin kaç kez göründüğünü
saymaktır. Etiketleme, aynı zamanda, insanlara günlük yaşamlarında yardımcı
olan bilgisayar programları oluştururken de yararlı olmuştur. Konuşma tanıma
etiketleme, ses tanıma yazılım geliştirme için kritik öneme sahiptir .
İngilizce'de, örneğin, aynı kelime, konuşmanın birden fazla bölümüne sahip
olabilir. Multisyllabic sözcükler genellikle konuşmanın hangi kısmının
kullanıldığını işaret etmek için farklı şekilde vurgulanır. İsim “nesne”, ilk
hece üzerindeki stresi taşır, ancak fiilİkinci hecede “nesne” vurgulanır. “Nesne”
isminin etiketlenmesi, bilgisayar programının her ikisinin de yüksek sesle
okunmasına ve “nesne” nin bir insan tarafından söylendiğinde bunu fark etmesine
yardımcı olur.
Metin corpora hem insan dilbilimi hem de sayısal KBB notu düşüklere kredi veren bankalar dilbilim için yararlıdır. İnsanların
kullandıkları dili daha iyi anlamalarına yardımcı olan ve dil bilgisayarlarının
kullanımını geliştirmeye yardımcı olan araştırmaların yapılmasına izin verir.
Ses tanıma teknolojisinde, müşterilerin ofisleri, evleri ve araçlarındaki
bilgisayarları sözlü olarak kontrol etmelerine olanak tanıyan büyük atılımlar
yapıldı. Devam eden ilerlemeler, insanlarla bilgisayarların birbirleriyle olduğu
gibi doğal olarak iletişim kurmasını sağlayacaktır.
Yorumlar
Yorum Gönder