Bir Metin Corpus Nedir?



Bir metin topluluğu, sözlü veya yazılı metinlerden oluşan bir koleksiyon olup, bu, dilbilimsel dilbilim araştırmasının temelidir . Bu büyük banka metinlerini saklamak, araştırmacıların herhangi bir dilin çeşitli yönlerini analiz etmelerini sağlar. Bir metin corpus araştırmayı yürütmenin etkili bir yoludur, çünkü materyal toplandıktan sonra, morfoloji , sözdizimi dahil çeşitli dil ile ilgili konuları araştırmak için kullanılabilir.kelime ve pragmatik. düşük faizli ihtiyaç kredisi Dilbilimsel araştırma yürütmenin eski yöntemlerinden farklı olarak, bir metin corpus, araştırmacıların, varsayımsal olarak nasıl kullanılabileceğinden ziyade, gerçekte bağlamda nasıl kullanıldığına göre dilde bakmalarına izin verir. Dilbilimciler, sınırlı finansal kaynaklarla sınırlı bir süre içinde kendilerini toplayabilecekleri verilere sınırlamak zorunda olduklarından çok daha büyük veri örneklerine erişebilirler.
Corpora genellikle bir bilgisayarda saklanır, bu nedenle araştırmayı kolaylaştırmak için bilgisayar yazılımı programları oluşturulabilir. Metin corpus kullanmanın yaygın bir yolu, metinlerdeki toplam sözcük sayısını saymak, ardından belirli kelimelerin sayısının kaç kez sayılacağını ve sıralanmasını sağlamaktır. Toplam kelime sayısı ile belirli kelimeler arasında yaratılan oran, Zipf Yasası olarak bilinir. Bu oran, bir dildeki sözcük sıklığını açıklamaya yardımcı olur. Zipf Yasası'nı anlamak, bilgisayar programcılarının belirli bir dilin taleplerini karşılayan bilgisayar yazılımı tasarlamasına yardımcı olur. Bazı kelimeler ve ifadelerin hangi sıklıkla girdi olarak kullanılacağını sayabilir ve tahmin edebilirler.
Metin corpus kullanmanın başka bir yolu, araştırmacının çalışmak istediği belirli öğeleri etiketlemektir. Bunun nasıl kullanılacağına dair bir örnek, farklı metin türlerinde pasif sesin kaç kez göründüğünü saymaktır. Etiketleme, aynı zamanda, insanlara günlük yaşamlarında yardımcı olan bilgisayar programları oluştururken de yararlı olmuştur. Konuşma tanıma etiketleme, ses tanıma yazılım geliştirme için kritik öneme sahiptir . İngilizce'de, örneğin, aynı kelime, konuşmanın birden fazla bölümüne sahip olabilir. Multisyllabic sözcükler genellikle konuşmanın hangi kısmının kullanıldığını işaret etmek için farklı şekilde vurgulanır. İsim “nesne”, ilk hece üzerindeki stresi taşır, ancak fiilİkinci hecede “nesne” vurgulanır. “Nesne” isminin etiketlenmesi, bilgisayar programının her ikisinin de yüksek sesle okunmasına ve “nesne” nin bir insan tarafından söylendiğinde bunu fark etmesine yardımcı olur.
Metin corpora hem insan dilbilimi hem de sayısal KBB notu düşüklere kredi veren bankalar dilbilim için yararlıdır. İnsanların kullandıkları dili daha iyi anlamalarına yardımcı olan ve dil bilgisayarlarının kullanımını geliştirmeye yardımcı olan araştırmaların yapılmasına izin verir. Ses tanıma teknolojisinde, müşterilerin ofisleri, evleri ve araçlarındaki bilgisayarları sözlü olarak kontrol etmelerine olanak tanıyan büyük atılımlar yapıldı. Devam eden ilerlemeler, insanlarla bilgisayarların birbirleriyle olduğu gibi doğal olarak iletişim kurmasını sağlayacaktır.

Yorumlar

Bu blogdaki popüler yayınlar

Yeni Dijital Ortamın Farklı Türleri Nelerdir?

Amerika Birleşik Devletleri İçişleri Bakanlığı ne yapar?

Ağ Sunucusu Nedir?