跳至內容

統計語言學

維基百科,自由的百科全書

統計語言學數理語言學的一個分支,是運用統計學的方法研究各種語言現象的學科。

歷史

[編輯]

18世紀時,開始用統計學來解釋語言的消失與保存。1880年代,青年語法學派中的一些學者也使用過統計方法來研究語言。自發明電子計算機以後,統計語言學得到了迅速發展。

研究方向

[編輯]

統計語言學主要研究:

  • 語言單位的出現頻率
  • 作家的用詞頻率、詞長分布和句長分布,以確定作家的寫作風格
  • 計算語言存在的絕對年代以及親屬語言從共同原始語分化出來的年代

參見

[編輯]