載入中...

How does language work? Challenges and opportunities in the age of deep learning

Harald Baayen

Harald Baayen

德國圖賓根大學語言學教授

歐洲科學院院士


日期:2025/03/20

時間:10:30 - 12:00

地點:教育學院大樓二樓教202國際會議室


主辦單位:國立臺灣師範大學
協辦單位:國立臺灣師範大學文學院


講題摘要

資訊科學的飛速進展正在重新定義對語言運作方式的認知。在1950和1960年代,電腦語言的出現讓許多研究者認為語言如同一個演算系統,是由基本單位(例如音素、詞素、音節、單詞)所組成,並依著特定規則進行排列和組合。然而,到了1980年代,認知心理學家開始嘗試運用人工神經網絡來研究語言,並主張語言的運作其實是由神經網絡吸取語言知識,而不是仰賴離散的單位和規則。然而,許多語言學者和心理學者對此表示懷疑,認為神經網絡並不足以勝任此項複雜的任務,因此基於邏輯和圖形的符號方法成為替代方案。


時至今日,人工神經網絡再次崛起,並成為許多大型語言模型的基礎,這些模型在翻譯和問答等應用之表現相當卓越。由於這些網絡規模龐大,包含數十億個參數,並經過大量數據的訓練,實現出驚人的成果,使得深度學習技術成功挑戰許多語言學家曾經認為不可能實現的理論;此是否意味著深度學習網絡可以成為語言運作的新模型?


本場演講將深入探討大型語言模型的成功對傳統語言學的三個核心概念影響:

  1. 形式與意義的關係是否真的是任意的?
  2. 語言的音系是否真的與句法結構獨立無關?
  3. 語言系統是否可以脫離人類的整體經驗來進行研究?


此外,演講也會解釋為什麼大型語言模型無法作為認知層面上的有效模型。儘管如此,當前的人工智慧技術,特別是深度學習,作為分析工具,能夠幫助我們發現語言使用與學習中的新規律,並解開一些過去難以解釋的現象。為使大家更直觀地理解,演講將透過三個案例來說明相關觀點,以協助理解語言模型如何揭示語言系統的潛在規律,並重新審視語言的本質與運作方式:

  1. 如何預測英語中正確的限定詞使用?
  2. 如何預測華語在自然對話中的聲調變化?
  3. 如何預測愛沙尼亞語中單詞的發音時間?



講者簡介

Harald Baayen教授是德國杜賓根大學語言學系知名教授及歐洲科學院院士,為計量語言學領域備受推崇的權威。他的研究涵蓋構詞能產性、語言變異及統計數據分析,尤其聚焦於詞彙結構及其在語言理解與產製中的認知處理機制。作為計算與實證語言學的開拓者,Baayen教授運用創新的統計模型方法,為語言學研究開闢嶄新的方向,對全球學術界產生深遠影響。

返回列表