本課程介紹語言和語言學研究的關鍵概念和方法。它用基本術語概述了語言學的主要子領域,研究了語言的性質、歷史和結構,以及語言與思想、社會和教育的關係。它為計算語言學課程的後續課程提供了調查基礎。鼓勵學生反思自己的語言經驗,並將課程涵蓋的理論應用到自己的語言環境中。
「專案報告」解決特定背景下的特定問題,可能包含資料收集、資料處理、資料分析和資料解決方案的要素。學生展示他們反思性檢查特定背景的能力,識別和定義該背景下的問題,訪問、總結和綜合與該問題相關的當前文獻,並製定合理的方法來解決該問題的能力。各種語言學和應用語言學相關的主題都是可以接受的。
本課程涵蓋自然語言處理 (NLP) 的基礎和高級主題,涉及計算模型在文字資料中的應用。在本課程中,將研究自然語言處理的核心任務,包括最小編輯距離、語言建模、納維貝葉斯、最大熵、文本分類、序列標記、詞性標記、語法分析和計算詞彙語義。將探索現代 NLP 應用,例如資訊檢索和統計機器翻譯。學生將學習如何制定和調查相關主題的研究問題。
本課程將向學生介紹語料庫語言學的方法和問題。它旨在展示線上語料庫的實際用途,以探索語言學者提出的問題,並解決語料庫設計和分析提出的一些核心問題。學生將熟悉線上語料庫的研究使用以及使用免費軟體索引工具建立和分析原始語料庫。同時,課程將考慮有關詞彙和文法的語言分析的各個方面,以及語言變異和變化的問題。
本課程回顧最先進的翻譯技術。除了允許使用者利用現有資料的翻譯記憶之外,深度學習技術還使機器翻譯能夠實現某些寫作體裁的全自動翻譯。除了探索機器翻譯品質的評估、新出現的可能性和問題之外,課程還將包括使用這些技術的廣泛實踐部分。除此之外,還討論了使用萬維網、基於網路的翻譯輔助工具和其他應用程式來進行快速、在地化和高品質的翻譯。
本課程介紹語言評估領域。課程涵蓋的主題包括測驗的目的和背景、評估技能和語言能力的組成部分、測驗工具的內容分析、測驗表現資料的統計分析以及語言評估的公平性和公正性。
本課程旨在系統性介紹語言學的研究思維、方法和一些重要的語言學理論,引導學生運用科學的工具和方法對漢語進行同時、分時段的系統研究。課程內容包括語言研究的一般方法和具體方法、語言研究中常用的工具概念、各語言學派採用的分析技術以及國內學者所建立的語言理論。
本課程旨在為訪問學者、現有或未來的工作人員提供在其特定專業領域提供課程的機會。課程的主題和內容每年都會有所不同,具體取決於專家人員的可用性。可以提供的專業主題範例包括:資料驅動學習、電腦自適應語言測驗、自動評分、基於語料庫的 EAP(學術英語)等。
本課程介紹了更大的語言學領域內的自然語言語義的形式分析。將向學生介紹形式語意學的主要目標和方法,特別關注其一些核心實證結果,以及語意解釋系統(集合、關係、函數)背後的一些數學概念。主題包括:謂語、定量限定詞的語意、索引、語意綁定、時態和情態。
本課程從現代語言學理論的角度對漢語和英語各自的語音結構、詞法結構、句法結構進行比較描述和分析。討論的主題可能包括語言中的音調、重音和節奏、韻律、構詞、短語和分句結構、詢問、嵌入、連接、比較、聚焦裝置、輔助以及時間和方面的表示。
本課程概述了音系理論和分析。然而,雖然將討論多種語言的數據,但重點將是英語。涵蓋的主題將包括音系規則、表示、基本形式、推導和音系分析的論證。也將關注音系與形態和句法、音節結構和重音的相互作用。本課程將強調問題集的實用技能。
本課程是對英語文法的更高級研究,假設您具備一些英語文法的基本知識。它從當前句法的角度描述和分析英語的結構。它涉及選區、不同類型的短語結構和從句結構。它將理論應用於英語句法的實際問題並評估競爭性分析。
CISC7201 Introduction to Data Science Programming
CISC7204 Data Science and Data Visualization
CISC7203 Database and Data Mining Technologies
CISC7202 Tools for Machine Learning