|
|
|
|
Research Descriptions |
|
知識建構是一件耗時費事的大工程,我們在過去二十多年發展了中文處理基礎建設為未來的自動化知識建構打下基
礎。這些基礎建設包含標記語料庫、句結構樹資料庫、詞彙庫、中文語法、詞彙分析系統及句剖析器等。我們將利用完成的基礎知識與技術來自動抽取網路文件中隱含的訊息,擴充現有知識架構並建立領域知識庫及詞彙知識庫。我們將連結不同的知識庫形成一個完整的概念網以提高計算機推理及語言了解能力。在知識表達研究方面我們將研究知識架構的基礎理論及細緻語意的表達模式- 知網擴充版。 藉由分析近義詞的細微差別來找出細緻語意的表達方式及語意的合成機制。我們也將改善並整合當下最重要的一些知識架構如詞網、知網及事件框架網,以達到較佳的整合知識表達系統。我們將發展以概念為中心的中文處理技術,所發展的技術將利用自動抽取得到的統計、語言語法及常識訊息作為基礎知識用於分析文件的概念結構並瞭解文件的意義,進而抽取新的知識。以上步驟形成一個自動化的學習系統,語文處理系統可經由自動分析學習新知逐日更新知識庫,同時也藉由知識庫的更新增進了語文處理的能力。 |
|
|
|
|
|
|
|
|
|
|