研究領域

研究領域

Research Fields

研究方向
最後更新：2024/12/12

基礎研究
- 參與成員：陳冠宇
- 研究題目
  - 小型化Transformer的研究與開發

智慧法學
- 參與成員：劉兆崴、(鄭宇翔)、周騏軍、(黃柏熏)、113專題A組、113專題E組
- 研究題目：
  - 車禍慰撫金預測
  - ECHR歐洲人權法院判決預測
  - 法律書類自動輔助完成系統

異常偵測
- 參與成員：林延昕、黃柏熏、113專題D組
- 研究題目：
  - 基於視覺語言模型的監控影片異常事件偵測
  - 車牌識別強化

竄改偵測
- 參與成員：朱俊豪、[鄭承斌]、[楊子誼]
- 研究題目：
  - 基於深度學習的影片生成偵測
  - 基於頻率域的影像竄改偵測
  - 以對抗性樣本降低竄改偵測系統能力之研究

書法生成
- 參與成員：連鄭勳、[江岱樺]、[楊子誼]
- 研究題目：
  - 以GAN方法將手寫字轉換為書法字風格字體之研究
  - 以Diffusion方法將手寫字轉換為書法字風格字體之研究

建物勘查
- 參與成員：胡昭宇
- 研究題目：
  - 牆壁裂縫的分類與偵測

影像審美
- 參與成員：[俞柏丞]、*(朱俊豪)、*(黃柏熏)、*(周騏軍) *因FITI競賽加入
- 研究題目：
  - 智慧型拍照指引
  - 基於視覺語言模型的影像自動評論指引系統

遊戲設計
- 參與成員：113專題B組、113專題C組
- 研究題目：
  - 手勢辨識與Unity遊戲的整合研究
  - 大型語言模型與問答遊戲的整合研究

中括弧[]代表已畢業之成員小括弧()代表共同支援人力

判決勝負預測

透過自然語言處理與資料探勘技術，從過去大量法律文件中，找出判斷依據，幫助法務人員節省辦案時間，並提升決策準確度。

異常偵測技術

針對監視錄影器的畫面做自動分析，不須使用者定義，自動學習場景樣態，並主動發現可疑之移動物體。

即時拍照指引

現今手機相機越來越先進，但缺乏拍照經驗的人不一定能拍出好照片。我們透過機器學習讓電腦即時教導使用者如何構圖，以及調整色調。

智慧e筆書法字轉換

與書法大師張炳煌教授以及工學院院長李宗翰教授合作，將手寫字轉為書法字風格，同時保留書寫者原本字體的風格。

可解釋性指引

許多人工智慧與深度學習技術，決策過程宛如黑盒子不可知，我們致力於可解釋性模型的研發，使的決策過程可解釋，同時維持其應有的準確性。

裂縫偵測分類

世界各地地震頻傳，震後建築物受損的情況攸關你我的生命安全，透過裂縫偵測、分類技術，及早發現識別裂縫，確認家中環境的安全性

(2) 智慧型法學系統：法律學的應用，是人工智慧研究中較少被觸及到的領域。在律師事務所中常常面臨許多繁瑣、重複性高而花時間的事情，若能透過資訊系統代勞，則能讓法務人員專注於重要而有價值的事物。透過強化的法學資料檢索系統，能讓法務人員避免遺漏重要法律資訊或過去案例，而影響正確判斷，或者在相同案件中，與過去的判決不一致。透過自然語言處理與資料探勘技術，從過去大量法律文件中，找出判斷依據，幫助法務人員節省辦案時間，並提升決策準確度。

引用法條推薦

如果臨時遇到罕用的案件，處理會相對吃力。為了避免法條的引用有所疏忽，掛一漏萬，我們以開發智慧型法條引用推薦系統為目標，針對不同的案件類型，指導使用者引用所需法條。這項功能亦能夠隨著時間更新，對應到新法的使用上。

自然語言處理

法律案件的處理大部分都是基於文字之上的，因此讓電腦理解人類的語言是一大必要功夫。然而，法律用語有其專業性，且部分與日常生活詞彙重疊，因此打造法律事務專用的自然語言處理系統，也需要專業性。

(3) 計量影像審美學：現今人工智慧技術的一大議題，在於其能夠解決具體的理性問題，對於抽象的藝術等感性問題的理解能力較差。計量影像審美學 (Computational Image Aesthetics) 的目標即在於研究如何讓電腦能夠理解抽象的美的概念，並將其運用來解決現實生活中的各項問題，例如照片篩選排序、輔助相機使用者拍攝較佳的照片，以及輔助產品設計師預測產品外觀是否受使用者青睞等。

自動拍照機器人

讓電腦具備審美的能力，模仿專業攝影師的取景行為，在人類不方便操作的場景下，為人類代勞做取景拍攝，並拍攝出有意義的照片。

未來的研究將以端到端影像深度學習、自然語言處理與電腦視覺技術整合、輕量化深度學習、及行動智慧APP應用開發為主要研究領域的重心，內容詳述如下：

(1) 端到端影像深度學習：過去電腦視覺技術欲偵測物體，需要使用 Sliding Window 方法，將影像分割為不同大小的子圖而個別判讀其內容，此種方法速度較慢。而較新的端到端 (End-to-end) 技術乃直接將整張影像判讀，而直接輸出整張影像中內含所有物件的座標、大小，以及所屬物件類別名稱。相較於過去的技術，端到端的方式偵測物體較快速，但須使用的神經網路層數較多，且需要更多標記資料，且在同樣硬體條件下，需要更多的訓練時間。在特定情況下，受限於資料集中標記的座標，某些物體若出現於不合理的位置，會較難被偵測到。我們期望針對當前端到端影像深度學習技術尚不成熟的部分做改進，讓此技術的應用達到更佳。

(2) 自然語言處理與電腦視覺技術整合：當今機器學習較為熱門的技術，分為自然語言處理技術，以及電腦視覺技術兩者。這兩項技術的任務不同，因此過去較少交集，研究人員也是各做各的，而一般理解上也認為需要創造兩套以上系統才能解決各自問題，然而此種思考模式顯然不符合人類的思考樣態。近日新文獻中，有學者提出將影像編碼為自然語言，讓上述兩個技術領域可以互通，亦即讓電腦具備以自然語言的角度去理解影像內容。我們期待透過此種技術的研發，讓電腦能夠更接近人的思考方式，從而逐步達到單一模型、多項應用的目標。

(3) 輕量化深度學習：當前最有效的人工智慧技術為深度學習，但需要的耗能較大，比較無法提供小型的智慧型裝置使用。我們將通盤檢討目前深度學習的運作模式，理解哪些功能較不重要，並透過小幅犧牲準確度，換取有效的效能提升。若是能將現今的深度學習技術，以省能源、合理運算量的模式重新實現，就能有開發更多的應用，進一步提高產學合作的機會。

(4) 行動智慧APP應用開發：手機APP開發亦為目前的一個研究重點，我們將開發三種系統：(i)手機拍照美學指引系統，我們將設計一個APP，分析手機鏡頭上的即時影像，透過我們的機器學習模型，告知使用者可以改善哪些構圖與色調，讓照片能夠更符合美學標準，拍出來的成品更容易獲得青睞。(ii)影像內容敘述APP，透過電腦視覺技術與自然語言處理的整合，我們期待開發出一個影像內容敘述APP，讓手機能夠針對攝影鏡頭上的內容作判讀，告知使用者當前所看到的畫面事件為何。(iii)法條引用推薦系統，透過大數據分析與專家知識，讓使用者在APP中輸入我們所分析出的常見條件後，告知使用者所面臨事件的相關法條，讓使用者得以知悉所面臨案件之大致輪廓。