有人說,資料是新時代的石油;那麼,人工智慧(AI)就是新時代的電力,未來將不會有任何現代產業與AI無關。

問題在於 AI 技術的引入會面臨兩大挑戰,挑戰一,AI 是解決特定問題的技術:同樣是深度學習模型,要解決什麼問題,能解決什麼問題,能解到什麼程度,產生多少價值,在每家公司都不一樣,多元性及客製化程度遠比導入 ERP(企業資源計畫)、 CRM(客戶關係管理)系統高得太多。例如,同樣是 AOI(自動光學檢測)技術,在 A 公司做來檢測電路板的瑕疵,在 B 公司檢測織物的瑕疵,在 C 公司檢測玻璃的瑕疵,以高標準來要求的話,絕對不是調整參數就好。因此,未來的五年甚至更久的時間內,很難期待會有套裝系統可以直接購入及進行簡單客製化,符合各產業、各公司、各種問題的期待。

挑戰二,AI 並沒有辦法 plug & play(即插即用):目前的 AI 皆由機器學習模型來驅動,而機器學習必須要有大量資料來訓練。若公司內原本並沒有蒐集某個想要解決的問題的資料,或是資料蒐集時間不夠長,任你找到絕世高手或買到厲害的系統也沒有用。例如,若要進行未來半年的某產品銷量預測,通常需要該產品或同類型產品及競品在過去三年或五年以上資料,以及搭配的各式環境因素、客戶訂單資料等等。若是沒有這些資料準備好,AI 系統就是不能動,沒有油就沒有辦法發電的道理。

幸運的是,這一波(也是人類史上的第三波)的AI浪潮伴隨著「人工智慧民主化 (AI Democratization)」的趨勢,最重要的概念是,AI技術不應該只被某些跨國企業所壟斷,應該讓所有需要的人都有機會參與及使用。具體的作法包含各種深度學習開發工具及模型的開放源碼,以及各式最新核心技術的分享等等。

我個人所看到的是機會,因為這個AI民主化趨勢,AI技術發展在各領域所帶來的機會無窮無盡,是習慣等待國外大廠解決方案的我們應該把握的。

當然,目前普遍遇到的挑戰是 AI 人才的缺乏,台灣人工智慧學校為此而成立。希望很快地讓「找不到人才」不再成為企業發展人工智慧的障礙,同時建立「自己的問題自己解決」的文化,打破被技術殖民的慣性,重建社會自信。

台灣人工智慧學校將以最好的師資及與產學界的密切合作,進行人工智慧技術人才的密集培訓。讓不同專業領域的學員都能如虎添翼,以人工智慧加上原本的領域知識,具備協助各企業解決問題,以及帶領人工智慧團隊的能力。他們將擔任技術種子角色,深入台灣產業的各個層面,以其本身專業及人工智慧技術協助企業解決在邁向智慧化的過程中所面臨的難題。

我將在這場演講中,分享台灣人工智慧學校的來龍去脈,如何從一個稱為 Project Theta 的計畫開始,慢慢確認人才培育的需求,以及形塑台灣人工智慧學校的雛型。這個故事從 2017 年三月的某個早晨開始...
大數據及資料科學成為近年熱門議題,雖然台灣許多組織的資料還不足以豐富到稱作大數據,但資料科學不只能幫企業做決策,也能分析捐款人的偏好習慣。身為一位資料科學家,我對於如何有效率地進行募款及捐款非常感興趣,2014 年我分析蘋果日報慈善基金會的公開資料,量化捐款者的決策過程,發現捐款的意願與發表時間密切相關,同時,與受助者的外型、是否為老弱婦孺或單身、疾病或身心障礙甚至急切需要幫助的原因都有顯著相關。看起來應該很純粹的捐款行為,事實上牽涉到非常複雜的決策過程,但這麼複雜的決策過程,卻能在資料分析下抽絲剝繭找出規律,讓我們看見社會大眾究竟是如何做捐款決策。

但是,若拉高視角來看,全台灣有超過兩千個公益團體,我們如何利用資料分析來為每個捐款人找到最合適也最有效率的捐助方式及對象呢?首要之事,就是得為所有的公益團隊收集資料,這並不容易,因為資料的收集、維護及取得並沒有一定的格式或規範,更有許多公益團體因為人力或其它因素並沒有將資料公開出來。因此,我們成立聰明公益資訊平台,希望透過公益團體及捐款人的共同努力,一起建立及維護屬於台灣所有公益團體及捐款人的平台,讓好的公益團體更容易讓社會看見,讓捐款過程更能有所依循,更聰明有智慧。

希望透過短短的分享,能夠最小程度的讓大家看見,資料科學在公益領域的潛力;未來幾年,能夠看到 NGO、NPO 和我一樣,一起擁抱資料科學,以資料科學來解決所面對到的各項問題,來讓這個社會變得更好。
大數據在台灣蔚為風潮,無論是政府官員或販夫走卒,人人皆聽聞大數據的威力。因此,產業界及各級政府皆努力建置所謂的大數據平台,以蒐羅及保存資料為己任,並導入資料的視覺分析工具,讓決策者們能夠快速地查看管理或施政成效,以客觀數據來輔助主觀評價,以分析輔助經驗,以事實取代臆測。



這些都是好的進展。收集資料並整理成視覺化的分析圖表,對於評估及掌控現況有非常大的幫助,讓我們不再只能依直覺及經驗做決策。但,其實,這只是把資料平台準備好而已,要充份發揮資料的價值,還沒有沾到邊。



要發揮資料價值,不能光談大數據,機器學習與人工智慧是絕對不該忽略的。事實上,這三者環環相扣:大數據是材料,機器學習是處理方法,人工智慧是成品所呈現的特質。這個時代,蒐集了大量資料,只呈現給人看,而不是拿來餵給電腦學習,讓你的應用呈現人工智慧,就跟採集了大量松露結果拿來沾醬油一整碗吃掉一樣可惜。如同精靈寶可夢需要有訓練師才能發揮能力,擁有大數據後,我們也需要很多很多的機器學習專家(有人稱呼為AI訓練師),才能讓我們手中的大數據真正發揮價值。



在此演講中,我將為聽眾闡明資料科學、大數據、人工智慧、機器(深度)學習、資料探勘等相近但又不同的詞彙,再以各領域的實際案例來分享資料的可能應用及實用價值。同時,我將與聽眾分享其協助多家企業培訓資料科學家及導入資料科學團隊的各種經驗,從企業如何跳脫既有框架,讓資料科學團隊盡情揮灑無限創意著手,進而能活用資料、挖掘出潛藏在資料中不為人知的秘密,最終打造高信任度及高效率的工作環境,展現資料分析的價值。

社會科學研究十分困難,主要可能有數個原因,包含 1) 社會行為本身的複雜性; 2) 取得觀測數據的困難性; 以及 3) 在大型社會組織中難以進行實驗,因此,相對於物理學、工程學、生物科學而言,社會科學研究的進展尤其緩慢。但在過去二十年來的資訊革命中,不僅電腦本身的計算速度和儲存容量急遽增加,且取得及分析社會行為觀察數據的範圍及規模也隨之提昇,以現今的電腦計算分析能力,極有可能劇烈改變傳統的社會科學研究方法。



社會現象可以計算嗎?2009 年二月,以哈佛大學教授大衛·拉澤爾為首的十五位來自美國不同學科的大學教授聯名在〈科學〉雜誌上發表了題為「計算社會科學」 (Computational Social Science) 的論文,帶起一個新興研究領域的誕生。簡單地說,計算社會科學是一個匯集社會科學和計算科學的新興領域,它的出現是因為新型態的數據來源,不斷提高的計算能力以及與電腦及統計科學家的關注以及與社會科學家的共同合作,其主要研究方法包含巨量數據觀測、群眾外包實驗、電腦模擬實驗、及演算模型等等。結合電腦科學的計算思維及社會科學長久發展的理論,預期將深刻改變研究者們如何觀察、瞭解及改善這個社會。



在此演講中,陳昇瑋博士將簡介計算社會科學這門新興的研究領域,並以自身的研究主題出發,分享如何使用網路實驗、資料分析及統計模式,來瞭解及帶動計算社會科學研究,以及如何通過大數據的收集、分析及建模,來觀察及解決我們切身的社會現象及問題。

網路安全是一個特殊的研究領域,其中一個原因是在網路安全問題中,"對手"不是文字、影像或任何形式死板板的資料,而是活生生的人;這些製造問題的黑客 (black hat hackers) 終日找尋各種系統及網路漏洞,企圖提出更高明的攻擊方式來獲取各種可能的利益。因此,在網路安全研究中,我們無法"預設"黑客會有什麼樣的攻擊行為,而必須從真正的資料中尋找蛛絲馬跡,從大量資料中發現及解決各種已發生或將發生可能危害使用者資料安全及隱私的行為。在這場研究中,我將介紹 data-driven network security research 並以幾個實際的研究案例來展示真實資料的統計分析可以幫助我們解決什麼樣的安全問題。
Games on demand, a.k.a., cloud gaming, refers to a new way to deliver computer games to users, where computationally complex games are executed and rendered on powerful cloud servers rather than local computing devices. In this talk, I will give an overview of the challenges in developing cloud gaming systems, what we have done, and what remains to do. I will start from GamingAnywhere, an open-source cloud gaming system, followed by a number of studies based on the system. Finally I will conclude the talk with open issues in providing highly real-time and high-definition audio/visual quality multimedia experience (e.g., in the form of gaming and virtual reality).

線上遊戲已被證明是網際網路的殺手級應用之一,許許多多的遊戲公司相繼投入萬人線上遊戲的研發行列。同時,電腦網路、人工智慧、多媒體、心理學、社會學等領域的學術研究者,也相繼在線上遊戲中發現值得關注的研究議題。從心理學家的角度,研究線上遊戲玩家的成癮行為,以及從現實社會的抽離是個重點的議題;從社會學家的角度,線上遊戲社群就像一個社會的縮影,透過觀察遊戲中玩家之間的人際關係及互動,可以做為驗證社會學理論的實驗場。當然,從電腦系統及網路研究者的角度來看,萬人線上遊戲本身就是一個極複雜的大型電腦通訊系統,值得投身其中為提供使用者更佳的服務品質而努力。

在這場演講中,我將從自身投入線上遊戲研究的五個理由開始,介紹線上遊戲研究的五個領域,包括電腦網路、安全及隱私、使用者行為、系統架構及人機互動。介紹的重點主題包括:

1) 遊戲外掛的偵測技術
2) 遊戲玩家的忠誠度分析
3) 網路品質對於遊戲玩家的行為影響
4) 雲端運算與線上遊戲
5) 自動遊戲漫畫製作技術

透過短短一個半小時的分享,希望你也能和我一樣領略在線上遊戲研究所帶來的無比樂趣。

國小四年級寫出第一支程式,爾後一頭栽入程式設計,至碩士畢業前經歷各式角色,從業界程式設計課程講師、技術書籍及雜誌專欄作者、共享軟體作者至 BBS 開發者/站長等,陳昇瑋原以為自己註定是一輩子的程式人;不料幾年前的一個決定,闖入了學術圈,成為一個以研究為己志,啃寫論文過活的學術人。雖然如此,在他深處的那份程式人的魂,不曾離去。

在這場演講中,陳博士將會介紹他在中央研究院進行的一系列與線上遊戲、網路安全、使用者隱私有關的研究成果。從遊戲的外掛偵測開始,他將簡述各式有趣、富挑戰性及實用性的研究,包括遊戲玩家的忠誠度分析、電腦輔助漫畫創作,Web 2.0 時代的資訊洩露危機,以及如何即時偵測僵屍電腦等。透過這場短短的分享,他希望讓大家知道程式人是何等幸福的族類,只要擁有好奇心、熱情及足夠的技術實力,在哪兒都可以把工作變得好玩,並有機會對社會做出正面的貢獻。

社群網路網站是 Web 2.0 世代裡十分重要的服務之一。在這類型的網站上,人們可以認識新朋友,互相交流,或與現實世界中的朋友們保持連繫及互動;透過網際網路的通訊能力,連接處於不同位置的人們。然而,當人們的互動從面對面的形式轉變成在網路上進行,許許多多的個人資訊及行為不知不覺中累積、甚至曝露在網路空間中。人們在欣喜互動的過程中,通常忘了自己的隱私資訊正一點一滴地洩露給網路上不知名的窺探者。

在這場演講中,我將從網路資料的不可抹滅性開始,探討在社群網路服路中常見的資訊洩露方式,以及哪一種系統/設計/使用習慣容易造成這些資訊洩露情形,這包含使用者主動的自我資訊洩露以及不是由使用者本身造成的二手資訊洩露。同時,我也將介紹由於社群網路服務流行為後而興起的網路資安隱憂,並在以可能的解決方案來做結。透過這場短短的分享,以傾聽的姿勢,希望見到大眾對於 Web 2.0 資安隱憂的正視與迴響。

在電腦系統的設計中,使用者經驗 (Quality of Experience) 已成為一項極重要的系統良窳設計指標。對於必須呈現在使用者面前的電腦系統,不論其系統層面效能指標多好,若使用者覺得不愉快,就不能算是好的設計。然而使用者滿意度是抽象的感覺,無法直接觀察或量測得到,因此,如何讓電腦系統在任何情況下都能提供讓人滿意的使用經驗是一個懸而未解的開放問題。要達到此目標必須解決三個子問題,分別是 1) 如何有系統有效率地量測使用者滿意度, 2) 如何描述 (模型化) 使用者滿意度與系統層面效能指標的關係, 3) 如何自動調校系統參數來達成最佳使用者滿意度。

在這場演講中,我將分別依序三個子問題。從如何減輕受試者實驗進行的困難度及檢驗實驗結果可靠度開始,讓研究者可以透過網際網路邀請廣大的網路用戶們來協助進行實驗;進而將使用者滿意度指標與諸多系統效能指標(例如延遲時間、系統處理時間、頻寬等等)以模型來描述,最終探討如何自動調校系統參數來達成最佳使用者滿意度。使用者經驗近年來已逐漸受到網路及多媒體領域研究者的重視,雖然它抽象它難以量測,但若我們在電腦系統設計中持續地將它當成一等公民來考量,相信未來的網路及多媒體系統能提供更佳的使用者經驗,在各種環境中。

近年來殭屍網路的操作者廣泛地運用匿蹤技術(fast-flux)延長惡意資源的生命週期,以避免殭屍網路所產生的惡意活動遭到研究人員一次性全面移除。一個匿蹤殭屍網路所使用的網域名稱,會隨著時間對應到大量的IP位址,當客戶端對於這些IP位址送出資源請求時,實際上<在處理資源請求的伺服器並非客戶端所見的主機,而是隱藏在幕後的惡意伺服器。目前國際間所提出的匿蹤殭屍網路偵測機制大多依賴匿蹤殭屍網路使用的網域名稱會大量變換IP位址的特徵,雖然此一特徵能夠有效並且正確地偵測匿蹤殭屍網路,然而此類偵測系統勢必需要一段觀察時間來決定偵測對象是否為匿蹤殭屍網路。

在本演講中,我將介紹我們對於利用匿蹤技術提供網頁服務的殭屍網路提出一嶄新的匿蹤殭屍網路即時偵測機制。本偵測機制基於匿蹤殭屍網路的天生特性及其所造成之現象,選定用來偵測殭屍電腦的特徵,其特性包含:1)殭屍網路的資源請求委外運作模式、2)殭屍電腦的資源並非完全用以提供惡意服務,以及 3)殭屍電腦的硬體設定明顯不如專業伺服器。實際效能評估顯示本偵測機制於被動偵測模式中運行時,能夠在數秒內偵測出匿蹤殭屍電腦,並且達到至少 96% 的偵測準確率及小於 5% 的誤判率。

邀請演講 (近期列表)


陳昇瑋(原名:陳寬達)
http://www.iis.sinica.edu.tw/~swc 
Last Update September 28, 2019