欧美亚洲另类专区,精品一区二区三区免费福利,伊人色综合网久久天天,欧美人牲口杂交在线播放免费

              首頁 > 生活 > 3c科技 > 正文

              ?遷移學習,人工智能技術的“明天”

              2019-02-19 03:17:32大公報
              字號
              放大
              標準
              分享

               

                圖:人工智能(AI)是近年來世界範圍內最熱門的科學技術之一

                近年,人工智能(AI)在世界範圍內掀起一股浪潮,許多國家將人工智能技術的發(fā)展提到了國家戰(zhàn)略的高度,國內外一些有名的科技公司都開始在這方面投入大量的資源進行研發(fā)和應用。其中在國外比較具有代表性的有谷歌、微軟和Facebook等,內地的百度、阿里巴巴、騰訊等互聯(lián)網公司也紛紛對人工智能領域的技術研發(fā)和應用進行布局。/朱鳳天、汪漪、王向榮

                “人工智能”一詞并不是一個新的概念,早在上個世紀的五十年代,對這個領域的探索就已經開始了。當時的科學家們提出了“要用人工智能來模擬人類的智慧”這一大膽的目標。在這之后,人工智能這一領域便迎來了自己的第一個“黃金時代”,此后,這一領域又反反覆覆出現(xiàn)過幾次發(fā)展的高潮與低谷。有人將這一段對人工智能領域探索的歷史稱為“喧囂與渴望、挫折與失望交替出現(xiàn)的時代”。

                從深度學習到遷移學習

                近年,由於神經網絡深度學習在算法上的突破,使得眾多基礎人工智能水平得到很大的提升。人工智能的各種相關領域藉著深度學習有了更高層次的發(fā)展。就目前來說,深度學習方法對圖像視覺領域的問題解決有著相當不錯的效果,可是這種方法并不能對所有問題都適用。

                一些有延遲反饋的相關問題,比如機器人的運動路徑規(guī)劃問題。還有前段時間那隻下圍棋贏了世界冠軍柯潔的“阿爾法狗”,就是用深度學習和強化學習兩種方法相結合去開發(fā)的。還有一些小規(guī)模數(shù)據(jù)問題,深度學習的模型依賴大規(guī)模的數(shù)據(jù)去訓練,可是現(xiàn)實生活中并不是每一類需要解決的問題我們都能獲得相應的大量數(shù)據(jù),這一類問題我們僅靠深度學習方法就沒辦法很好地解決,而處理這一類小規(guī)模數(shù)據(jù)問題的最好方法就是本文的介紹對象—遷移學習。

                遷移學習可優(yōu)化的領域

                計算機視覺:

                基於不同的CNN架構,深度學習在多種計算機視覺任務上的應用取得了相當大的成功。遷移學習在視覺這一領域可以幫助我們在風格遷移和人臉識別等目標任務中利用現(xiàn)有的當前最先進模型,雖然目標領域的任務可能不同,不過可以將現(xiàn)有優(yōu)秀模型的可取之處遷移到目標任務當中。

                自然語言處理:

                對自然語言處理而言,其本身的進展就不如計算機視覺那樣成熟,文本數(shù)據(jù)給深度學習提出了各種各樣的挑戰(zhàn)。使用遷移學習中預先訓練的方法以及加入文檔嵌入層,可以在數(shù)據(jù)量較小時也可以取得很優(yōu)秀的效果。通過從源領域遷移知識,可將其應用到情感分析和文本分類等任務當中。

                音頻處理:

                類似於自然語言處理和視覺,遷移學習也在提升優(yōu)化基於深度學習的音頻數(shù)據(jù)任務模型中取得了不錯的效果。

                何謂遷移學習

                前百度首席科學家、史丹福大學教授吳恩達(Andrew Ng)在一次採訪中曾說到過:“遷移學習將會是繼監(jiān)督學習之后的下一個機器學習商業(yè)成功的驅動力”。吳恩達教授之所以會認為遷移學習是未來最有活力的機器學習領域,就是因為遷移學習能夠解決現(xiàn)有方法無法解決的問題。遷移學習(Transfer Learning),也可以叫做領域適配(Domain Adaptation),就是指將從源領域學習到的東西應用到目標領域上,當然源領域與目標領域之間有一些差異,比如兩個領域的數(shù)據(jù)的分布不同等。簡單地說就是遷移學習可以從現(xiàn)有的數(shù)據(jù)中遷移學習的東西,用在將來的任務當中。把從別的領域學習到的知識應用到新的環(huán)境中。由此可以明顯的感覺到,這樣的人工智能是更加符合人類對“人工智能”的期望。

                當前階段,遷移學習方法一般用來解決的問題有兩類,分別是前文提到的小規(guī)模數(shù)據(jù)問題和個性化問題。當遇到小規(guī)模數(shù)據(jù)問題,我們沒有辦法使用足夠的數(shù)據(jù)基於深度學習方法訓練出一個可以很好解決問題的模型,遷移學習這時候的解決方法就是找一個有些許關聯(lián)(當然也有差異)的另一個已有足夠數(shù)據(jù)的問題,利用這個問題的數(shù)據(jù),去建立一個模型,再結合兩個問題的關聯(lián),就可以將這個模型遷移到我們所需要解決的問題上。

                第二個是個性化問題,比如我們每個人都希望自己的一些電子設備(比如手機)能夠記住自己的一些習慣,這樣就不用每次都去設定它,通過遷移學習我們就可以將一個通用的用戶使用手機的習慣模型遷移到個性化數(shù)據(jù)當中。

                遷移學習的具體應用場景

                醫(yī)療影像分析:   在醫(yī)學影像分析任務中,醫(yī)學圖像訓練數(shù)據(jù)的標註需要先驗的醫(yī)學知識,適合標註此類數(shù)據(jù)的人群稀少,從而導致訓練數(shù)據(jù)嚴重稀缺,深度學習將不再適用??梢詫⑦w移學習應用到醫(yī)學圖像的語義映射中,利用圖像識別的結果幫助醫(yī)生對患者進行診斷,從而減輕醫(yī)生的工作負擔,促進醫(yī)療實現(xiàn)轉型。

                藝術風格遷移:

                藝術風格遷移是一個頗具歷史性的話題,多少藝術家為了模仿名家的作品風煞費苦心,遷移學習卻可以輕鬆做到這一點。比如我們可以將從梵高的畫中學習到的“知識”應用到新的圖像中,一隻梵高風格的貓就被“畫”出來了。

                語音識別:

                語音識別一直是人工智能領域的重要問題,因為人們如何評價“智能”這個屬性,很大一方面就是從機器與人類的交互性上去度量。針對英語自動識別模型(ASR)就曾在遷移學習方法下,被成功應用到提升法語等其他語言識別的模型下,給目標任務帶來大幅表現(xiàn)提升。

                自動駕駛模型訓練:

                在自動駕駛的任務當中,需要大量的經驗數(shù)據(jù)訓練模型??墒侵苯釉趯嶋H場景中進行採集數(shù)據(jù)非常費事費力,成本很高,而且有很大的危險性。所以現(xiàn)在許多公司直接使用仿真模擬器訓練模型,之后再把學到的“知識”用於實際測試當中,并不斷優(yōu)化。

                遷移學習的分類

                根據(jù)我們從源領域到目的領域所遷移的具體內容,目前可以把遷移學習分為四大類,分別是基於實例的遷移學習(Instance-based Transfer Learning),基於特征的遷移學習(Feature-based Transfer Learning),基於參數(shù)的遷移學習(Parameter-based Transfer Learning)和基於關係知識的遷移學習(Relational-Knowledge-based Transfer Learning)。

                基於實例的遷移學習

                該方法的基本思想是根據(jù)一個確定的相似度匹配原則從源領域中尋找和目的領域相似度較高的實例(Instance),將這些篩選出的實例遷移到目的領域中去幫助目的領域模型的訓練,從而就可以幫助解決目的領域數(shù)據(jù)樣本不足,標籤不足等問題。一般的方法是對實例進行加權處理,在訓練過程總對更加重要的實例加權,對沒那麼重要的實例進行降權,從而讓最終訓練結果更好。

                基於特征的遷移學習

                該方法指的是在特征空間進行遷移,這種方式一般需要將源領域和目的領域的特征投影到同一個特征空間,然后從源領域學習一個好的特征,將學到的通過特征形式進行編碼傳到目的領域,從而提升目的領域的學習效果。

                基於參數(shù)的遷移學習

                該方法要求源領域和目標領域的任務之間共享相同的模型參數(shù),或者服從相同的先驗分布。從而將已經學到的參數(shù)相關知識遷移。

                基於關係知識的遷移學習

                該方法假設源領域和目的領域的數(shù)據(jù)之間的聯(lián)繫是相同的,通過在源領域和目的領域的關係模型之間建立一個映射模型從而達到遷移的目的。

                挑戰(zhàn)與展望

                遷移學習作為人工智能領域的方向,說明人工智能領域將會往更加“智能化”的方向發(fā)展,將會為人類解決更多的問題。不過就目前來說,遷移學習仍然是一個新興領域,目前主要是學術界在進行算法的研究,在業(yè)界的實際應用落地方面還需進一步的發(fā)展。

                就遷移學習技術特點,以及目前的發(fā)展現(xiàn)狀,我們可以推測,遷移學習未來可能的發(fā)展方向有以下幾種:(1)跨領域的遷移學習。(2)遷移學習與多種深度學習方法相結合。(3)利用遷移學習處理數(shù)據(jù)之間的偏差。(4)將遷移學習應用到非平穩(wěn)環(huán)境的大數(shù)據(jù)分析平臺。

                總之,遷移學習代表了人工智能的“明天”,一定會成為人工智能領域發(fā)展的又一個重要推動力。

                下期“3C科技”將於3月5日刊登

              點擊排行