人工智能相關技術研究與發展
- 作者:
- 安徽新天源建設咨詢有限公司
- 最后修訂:
- 2020-07-04 09:18:39
摘要:
目錄
主要專家簡介:
展開
【簡介】
人工智能(AI — Artificial Intelligence)是研究用計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規劃等)的一門新的技術科學,是計算機科學的一個分支。它的目標是使計算機完成類似人類智能的工作,實現更高層次的應用。近年來人工智能技術有了很大發展,世界上一些主要大國都把人工智能納入國家戰略給予高度重視。2015年,我國制定的《中國制造2025》制造強國戰略中,“智能制造”被定位為中國制造的主攻方向。2017年,國務院印發的《“互聯網+”行動指導意見》中,人工智能領域被列為重點發展領域。人工智能技術成為國際競爭新的制高點。本次沙龍討論了人工智能的發展現狀和未來的發展展望,為人工智能的研究和發展提出了建議。
【主持人致辭】
趙永濤:今天的沙龍是我們成都分院老科協舉辦的第五次學術沙龍,主題是“人工智能相關技術研究與發展”。人工智能是當前一個熱門話題,我們邀請了中科院成都信息技術股份有限公司(原中科院成都計算所)劉紹中研究員作主旨報告。劉紹中研究員長期從事計算機技術的研究開發,對人工智能有深入研究。我們還邀請了川大、西南交大、電子科大、西南民院等單位人工智能研究領域的老師,希望大家進行交流討論。今天參加沙龍活動的還有院離退休干部工作局、院老科協的有關領導以及省老科協、分院的有關領導,我們表示熱烈歡迎。下面有請劉紹中研究員作報告。
【主旨報告】
劉紹中:人工智能相關技術研究與發展
一、從AlphaGo(阿爾法狗)談起
AlphaGo是人工智能里程碑式的進步。近年來人工智能給人們帶來的沖擊,莫過于AlphaGo戰勝世界圍棋大師的事件。AlphaGo是一款計算機下圍棋的程序。大家都知道,圍棋的棋盤是一個由縱橫各19條線組成的正方形網格,共有361個格點。它的規則很簡單:對弈雙方分別持黑白棋子,黑子181枚,白子180枚,共361枚;雙方輪流把棋子落在棋盤的格點上,落子后不能移動,如果一方的棋子被另一方的棋子圍住,即為“死子”,可以被提走。這樣下去,直至局終,以盤面上的活子圍地多少來定勝負。
為了寫出計算機下圍棋的程序,需要進行一些形式化處理。我們把棋盤定義為一個“類”,棋盤上每個格點的“狀態”用一個三維數組表示,前兩項定義格點的坐標位置,第三項定義當前格點的狀況(黑、白、空)。再把棋盤上內部連通的格點集合且集合中格點具有相同狀態(黑、白)定義為棋盤類的“子類”。子類的實例就是圍棋的塊。塊中不完全與其塊內格點連通的格點是塊的邊界格點。邊界格點要不自己就是棋盤邊界,要不就是與它相連的外部與塊本身對象顏色不同的格點(另外一種顏色、或空),如果所有與塊相鄰的外部格點都是另外一種顏色的話,那么這個塊就沒氣了,就死掉了。所以可以定義它的幾個操作。塊的連通或“增操作”就是要把它增加或者合并。如果它被吃掉了,定義它的操作就是顏色變成空了,黑的變成空的或者是白的變成空了。
由于圍棋的規則并不復雜,一般說來,一個初等的程序員就可以寫出一個圍棋游戲的程序。問題在這兒,如果要機器下圍棋,如果不計算死活,一方一步,圍棋的狀態空間是361的階乘這樣一個數量級。如果是加上下棋過程中被吃掉的,被替掉的塊,狀態空間的數量級還要增加很多,它的數量實在太大了。我們平時下棋實際上就是在這樣一個大的狀態空間去搜索它的路徑,從一個狀態到另一個狀態、現在這個狀態和下面一個狀態的搜索。我們知道以前在搜索的時候,采用的是廣度搜索和深度搜索(所謂暴力搜索)。現在這么巨大的量,如果完全是暴力搜索方式的話,肯定是處理不了的。怎么樣減少它的搜索呢?人們在幾千年的博弈歷史中,總結了很多經驗性的知識,比如棋譜、比如定式、比如各種棋經之類等等。棋手就是參考這些知識來判斷局勢、幫助自己做出路徑設計。
圖1 圍棋
1997年,IBM的深藍(Deep Blue)跟卡斯巴羅夫下國際象棋,深藍就是以這樣的巨量暴力搜索形式,取勝了卡斯巴羅夫,而且贏得他心服口服。當時我們認為人工智能搜索方式是:它總結所有國際象棋的棋手經驗,在此基礎上來進行啟發式的暴力搜索,也就是在已有的知識基礎上進行搜索。
而現在的AlphaGo,我們看到是另外一個方式。它與李世乭對弈的時候,下到第四盤輸了。當時國內的棋手界,包括聶衛平后來評價說,這個棋是多少臺機器在運算,其中有一臺機器斷電了,因為不像是機器在其余幾盤中應有的水平。給李世乭下的是AlphaGo-Lee,這個版本是建立在兩個神經網絡的基礎上,一個策略網絡,還有一個是評價網絡。一個網絡評價輸贏的概率。然后另一個網絡來決定它下一步怎么走。
后來出了一個改進版本,叫AlphaGo-Master,與柯杰下,完敗柯杰。Alpha-Lee和李世乭下的時候,說它輸入了很多既有的知識。但是到AlphaGo-Master的時候,它已經基本上完全不需要前面的知識了。
當AlphaGo再升級的時候,叫AlphaGo-zero,AlphaGo-zero是什么呢?它自己跟自己下,開始它只知道圍棋的規則,它完全沒有圍棋所有幾千年累計的知識,完全沒有。它就自己同自己下,很快它就掌握了我們幾千年的知識,AlphaGo-Zero顯示的就是自學習功能,它自己學會了怎么樣積累圍棋的知識。
棋譜是幾千年累計下來的,AlphaGo-Zero完全不知道,它通過自學習就學會了,太厲害了,所以我覺得它給我們帶來一種全新的考慮。我們以前做程序的時候都知道,要讓程序靈活的話,可以用參數來改變它,讓它自己在運行過程中修改參數。AlphaGo不僅修改參數,而且還修改神經網絡本身。AlphaGo-Master和AlphaGo-zero只用圍棋規則作為輸入,一點也沒有用其他的圍棋知識輸入。
AlphaGo-master還包括了少量的設計者掌握的知識特征。AlphaGo-zero不用這些知識,隨機地扔幾個棋子下去,看它的結果。它是先來評估,評估當前的狀況是什么樣的,再來預測下一個落子的位置。它在運行的時候,AlphaGo根據它應用的對象,然后積累對象的知識,這很厲害。算法定了,AlphaGo神經網絡就已經有了,它也用這個神經網絡來計算別的東西。前幾天才公布的一件成果,他們用Alpha-Fold 來預測蛋白質的空間結構,3維空間的折疊,就是用這個算法來做的。這個算法與物理的東西沒有關系,跟蛋白質的空間折疊的物理基礎沒什么關系,它用這個算法來做,非常讓人震驚。
總結一下:在AlphaGo-Master基礎上,DeepMind利用了一種新的強化學習方式,開發了更進一步的AlphaGo-zero。AlphaGo-zero 自己成為自己的老師。從一個對圍棋游戲完全沒有任何知識的神經網絡開始。通過將這個神經網絡與一種強大的搜索算法相結合,就可以自己和自己下棋了。在它自我對弈的過程中,神經網絡被調整、更新,以預測下一個落子位置以及對局的最終贏家。
這個更新后的神經網絡又將與搜索算法重新組合,進而創建一個新的、更強大的 AlphaGo-zero 版本,再次重復這個過程。在每一次迭代中,系統的性能都得到一點兒的提高,自我對弈的質量也在提高,這就使得神經網絡的預測越來越準確,得到更加強大的 AlphaGo-zero 版本。這種技術使得它不再受限于人類知識的局限。相反,它可以從一張白紙的狀態開始,從世界上最強大的圍棋玩家AlphaGo 自身進行學習。
AlphaGo-zero與之前的版本不同的是:
AlphaGo-zero只使用圍棋棋盤上的黑子和白子作為輸入,而之前版本的的輸入包含了少量人工設計的特征。
AlphaGo-zero只使用一個神經網絡。之前的版本使用兩個神經網絡,一個是“策略網絡”(policy network),用來選擇下一個落子位置;另一個是“評價網絡”(value network),用來預測游戲的贏家。在AlphaGo-zero 中這些是聯合進行的,這使得它能夠更有效地進行訓練和評價。
AlphaGo-zero不使用“走子演算”(rollout)——這是其他圍棋程序使用的快速隨機游戲,用來預測哪一方將從當前的棋局中獲勝。相反,它只依賴于高質量的神經網絡來評估落子位置。
在進行了三天的自我訓練后,AlphaGo-zero在100局比賽中以100:0擊敗了上一版本的 AlphaGo——而上一版本的 AlphaGo 擊敗了曾18次獲得圍棋世界冠軍的韓國九段棋士李世乭。經過 40 天的自我訓練后,AlphaGo-zero變得更加強大,超越了曾擊敗世界上最優秀、世界第一的柯潔的AlphaGo-Master。
在經過數以百萬計的自我對弈后,從零開始,Alpha-zero在短短幾天內積累了人類數千年積累的知識。Alpha-zero也發現了新的知識,開發出非常規的策略和創造性的新下法,這些新下法超越了它在與柯潔和李世乭比賽時發明的新技巧。DeepMind 聯合創始人兼 CEO Demis Hassabis 評論稱:“AlphaGo短短兩年里取得了如此令人驚嘆的成果。現在,Alpha-zero是我們項目中最強大的版本,它展示了我們在更少的計算能力,而且完全不使用人類數據的情況下可以取得如此大的進展。
二、人工智能(AI)技術的回顧
我們來討論一下人工智能發展過程中間涉及到哪些技術,以前我們做過一些什么事。
1. 專家系統
我記得以前有一段時間“專家系統”很流行,現在好像不太時興了。1982年在我們所,朱學曾和中醫學院搞了一個中醫痺癥的專家系統,后來我們在1982巴基斯坦伊斯蘭堡“The 7th nassalgali international summer college on physics and contemporary needs”會議上,公布了我所開發的中醫痺癥專家系統。現在看來它就是一個簡單的if…then…的判別程序,其中判別條件就是預先設定的專家的知識。
專家系統主要研究:怎么收集專家知識,怎樣把專家知識把它表達出來,知識表達方式,怎么樣存儲,怎么檢索。當時專家系統就包括知識庫,知識庫。知識表示方式有產生式規則、語義網絡、框架、狀態空間、邏輯模式、腳本、過程、面向對象等。基于規則的產生式系統是目前實現知識運用最基本的方法。主要就是專家的知識怎么樣進去,就是把專家的知識數字化。我們做了很多這種項目,讓專家對某一個問題打分,完全把它數字化,然后把專家的設計到的各方面的東西集中起來,用數學的方法找出最優的結果。
專家系統通常由人機交互界面、知識庫、推理機、解釋器、綜合數據庫、知識獲取等6個部分構成。
其中推理機(又稱規則解釋器)的任務是運用控制策略找到可以應用的規則。推理機針對當前問題的條件或已知信息,反復匹配知識庫中的規則,獲得新的結論,以得到問題求解結果。推理方式可以有正向和反向推理兩種。正向鏈的策略是尋找出前提可以同數據庫中的事實或斷言相匹配的那些規則,并運用沖突的消除策略,從這些都可滿足的規則中挑選出一個執行,從而改變原來數據庫的內容。這樣反復地進行尋找,直到數據庫的事實與目標一致即找到解答,或者到沒有規則可以與之匹配時才停止。逆向鏈的策略是從選定的目標出發,尋找執行后果可以達到目標的規則;如果這條規則的前提與數據庫中的事實相匹配,問題就得到解決;否則把這條規則的前提作為新的子目標,并對新的子目標尋找可以運用的規則,執行逆向序列的前提,直到最后運用的規則的前提可以與數據庫中的事實相匹配,或者直到沒有規則再可以應用時,系統便以對話形式請求用戶回答并輸入必需的事實。
2. 大數據
AI的另一技術基礎依賴大數據。大數據怎么來的呢?最早我們所里搞關系數據庫(32位微小型機上的關系數據庫,獲得四川省軟件一等獎),是定義和管理早期結構化數據的數據庫。以后發展到現在的大型關系數據庫,起初數據庫只能處理同源的結構化的數據,以后擴展到異構的結構化數據。再以后由于處理多媒體信息和網絡數據的需要,進入網絡多媒體數據庫、數據倉庫、……的時代,數據存儲、檢索、挖掘和分析的技術獲得飛速發展。
數據檢索,就是給一個條件,然后從數據庫找出來滿足這一條件的數據。后來到網絡數據的時候,網絡數據和非結構化的數據,比如說文本、圖像這種數據的時候,這種數據檢索就發展成了數據挖掘。實際上我們在網絡檢索數據時就是發出很多代理,發到網上,讓它去找相應的數據。到網絡數據的階段,就給非結構化的數據與提供了很大的空間的。
大數據現在的定義需要新的處理模式,需要更強的決策力、洞察發現力和流程優化的能力來適應海量的高增長率的多樣化的數據信息。多樣化的信息資產包括結構化的數據,非結構化的數據,還有圖像、聲音等各種媒體。什么結構的信息都能夠檢索,而且都是在網絡上面數據。這種數據的檢索在挖掘的過程中間,就會產生很多新的知識,比如最早的數據挖掘,在挖掘數據的過程中,發現信息之間有一些以前你不知道的關聯性,關聯規則。一個著名的例子,男的到超市去買東西,啤酒和尿布的關聯就是在挖掘過程中發現的。這個關聯規則的發現就是產生知識的來源,不斷產生新的知識。所以大數據是我們新的知識的來源之一。從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數據進行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。大數據通常用來形容一個公司創造的大量非結構化數據和半結構化數據,大數據分析常和云計算聯系到一起,實時的大型數據集分析需要建立有效的框架來向數十、數百或甚至數千的電腦分配工作。適用于大數據的技術,包括大規模并行處理(MPP)數據庫、數據挖掘、分布式文件系統、分布式數據庫、云計算平臺、互聯網和可擴展的存儲系統。
由于大數據技術的發展,各類以前看似完全不搭界的事物潛在的關聯、規則正在不斷的發掘出來,新的知識正在不斷發現。
3. 神經網絡
還有一個AI的重要技術就是神經網絡。原理來自動物的神經系統,輸入相當于給系統一個刺激,然后根據神經的生理模式的模擬它的刺激傳遞方式,離它遠的地方,神經源對刺激的反映就要弱一些,一直到最后得到一個輸出。根據你現有的知識,對它進行訓練,然后讓它能夠符合人在遇到問題的時候的判斷方式,讓它更能符合實際,這就是神經網絡的大概原理。
更嚴格的定義應該是:神經網絡(Neural Networks,NN)是由大量的、簡單的處理單元(稱為神經元)廣泛地互相連接而形成的復雜網絡系統,它反映了人腦功能的許多基本特征,是一個高度復雜的非線性動力學習系統。神經網絡具有大規模并行、分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條件的、不精確和模糊的信息處理問題。神經網絡的發展與神經科學、數理科學、認知科學、計算機科學、人工智能、信息科學、控制論、機器人學、微電子學、心理學、光計算、分子生物學等有關,是一門新興的邊緣交叉學科。
神經網絡的基礎是神經元。神經網絡模型是以神經元的數學模型為基礎來描述的。人工神經網絡(Artificial NuearlNewtokr)是對人類大腦系統的一階特性的一種描。簡單地講,它是一個數學模型。神經網絡模型由網絡拓撲.節點特點和學習規則來表示。神經網絡是一個高度非線性動力學系統。雖然,每個神經元的結構和功能都不復雜,但是神經網絡的動態行為則是十分復雜的;因此,用神經網絡可以表達實際物理世界的各種現象。
人工神經網絡的模型現在有數十種之多,應用較多的典型的神經網絡模型包括BP神經網絡、Hopfield網絡、ART網絡和Kohonen網絡。下圖是一種簡單的線性神經網絡模型:
圖2 線性神經網絡結構
4. 自學習
學習是神經網絡一種最重要也最令人注目的特點。在神經網絡的發展過程中,學習算法的研究有著十分重要的地位。目前,人們所提出的神經網絡模型都是和學習算法相應的。所以,有時人們并不去祈求對模型和算法進行嚴格的定義或區分。有的模型可以有多種算法。而有的算法可能可用于多種模型。在神經網絡中,對外部環境提供的模式樣本進行學習訓練,并能存儲這種模式,則稱為感知器;對外部環境有適應能力,能自動提取外部環境變化特征,則稱為認知器。神經網絡在學習中,一般分為有教師和無教師學習兩種。感知器采用有教師信號進行學習,而認知器則采用無教師信號學習的。在主要神經網絡如Bp網絡,Hopfield網絡,ART絡和Kohonen網絡中;Bp網絡和Hopfield網絡是需要教師信號才能進行學習的;而ART網絡和Khonone網絡則無需教師信號就可以學習。所謂教師信號,就是在神經網絡學習中由外部提供的模式樣本信號。
神經網絡的算法與傳統的問題求解方式完全不一樣。我們經典的處理問題的辦法,比如說我們處理力學的問題,首先根據物理定律(牛頓定律),和介質材料的性質,建立物理模型。然后就可以推出一大堆公式,建立數學的模型,最后求解。但是神經網絡求解方式就可能就跟物理模型沒關系,完全是一個數學的試探過程。我們以前幾百年來的求解方式是把所有的影響因素逐步孤立化,比方說力的因素、電的因素,把它分開來建立它的模型,最后才來匯總綜合考慮整體的影響。然而現在AI解決問題的方式就可能不是這樣了。現在是把所有的影響的因素、約束條件、目標需求數字化。比方說電流,從一安到多少安,反正按電流的因素把它數字化。然后力學的因素,光學的因素,或者別的什么因素全部數字化以后,就變成一個很多維的狀態空間。所以問題求解就是在這樣一個多維的狀態空間去搜索尋找它的滿足條件的結果。而這樣的狀態空間中,相關的因素(即其中某些維)跟物理模型隔得有點遠了,有的可能有嚴格的物理模型、也可能只有一些經驗的數學模型、甚至只有一些零星的參考數據。AI就可以在這樣的狀態空間中,通過搜索、評估、預測來進行路徑探索,最終向與其結果逼近。就像AlphaGo現在這樣。AlphaGo做蛋白質的空間折疊跟下圍棋一樣,用基本類似的一個網絡Alpha-Fold在做。很奇怪的,我也不知道我們將來會不會也有類似的這樣一個結果。
以AlphaGo-zero為例,其自學習機制可以描述為:
AlphaGo-zero 的神經網絡使用自我對弈數據做訓練,這些自我對弈是在一種新的強化學習算法下完成的。在每個位置 s,神經網絡 fθ都會進行蒙特卡洛樹搜索(MCTS)。MCTS 輸出下每步棋的落子概率 π。這樣搜索得出的概率通常比神經網絡 fθ(s) 的原始落子概率 p 要更加強一些;MCTS 也因此可以被視為一個更加強大的策略提升運算。這一新的強化學習算法的核心思想是,在策略迭代的過程中,反復使用這些搜索運算,神經網絡的參數就不斷更新,讓落子概率和評價 (p,v)= fθ(s) 越來越接近改善后的搜索概率和自我對弈贏家 (π, z)。這些新的參數也被用于下一次自我對弈的迭代,讓搜索越來越強。
這里的自學習功能表現為:1、數據和算法參數的自動更新;2、策略的迭代和更新。顯然策略更新還有更多的想象空間。
一般而言,常規神經網絡的學習功能包括:三層神經網絡、K近鄰、Adaboost、貝葉斯、決策樹等常規方法。深度學習方法包括:深度置信網絡、卷積神經網絡、受限波爾茲曼機、循環神經網絡等。此外,常見的涉及利用既有知識的算法還有:遷移學習、主動學習、演化學習等。
三、AI未來發展展望
下面講一點我們對AI的一些展望。
1. 新知識的產生
1)完全依靠公理和邏輯推理的科學領域未來將可能沒有人類領先的空間。數學就是這樣一門科學,數學的基礎建立在一系列公理之上,通過邏輯推理向各個方向無限延伸。構成數學推理的語言是一套符號運算系統,在基本公理的基礎上,人們可以依靠邏輯遞歸地推導出一系列毋庸置疑的結論。按照哥德爾不完備定理,通過添加任意多與之前的公理獨立且自洽的公理,就可以得到更多全新的知識。建立在公理系統的邏輯推理的領域,就是一個符號系統,它的所有的符號推理的東西,比如說我們楊路老師以前搞過多項式的辨別式,給出了任意多項式的判別式,建立在一個新的符號系統基礎上。該符號系統除了+、-、×、/,它加上了一個程序判別。AlphaGo-zero三天的自我訓練得到的圍棋知識就遠遠超過了人類幾千年得到的圍棋知識。可以想像,如果我們建立了一個公理系統和邏輯推理規則,將會有機器來自動產生所有的推論。很難的問題,它都會給你推出來。將來肯定是這樣的。因此在這些領域,未來將可能沒有人類領先的空間。
2)大批跨領域的新知識將不斷出現。幾千年來的實證科學研究方法,講究盡可能研究單一因素對結果的影響,在此基礎上考慮各種可能的影響。所以在很多領域需要根據物理定律建立數學模型,進而求解。而AI提供了以前看似完全無關領域的關聯研究方法,使用的方法就是搜索、評估、調整等看似與物理模型關系不強的方法,卻可以得到相對最優的結果。我們以前學應用數學的時候,首先我們要把方程列出來,再把它的數據解求出來。現在不是這樣的,現在就是把這些可能的這些因素數據化,然后去搜索,全部一個點一個點去找它的結果,這個跟我們原先的方程不一樣了。
3)由于計算機的信息可以永久儲存,所有的既有的知識將永久存在,不再需要重新發現。這會對人類的學習和創造新知識產生巨大影響。
4)由于AI系統的廣泛應用,由此將產生大量新的符號系統。這意味著人類的知識系統會產生巨大變化。
5)語言、文字、及所有的人類交流方式將出現根本性變化。比如,據說臉書定義了一種語法和簡單的單詞,讓AI系統自己在類似實際的環境中進行訓練。最后產生了一種誰也不懂得語言,嚇得開發者趕快拔電源關機。
2. 新方法的產生
1)新的符號系統及符號運算方法。這是必然的趨勢。
2)新的趨勢評估方法 。以前我們評估趨勢的方法是生成一個曲面,然后在曲面上面找這些點。現在不是這樣,這個點比這個點高,我們就往這個方向走,這個點比這個點低,我覺得這個方向我就放棄了,或者說幾個點它的梯度什么的,它前進的方向不一樣。它的路徑,搜索的路徑不一樣。
3)新的路徑搜索算法。就是怎么樣使你搜索的路徑優化,減少你的無效的搜索,還有就是你的算法的并行性,盡量并行處理。
4) 新的優化算法。算法的框架和參數的迭代優化,這個優化過程,這個是從AlphaGo-zero來的,它在自己學習過程中間,會把它的參數,甚至框架都優化了。我覺得現在還沒看到我們這個領域里面有人在做這個東西,怎么樣去把整個框架迭代優化,AlphaGo就做這些。可能這個東西涉及到它的技術秘密,但是這個東西是很有意思的,不光是參數優化。
5) 跨學科領域的綜合集成算法。由于神經網絡本身并不去祈求對模型和算法進行嚴格的定義或區分。有的模型可以有多種算法。而有的算法可能可用于多種模型。而采用神經網絡對于現有的各類模型和算法進行評價顯然會產生新的方法。
3. 新的應用
新的應用會很多,這里舉一些例子:
1) 自動駕駛。新應用第一個方面就是自動駕駛。自動駕駛現在很熱,實際上飛機的自動駕駛肯定是最成熟的,民航飛行員上天以后基本上不再人工駕駛了,都是自動駕駛。它的環境是相對要簡單一些。汽車的自動駕駛的環境要復雜一些,要估計許多其他的環境因素,人工智能就是專門處理這些問題的。比方說路邊有一個人,你圖像采集到了,他站在那兒,他有一些什么動作,你就能夠估計出他的下一步動作,這個就是AlphaGo的用法。原先覺得這個很難,現在看起來還會出問題,肯定最終會把這個問題處理好。
2)自然語言理解。新應用的第二個方面是自然語言的理解和翻譯。原先覺得這是很難的,現在已經有非常大的進步了。一般的自然語言,AI不但能夠理解,能夠越來越細膩的理解,原來它要求很標準的輸入,它現在能夠理解到你很獨特的口音。你的表達的很細微的地方它會找出來,這種表達和那種表達的中間的差別也會找出來,這是發展方向。而且現在實用的東西已經很多了。
3)基因的研究。現在這個比較熱,尤其是國外很熱門,我目前還不清楚我們中國怎么樣。最近我看到很多材料,生物醫學的靶向治療已經精準到必須要跟你基因進行匹配,原來的靶向治療根據你的病的位置來確定它的靶向,而現在它要精確到你的基因,用AI分析你的基因來確定你的靶向,這個是很厲害的,一家波士頓的醫療研究機構在進行這方面的臨床研究。當然現在很貴,它要去分析你的基因,這是生物技術的尖端科技應用。
4)語言、文字、及所有的人類交流方式將出現根本性變化。現在人類文明所有的東西,包括語言,包括文字,包括各種文物的東西,將來都會數字化。數字化以后,各種文明因子就變成了數字因素,加上時間的因素,就會構造一個文明的進化圖。據此是否可以算出目前是不是最優的?它中間還包含了一些其他的東西,肯定可以研究出很多東西來,這就是一個人類的文明的進展密碼破譯過程。
5) 各種智能決策支持。以前我們是決策支持系統,決策支持系統是什么呢?我提供決策的數據支持和方案,制定一串方案以供決策者選擇。而現在能夠自動決策。像AlphaGo決策完全是自動的,不用人來選擇的。
6) 信用系統的全覆蓋 。區鏈塊和AI技術的發展將最終可以使每個人的價值完全由個人信用決定,完全由算法提供保證,與任何其它人為因素無關。
7)情緒的數字化。情緒表現在你的人的肢體的語言,你的面部表情,這些都可以數字化。數字化就可以判斷你的情緒,情緒細化到什么程度,表示你這個人是一個什么情緒狀態。人和機器的關系都可以把它細化到那種程度,人與人之間的關系,通過你自己肢體的語言全部數字化以后,全部細化了以后,你可以研究出你這個人你的喜好,或者你對它的這種感覺什么的,都可以讓機器算出來,這個挺可怕的。
4. AI發展帶來的思考
情緒表達的數字化。當所有外在的知識表達都可以由機器獲得以后,自然人的情感是否可以由其外部表現(比如面部表情、姿態語言、所處環境、等等)的數字化完全表達,這成為AI的終極問題。一些數學家認為人類具有“直覺”,而計算機沒有,所以計算機永遠不可能具有人腦的能力。人工智能無論如何發展,也無法具備人類的智慧。但另外一些研究指出人類思維也是不完備的,人腦的“思考”和電腦的“運算”基本原理一致。這種相似的聯系直接導致人腦的思考也是符合哥德爾不完備定理的條件的,因此人類的思維系統也是不完備的。
電腦用電子元件的“開、閉”和電信號的傳遞,人腦則相應表現為神經原的“沖動、抑制”和化學信號的傳遞。在生活實踐中,人們是通過思考來建立對世界的客觀認識和描述的,而語言則是人們彼此交流思考結果的有力工具。對人腦而言,思維推理系統的不完備也就意味著存在不能用思維證實的題。簡而言之,現實中總有那么一些問題或者想法,我們無法用思維來證實或者否定它,從而也就無法用語言來完全準確的表達我們的思想。由于思維是客觀實在的近似反映,語言則是思維的近似表達。這就是我們“只可意會、不可言傳”背后的數學原因。
人工智能的發展將帶來人與人的關系、人與機器的關系深刻的變化,將對人類社會的發展產生巨大影響。現在人工智能已經可以在許多事情上超過人類,可以在許多工作上幫助或是取代人類,為人類造福;但是它的發展也帶來人們對AI安全和未來走向的擔憂。因此,人工智能倫理的問題已經引起學界和政府的高度關注。
這是從AlphaGo出來以后,我對人工智能的一些想法和感覺。有人說人工智能是不是開啟了什么魔鬼,打開魔鬼的瓶子,放出了什么東西來?誰知道呢?人工智能可以將人的所有的東西模仿出來,包括人的智慧、情緒,人類的表達……人工智能是未來發展的必然趨勢,但是人工智能最終將要走向哪里,是值得大家思考的問題。以上是我的一些體會,希望大家覺得有興趣的話一起研究討論。謝謝!
【討論與交流】
趙永濤(主持人):劉教授從人工智能的概念和技術,以及發展前景三個方面給大家作了精彩的報告。下面我們請大家討論。
彭德中(四川大學):人工智能現在已有廣泛應用。一個例子是核磁共振的影像資料的識別。新生兒視網膜病變是一種常見病,新生兒早產了,要放到氧艙里面,后期發育會對他的視網膜產生影響,可以通過核磁影像來識別。現在我們全省能夠做這件事的醫生并不是很多,主要集中在華西和省醫院。在很多邊遠地區,雖然有這樣的影像的設備,但是它識別不了。我們通過一個神經網絡就能夠進行影像資料的識別,能夠判別出視網膜病變。
在視頻的監測和識別方面,我們和中科院光電所合作,用神經網絡做了無人機的識別。我們用視頻實時地進行監測、跟蹤,然后判別它的類型,識別哪些地方是電池,哪些地方有故障,對故障進行定位。
在自然語言處理方面,我們做了客戶機器人,可以根據用戶的問題,判斷他的意圖,識別他的情感,然后自動生成一個回答,而不像以前進行抽取式的回答。這種應答對客戶更為友好,能夠更準確地理解用戶的意圖,取得很好的用戶體驗。
我們在人工智能解決實際問題時也遇到一些問題,最主要的就是小樣本學習。例如在無機人的探測和識別中,由于各種空管限制,無人機多次都不能飛。我們只好在大廠房里面讓無人機試飛,利用多部攝像機捕捉它的影像資料,為機器學習提供素材。
現在神經網絡被看成一個黑盒子,輸入被映射到輸出上,它是怎么進行影射的,它是怎么進行工作的,目前還有許多理論問題有待探討。AlphaGo是一種機器博弈,但是它屬于具有完備性系統的博弈,就是我可以看到對方的牌,對方的棋譜是怎么樣的。還有一種博弈,非完備信息的博弈,就像打撲克打麻將,我不知道對方手上是什么樣的牌,下什么樣的局。在這種情況下像兵器推演,像在電子空間對抗里面,很多時候都涉及非完備信息的博弈。所以目前一個主要研究對象就是針對新一代的神經網絡針對小樣本學習,非完備信息博弈。
吳 曉(西南交大):剛才劉教授已經說了,人工智能發展比較好的,第一個是自然語言處理。現在的問答機器人,其實是在智能回答。問答機器人首先需要語音識別,科大訊飛的語音識別已經做得很好了。其次是機器人的機械手臂監測等等,包括圖像和視頻,包括現在的攝像頭,這塊兒的需求非常強勁。剛才彭老師說了醫學圖像處理,包括輔助的智能醫生,還包括智能像閱讀這些,其實已經有很大發展,所以很多技術已經實用化了。
存在的主要問題,許多是數據樣本的問題。剛才彭老師也說過了,許多異常事件都是小樣本,包括監控的視頻。在深度學習的過程中,缺少樣本,就造成一系列的問題,造成了不準,出現了誤報。另外是小目標的問題。在監控視頻里面,有很多是小樣本,在監控過程中還有其他一些抖動,都可能造成我們的準確性下降的問題。
在深度學習中,還有一個科學問題是,對我輸入問題最后得出的結果,我無法判斷為什么這個結果好,為什么這個結果差,為什么我們不能解釋它,原因在哪里?人工智能還有許多問題的研究,包括圖像生成技術,原來沒有樣本,我們可以自動圖像生成。但是這個技術怎么用,能不能彌補樣本比較少的情況,我們還不清楚。
符紅光(電子科大):在座很多都是我的老領導。最近幾年,我跟張景中院士研發高考機器人。當前這次人工智能的浪潮主要是靠數據推動,算法推動。整個世界本質是數,數據的重要性是基本的,只要你有數據你就會有發展前景。中國和美國人工智能的優勢在于數據和計算能力,兩國都很強。但我們的計算能力的芯片還是用國外的,我們目前的算法還有差距。這次人工智能浪潮主要靠數據和算力推動,機器實際上沒有懂意思。下一步競爭的制高點在認知智能,像人一樣學會學習,要學會邏輯推理,不僅僅是模擬。現在的神經網絡還是模擬,但是已經取得非常不錯的效果了。
顛覆性技術不得了,顛覆性技術一出來,以前都不用了。深度學習就是顛覆性技術。以前我們的翻譯做了很多,現在深度學習用上后,以前做的都沒用了。普通一個大學生都可以做以前非常難的事情。張院士我們團隊一直在堅持做認知智能,我們做的高考機器人,讓機器參加高考,這幾年成績都是在100多分左右。語文文字表達,叫機器人寫作文,由人類來判斷。我相信未來競爭還是數據,是0和1,不僅僅再做一個AlphaGo,沒意義,我們要在認知智能方面取得突破,首先得突破自然語言。所以有句話叫做“得自然語言者得天下”,誰把自然語言徹底解決了,人工智能就控制住了。
另外劉老師也說得非常好,用AlphaGo預測3D結構。最近我們跟華西重點實驗室合作,把深度學習用在基因編輯上,基因優化是基因編輯中的一步,國外有很多在做,包括一些頂級公司。他們以前都是用規則做的,這次用深度學習做,數據一比試,一下就超過了他們。還有化學反應,大家知道的很難的,比方給一個化學物質你怎么做它的反應,新藥怎么設計出來做出來,上海的一家公司就是為全球做小分子的生成的,外包,是個大工廠。現在我們有深度學習,機器就可以在很短時間內給你找幾十條合成路線,專家判斷,準確率已經超過人類專家。人類專家都是行內的專家了,至少是博士以上水平。我們的系統現在已經能達到博士水平,隨著數據越來越多,還能進一步提高,因為剩下就是數據問題。我們國家在數據方面積累不夠,我非常擔心,如果人家真的把數據庫一卡,我們就無法工作了。我們國家要抓緊數據建設,數據太重要了,有數據你就好辦事了。
王 鵬(西南民族大學):劉教授是我們的老前輩了,今天我聽了劉教授的報告,使我非常感動的是他在退休以后還關注著學科的前沿,他在報告里回顧了人工智能的發展歷史,對現在的各個熱點也進行了展望。我有一個問題想請教一下劉教授。我以前是學物理的,剛才劉教授談到了優化算法,我們整個團隊正在研究優化算法,我們的研究思路是想用以前我們發現的優化算法模型來做,雖然說取得了一些成果,但是我們對這個方向是不是今后能夠長期發展,能不能走到一定的高度,我們還有一點點沒數。希望劉教授站在戰略的高度幫我們把關。
劉紹中:優化算法現在是把問題數據化以后全部是試,看這種算法對不對,不是說給一個概率。原則上是這個概念吧。
王 鵬:量子計算要用概率,用波函數來優化它的算法。
劉教授:整個算法是數字化以后,我找來一個方向,然后計算可能成功的方向,是這樣的吧。效果怎么樣不敢說。
桂文莊:還是基于物理的規律。純粹用神經網絡,拋掉了物理規律恐怕不行。
王 鵬:非常感謝劉教授。
朱學增:人工智能技術,現在有個趨勢是集成。有很多方法,現在都用來研究針對一個問題,現在一個主要的思維是集成的思維。我就想問在座的各位專家,你們有的是專注于針對一個對象用人工智能技術。能不能說人工智能發展到今天已經不是單一的東西,是長遠的去開發人的腦力,需要各種人工智能的集成,不是單一,靠單一去帶動不行。對不對?
符紅光:人工智能有通用人工智能,通用人工智能很遙遠,我覺得集成是可以的。比方說符號學派,現在是連接主義,還有控制學,現在做機器人的都是控制學派,人工智能是反饋,現在就是集成的問題。但是不能要求太高,現在人工智能離通用人工智能還很遙遠,都是端對端的,沒有真正理解。對話機器人,能讓它回答你的話,但是它并沒有理解你的話的意思,而是純粹從概率的角度找了一個最匹配你的話,不管你的感受和情感,但是可以通過上下文找到概率最大的結果,所以本質是數據。從應用的角度,比方說翻譯機器,涉及到硬件,速度問題,芯片,人工智能計算能力要起來,另外還有很多是邏輯問題。一是深度學習要用,二是傳統的規則,傳統的圖像也可以用,不是說你有了一個深度學習,就像AlphaGo就可以解決很多的問題,AlphaGo解決的問題是邊界清晰問題,對邊界不清晰的問題,對那些信息非常不對稱的,常識的問題,道理非常難的問題,還是沒辦法。
朱學增:“批量”提高效益,“定制”適應個性,“批量定制”這種生產模式我認為是不管對任何行業都是一個發展趨勢。教學也是這樣,個性化教育。我想問,人工智能的技術,哪一項能解決“批量定制”?在國外叫組裝器,實際上就是講的平臺,我搞一個平臺,搞一個開發環境,站在這個開發平臺上有一個環境,提供各種數據包和格式,達到的目的不外乎就是功能的集成,數據的集成,過程的集成。任何事情都是這樣,不是講的兩個空間狀態,有一些操作,一個狀態經過一個操作就變了。不是這么簡單,比如說網絡化,互聯網時代的網絡,框架早就有了,僅僅是圖譜的概念。美國就不講,就講組裝器。我們國內有沒有人搞組裝器呢?包括我們的電子科大、川大,你們對組裝感不感興趣,組裝就是集成的概念,裝備的概念。既然一談組裝,談集成,談裝備,就必然有拆分,就必然有模塊,必然是模塊化的,必然涉及到系統工程。
符紅光:已經開始模塊化了。
左 齊:劉教授講了很多好的方向,我從應用工作者的角度來補充一下。第一個是關于情感。我覺得現在人工智能在情感研究上面,大家非常關注的是人在情緒上的反應或者說視覺的反應;另一方面,我們很關心輿情里面所包含的情感。我覺得現在自然語言識別里面也是包含兩個部分,一個是語音識別,還有一個情感識別。這個輿情到底是正面輿情還是負面輿情?從一段文字里面能不能反應游客的評價?我是搞旅游的,游客的評價到底是好的評價還是差的評價?實際上不是簡單根據語音就能夠識別,需要通過一些自學習或者一些規則的提取,然后建立新的規則對這個做出一個判斷。我覺得這是一個方向。
第二個說到醫學,醫學里面,我知道加拿大這塊兒做得很好,但是他們的電子數據積累了幾十年的經驗。我非常贊成符教授剛才說的,現在的人工智能是建立在大數據的基礎上的。我們國家最重要的問題就是大數據的基礎建設。到現在為止,有的地方花了很多錢,實際上并不知道大數據是什么,他們要求數據展示出來的界面,做幾個大屏就是大數據,他不知道數據本身。因為沒有數據基礎,我們現在在醫學人工智能上面,不管是臨床還是治療,現在要做的難度其實非常大。我覺得現在有一個方向,特別適合于機器深度學習去做,就是康復訓練。界于治療和常規健身之間的,又要專業性,又要輔助,是一個長期的過程。很多病人偏癱以后在家康復訓練,沒有專業支持,我覺得這件事特別適合于人工智能的研究。這個方面我們現也非常關注,因為我們現在做大健康,特別是今后老齡化時代,這種康復訓練的需求會越來越大。
第三,我們進入5G時代以后,交通還是一個核心問題。現在景區里面最大的一個問題就是交通和出行。我們在景區上面的智能化投入非常大,但是應用的效果非常差,可以說基本上沒有發揮作用,花了非常多的冤枉錢。我們去過很多景區,景區里面最大的關注點,一定要看它的痛點,基本上每個景區的交通都是一個問題,但是感覺好像束手無策。我感覺傳統技術做不到,一定要有新技術。這里面我認為交通的引導很重要,這是人工智能能夠發揮很大作用的地方。到現在為止,我們所有的交通引導系統都是基于高德、百度,基于大數據做的,實際上計算出來的結果,實時性很差,準確度還不很高。這就是我們迫切的需求。我就補充這三點。
張文敬:我是搞科普的。比如像前不久的《流浪地球》,制作非常恢弘,中國科普科幻的大家們思維非常巧妙,他們的內容試圖用很多智能東西。劉教授講的AlphaGo,對我的啟發非常深。我們四川未來準備打造科幻科普大省,準備在新機場附近建立一個具有國際影響力的科幻城。但是目前就我所知道的科普科幻,有很多東西屬于魔幻。科幻應該是用科學的東西,用文學的東西寫未來的東西,但是我們寫的是未來達不到的東西,容易把我們年輕一代引向一些歧途。盡管《流浪地球》票房達到驚人的高度,但是里面的科學不是我們未來所預期的。這里引出一個問題,希望有機會請劉教授團隊,還有今天到會的川大、科大等專家,有機會能夠為我們四川打造科幻城做些貢獻,把中國的科幻和未來的科學結合起來,而不是魔幻的東西。
李榮佳:我提一點建議。我更關心人工智能技術的應用前景和實際應用的案例,比如剛才川大老師提到的,現在的疾病診斷,還有剛才那位說到的現在的些實際應用方面的成效,還有張文靜老師提高的信息化的應用。作為學術方面的討論交流以外,我覺得今后是不是在沙龍內容里面可以注入一些實際應用和應用前景的討論,以及實際應用反過來對我們人工智能技術的推動。
姚漢民:大家都在搞研究。應用前景在哪兒?現在主攻什么樣的目標?這些事情是應該探討的。現在大家看到人工智能正在進入家庭,各種家庭電器包括電視、洗衣機,都可以有人工智能,這個應用前景是相當大的。各研究所也好,大學、企業也好,肯定是做了很多工作。但是現在要把它深化,要高端化。比如我們光電所,那么復雜的光學技術,光刻機,也有很多人工智能技術,但是現在把它提高,要深化。所以我昨天參加了光電所新班子的講話,光電技術,光電所今后如何向人工智能發展,創新發展,我覺得現在所長有思路,我很支持這個事情。
朱學增:這種沙龍的形式非常好,希望以后形式要多樣化,專業性一定要強,要同行在一起才講得起來。所以我希望以后我們建立一些聯系,有企業的公司,有研究所的人,大家一起討論。我可以介紹一下斯坦福的企業跟學校的情況,他們的企業跟學校相當緊密,有時企業就提出了很好的意見。所以我希望院里面組織沙龍形式要多樣化,專業性一定要強,我們只要一杯咖啡和一個房間,就談起來了,越談越有勁。
鐘 勇:第一次參加科學院科技沙龍,我談幾點感受:
第一,沙龍體現了我們科學院和科學家的精神,在座的很多科學家不在崗位以后,還在科技領域發揮了重要作用。
第二,我覺得這種沙龍還是非常重要,因為對我們的年輕人和中年人還是有很好現實指導意義。從2017年國家發布人工智能發展規劃以后,到今年中國政府工作報告,又把智能+作為重要內容,打造數據經濟。我認為這種情況下人工智能已在國家、地方層面全面地爆發,從這個角度上講我們每個人都離不開。今天的沙龍就有許多別的領域的老教授在場,說明與我們每個人都相關。
今天劉教授的報告做得非常精彩,從AlphaGo這個案例出發,對整個人工智能的相關技術,包括大數據、神經網絡、以及深度學習等等做了比較系統的介紹。我覺得非常好。當然從我的認識角度,我也從自己的認識談點看法。
人工智能發展到現在,新一代人工智能已經不太一樣了。人工智能發展到現在有幾十年歷史了,為什么現在引起大家這樣的關注,我想有幾個原因:一是是思維模式變了,以前科學研究最多的是機械思維的模式,現在的新模式是數據模式或者大數據思維模式,從數據中發現一些客觀規律,包括用數據來表示確定性,用數據關系表示因果關系。現在是用數據來說話,或者用數據發現新知識規律。二是相關技術發生了巨大變化,這里面包括三個方面技術:一個是算力,第二個是算法,第三個是大數據。AlphaGo只是一個引爆點,我認為是這么一個概念,詳細的不談了。從人工智能發展的角度看,人工智能不是一個點,它的范圍越來越大,而且是多科學的融合,我覺得這是一個發展趨勢。神經網絡已經發明很久了,深度學習出現以后,許多事情,包括圖像識別的確達到了非常好的效果。例如說人民幣識別,用深度學習以后準確率提高了一個級別。這個過程如何理解,實際上就是大數據處理的思維問題。現在人工智能發展已經深入到我們國家社會生活的方方面面,而且產生了一種融合的效果。剛才朱老師談到一個很關鍵的問題,集成,我認為實際上是融合。比如說現在工業互聯網,不只是單純的軟件,傳感等問題,而是多種技術的融合。現在互聯網向邊緣計算和云計算發展,人工智能、物聯網和大數據、智能、理解等等融合以后,就可以解決我們現實生活中存在一些比較大的問題。比如說自動駕駛,現在5G出現了,以后到了6G,自動駕駛就可能廣泛應用。比如說,我不會駕車,想到南京去,我小孩又不能陪我,我可以自己駕駛過去。半自動可以完全實現,比如說我小孩在辦公室或者家里就可以把那部車開到南京去。傳輸加快了,我們在車上看到是完全一致的,沒有延時,包括醫療和健康,包括辦公,家用電器,都有非常好的應用前景。所以人工智能的發展一定對全人類有巨大貢獻。
最后,感謝老教授對智能開發、社會服務等等方面的努力,你們的精神值得我們中年或年輕一代學習。謝謝你們!祝你們身體健康!小孩在辦公室或者家里就可以把那部車開到南京去。傳輸加快了,我們在車上看到是完全一致的,沒有延時,包括醫療和健康,包括辦公,家用電器,都有非常好的應用前景。所以人工智能的發展一定對全人類有巨大貢獻。
劉紹中:大家對我報告給了很高的評價,我是關心這個事情,到底不是直接在一線工作,所以肯定很多地方顯得很膚淺。在座的專家在第一線工作,考慮問題很深,接觸到很深的東西,我也很有啟發。謝謝大家!
翟占一:今天的沙龍是一次很好的學習機會,很受益。我也談點體會。
現在人工智能進入了尋常百姓家,觸手可即,我覺得現在已經進入到人工智能的時代,這也是我們科學技術發展到一定時期的一個產物。人工智能是一種集成技術。過去廣泛應用于軍事、醫藥,還有科學,現在更多是造福人類,服務我們尋常的百姓。比如說,最近巴黎圣母院發生了火災,我注意一個細節,火撲滅以后,三分之二都已經燒毀了,但是中樓還保存好了。其中是用了兩個機器人,到大樓中間去進行噴灑消滅液,因為人進不去的,也不容易從空中澆水,這樣容易破壞文物。
人工智能是造福人類的東西。這里我作為一個消費者提一個建議,我覺得現在人工智能的一些產品接地氣不夠。我們現在人工智能要說多高端,航母、大飛機、衛星上天都需要它;但是生活中小產品,有一些不接地氣,我家里買了個掃地機器人,原來的一款很復雜,除了掃地、吸附灰塵,還可以拖地,但是價格高,不太方便,老年人不會用。后來買的一臺機器人很方便,5公分高,可以到你的床下面去掃,但是用了一年就壞了。我最近買了一臺,專門去找,我就說要最簡單的,就掃地,不要遙控板,不要自動充電,結果幾百塊,我現在一直用得很好。以前遙控的老人根本不會用,拖地現在還不現實,吸附灰塵很好,吸滿了打開蓋沖一沖就好。我們的人工智能還是要根據不同消費群體去做,因為中國人口太多了,農村很大的消費市場。我原來地方工作有一家搞洗衣機的廠,它的產品很好,就是瞄準了低端市場農村,簡單,能洗干凈,而且當時還不是現在觸摸式的開關,是按紐,開關就是下面的要粗一些,用2萬次就行了,但它用10萬次都沒問題。所以我覺得還是要接地氣,要考慮怎么樣服務家庭。當然也要服務我們尖端的科學,但是我們更多的是要搞一些服務大眾的,這樣我們人工智能技術才能更好地服務社會,更好發揮它的作用。我做過一些調查,我們的大專院校專利很多,但是真正轉化的可能不到三分之二,要做好轉化這篇文章。我希望我們的科學家能夠更多地利用自己的知識去造福社會,去對接社會,讓人工智能更多進入我們的尋常百姓家。
桂文莊:今天到這兒來確實學了很多東西,劉教授講得很深刻。今天來還有一點,使我非常感動,我見了很多老同志,特別是我們的張禮堂老所長,今年已經85歲高齡了,仍然積極參加我們的沙龍。我在這兒談談感想吧。
劉教授從AlphaGo開始談,AlphaGo一出來,全世界轟動,我們中國也是非常轟動。我記得最清楚的是什么呢?有人提出來是不是人工智能快要發展到奇點了?到奇點后,機器人可能會超過人類,不受人類控制,最后把人類消滅了。這個問題帶來了人工智能發展會毀滅人類這樣一個危險前景,各方面議論很多。這些議論對我們搞人工智能的人來說,第一是這個東西不大現實,因為現在的人工智能和真正人的智能還是有差別。有一些東西它是行的,比方說是由于它可以用非常快速的計算,所以在一些模型之下進行決策判斷或者搜索可能比人快很多。但是人還是很特別的,人的智能有些時候是一種頓悟,目前人工智能還沒有辦法解釋和處理。人有一些依靠靈感的事情,人工智能恐怕也很難實現。現在人工智能還不能像人的大腦一樣去思考,因為人類還沒有明白人的大腦是怎么思考的,你怎么能說人工智能像人一樣呢?但是人工智能處理一些事情確實比大腦快。飛機是人學鳥的發明,我們知道鳥的飛行是撲翼,翅膀搧著飛,但是速度比我們飛機差遠了。人工智能在某些方面能夠超過人,包括下圍棋,但是不是全面。所以我認為,在某些點上它會比人強,會有很多發展和應用的前景,會給人帶來非常重大的應用,成為人的智能的延伸和補充沒有問題。
今天討論的主題,大家非常關心,是社會熱點,同時大家都知道現在人工智能已經上升到國家戰略,已經成為世界上先進國家之間競爭的一個制高點了。過去咱們提互聯網+,現在咱們講人工智能+,就是說人工智能要應用到各種各樣的領域去,促使我們各種各樣的處理模式發生顛覆性的變革,使得我們能夠在各種領域里面上一個新層次。我覺得人工智能的重要性在這兒。所以我們今天討論的內容既有戰略意義又有社會意義。
另外,人工智能還是正在發展中,不是像人腦那樣,因為對腦的理解現在還早著呢。人的大腦復雜程度非常不得了。有人形容人的大腦像一個宇宙,里面的東西太多,現在能理解和知道的東西還是非常少。人工智能的發展空間非常大。人工智能在某些方面的發展,比方說深度學習的帶來的進步,大家都知道,深度學習有非常好的應用,而且產生新的效果。但是將來會不會有新的模式發現呢,會不會有新的算法出現呢?剛才有專家講,我們國家在數據處理方面做得比較好,但是在算法方面還是有差距。我覺得這兩個方面都不可偏廢。為什么深度學習這樣的先進算法在中國沒有出現,這是值得我們科技人員深思的問題。我們現在要講創新驅動發展,講自主創新的能力,那就要看我們在對人類的知識進步中,我們中國人到底有多少貢獻?我們可以很自豪地講我們古代中國人的貢獻很多,但是在近代,只要一看教科書,有幾樣東西是我們中國人的?這是我們未來科技界未來發展非常重要的目標。
人工智能怎么發展?一方面我們知道了人工智能還有很多很多的問題沒有解決,還有很多很多的發展空間,還有很多很多的前沿的事情,今天劉教授談了很多。但是另一方面人工智能應用會帶來非常多的應用,自動駕駛是一個,還有很多的應用出來。想想國家的戰略,我們怎么做?科學院怎么做?剛才有兩位老師都提到了要我們科技人員加強人工智能在應用領域的工作,我覺得兩方面不可偏廢:一方面,我們要把很大的力量放在人工智能的應用上去,解決我們很多現在沒有解決的問題;同時,至少要有一部分人一定要在前沿工作,進行理論和方法的研究和創新,我們中國人將來一定要給世界知識寶庫貢獻我們獨特的東西,這個不搞研究不行,兩方面不可偏廢。最近國家在科研基礎研究方面也制定了發展規劃,我覺得在這個時候提出來非常正確,我們已經在經濟上達到世界的第二位,我們做很多方面都變成世界第一了,但是我們在知識創新上,在原創技術創新上還是很少,雖然我們已經有很大進步。基礎研究是發展原創技術的源泉,國家在這個時候提出加強基礎研究,我覺得是非常適當的。
人工智能現在發展起來了,也是一個社會熱點,同時也成為某些商業炒作的賣點,什么都是“智能”的,包括配鑰匙的也是智能配鑰匙。還有納米、量子,都成了商業炒作的內容,什么納米水、量子水,等等,打上這個符號以后就好賣東西了。這說明我們需要對人工智能進行更加廣泛和深度的宣傳,好好搞科普。張老師提出科普的問題,我贊成人工智能是非常好的科普的題目。還有些科幻故事非常玄妙,像張老師說的可能會誤導。我們要用真用科學的東西來引導青年,所以科普工作非常重要。我們老科協的一個重要的任務就是做好科普。所以在這方面,我們希望我們的分院的老同志,特別是計算所的老同志,能夠在人工智能科普方面做出我們應有的貢獻。
另外,大家還談到了一些非常重要的事情。比方說加強人工智能研究應用的基礎設施建設,就是數據庫的問題。我們國家的數據庫,實際上已經搞很多年了,科學院搞數據庫40年,我們現在的數據庫也不少了,但是在有些領域里面數據庫還是非常薄弱的。國家科技部有專門的項目支持科技基礎設施建設,其中也有科學數據庫,包括醫療大數據。但是這些東西都需要很大的努力來發展,而且需要數據保密、數據共享等等這些數據應用的政策和法規。其實現在數據應用有很多問題,就是因為在數據共享、數據保密、數據產權等問題上產生的,隱私的問題也是一大問題。所以怎樣發展數據還是一個比較大的事情,但是無論如何數據確確實實是我們將來人工智能發展的一個非常重要的基礎設施。
今天的沙龍非常好,大家討論很熱烈,時間好像不是太夠,希望下去以后能夠繼續交流。我贊成除由分院直接組織的沙龍以外,我們分院各研究所可以組織一些小型的專題化的沙龍,解決一些大家特別感興趣的問題。像今天這樣規模的沙龍很難深入進行專業討論,但是大家可以談很多想法,可以碰撞新的火花,可以為我們國家為我們院提出想法和建議。今天沙龍題目大了一點,核心問題不是新的應用和研究,而是宏觀了解人工智能技術,討論它應該怎么看待和發展,我覺得今天沙龍的目的達到了。
主持人:今天我們的沙龍討論會就這里結束,感謝我們省里和院里各位領導和專家,我們今天沙龍開展比較圓滿和成功。會議到此結束,謝謝!