跳到主要內容區

 

UFO計畫

 

2020.03.21「AI與社會」工作坊:人工智慧與大腦模擬:過去,展望及影響

最後更新日期 : 2020-10-15

「AI與社會」工作坊
人工智慧與大腦模擬:過去,展望及影響

主持:黃于玲 助理教授
主講:陳建中 特聘教授

大腦是人類與外界溝通的核心,模擬大腦的目的是要讓機器具備大腦的功能,換言之就是要製作出人類的心智能力(human intelligence)。從電腦問世前就有人問:「機器是否可以模擬人類的智能反應?」萬國商業機器集團(International Business Machines Corporation,簡稱 IBM)的深藍電腦在 1999 年擊敗西洋棋的世界冠軍而震驚世界。世人熱議:「人工智慧這麼厲害,它還能做什麼?」,2005年開始的 blue brain project 就是後深藍電腦的發展,由瑞士科學家 Henry Markram 領軍,該團隊認為:電腦可以打敗世界棋王,代表已有足夠的計算能量,可以模擬大腦功能。大腦模擬是要從生物現實(biologically realism)的條件下 ,模擬整個神經運作過程——模擬神經細胞,還有神經之間的連結,訊號傳遞(釋放化學物質),再往前建立神經運作的基本單位皮層柱(hypercolumn)。2008年時,研究團隊已成功模擬老鼠的細胞模式,可模擬的神經數已臻至老鼠的大腦,這結果令人驚豔、也讓美國緊張,導致美國政府於Obama時代挹注六百億美金從事大腦研究,讓這幾年美國的神經科學突飛猛進。歐洲團隊預計在2023年完成人類的細胞模式,然而這階段僅是把很多神經連結在一起,還未考慮神經反應以及大腦行為,屆時是希望電腦的計算能力已能去模擬每個神經。


那時候距離人工智慧控制世界的劇情還太早。人文社會科學是研究人類行為、思考及互動的領域,研究這一切是因爲不清楚大腦在想什麼,若可以模擬每個神經,憑藉夠快的電腦,就可以模擬任何人類行為,進而是人際互動,那還需要神經科學或社會科學嗎?人工智慧對於學科的震撼來自如此,近幾年的研究成果已經開始對神經科學有重大影響,對於人文社會科學的影響還要再觀察幾年。


大腦是地表上最強的智能系統。在二次大戰前就有以模擬神經運作的方式,來改善機器的演算法,1946 年發表的Hebbian rule是個里程碑,還有 1978 年提出的Rule Based AI,就是現在決策樹發展的原理,發明者Herbert Simon還因此拿到1978年的諾貝爾經濟學獎。接近當代模樣的 AI 是來自1980年代的平行分散處理模式( parallel distributed processing model),或稱為神經網路的方法,都是用 AI 來模擬人類智慧的成果。


討論人工智慧、不免就會談到機器學習,顧名思義是要機器學東西,所以要先釐清什麼是「學習」。科學上研究學習一事,可以回溯到心理學家Pavlov的古典制約(classical conditioning)實驗,他在研究實驗犬的唾液分泌量時發現:進食前牠的唾液分泌量就有顯著增加,乃是因送餐前的訊號——鈴聲所致。
鈴聲原本與食物無關,但每次食物都隨著鈴聲而來,實驗犬就把鈴聲與食物在腦中做出連結,這就是古典制約。

簡言之,把事情兩兩配對,就是一種學習;反之、人在制約狗,狗也在制約人——實驗犬進食時,研究者就開始記錄,這也是一種連結,不同的是:研究者的動作是主觀介入,此種連結稱為運作式的制約(operant conditioning)。另一種實驗:只要按下開關,就會有食物掉下來。動物會理解到行動與回饋之間的關係。這兩個實驗不太一樣,然而什麼是學習?把不同物體之間的連結在腦中建立起來,就是學習。


「如果兩神經時常一起反應,這兩神經之間的連結會逐漸增強。」加拿大神經科學家 D. O. Hebb 這樣回答制約的邏輯,而他所建立的 Hebbian rule 除了是神經科學常使用的法則,現在大部分神經網絡或人工智慧的學習演算法,都是以它為基礎發展——兩現象時常一起出現時,它們之間的連結 (connection)會增強。

決策樹,最常用於決策系統的 rule based AI,係由史丹佛大學心理系的Herbert Simon團隊所創建。他們發現「依照條件採取活動」是人類的決策方式,若能清楚所有可能性,機器也能做出適當選擇,協助人類決策行為。這是現在最常見也應用面最廣的 AI ,許多客戶服務專線就是如此。在媒體上曝光最多次的實體 rule based AI 是由日本國際電氣通信基礎技術研究所的黑石浩教授、其所發明的聊天機器人 Erica;Erica 會觀察眼神、分析話語、進而判斷如何回應。siri 或 ok google 也是這類產品,依照訊息模擬人類的互動過程。


神經網絡不是在模擬神經,而是利用神經連結的概念,其過程為:一、以節點模擬神經元;二、每個神經元都會從其他神經元獲得訊號;三、神經元把接收到的訊息綜合處理後,輸出訊號送給後續的神經元。稱為平行處理模式的神經網絡就是在處理這些事情——神經元把訊息層層轉送,最終導致行動。兩兩之間連結的強弱、與刺激有關的神經元、反應時間等,由這些條件構成神經網絡的平行處理模式。


平行分散處理模式在1980至1990年代有很大的影響,也受到許多哲學家、心理學家或神經科學家的批評。討論過程中都會談到連接指令(connectionism):所有東西都是神經系統連結所造成,神經反應本身不是那麼重要,常見的神經網路研究就是這樣想:不管神經特性,只要連結建立好,什麼都可以訓練,重點是神經之間的連結,這就是連接指令的傳統。


另個傳統是來自電腦科學,有關巨量神經科學的演算法。巨量神經科學重視系統如何使物件運作(如圖靈機 turing machine),會根據規則來決定接到訊息後的下一步該怎麼做,這跟前面說的 rule based AI 有些不同:rule based AI 是利用現在對神經科學的知識去建立機制,所以該機制會考慮神經運作模式,不同神經類型所導致的運作方式不同,不同時期或不同區域的大腦運作方式也會不同,要理解上述種種關係才會讓運作模式正確。對電腦科學的人而言,重視的是符號處理(symbolic processing):訊號的進入是觸發點,進而轉化成內在表徵( internal representation,一個物件在系統中的樣子),系統再透過自己的邏輯理解物件,這就是符號處理的過程。從輸入變成內在表徵,再轉成行動或決策,這一步步運算都要很清楚,所以仍重視神經科學的研究。


連結主義與計量主義這兩個取徑很不一樣。電腦科學/計量主義是要接近大腦真正的結構,所以很重視大腦模擬,從而發展出智能;平行處理模式/連結主義不太在乎此道,只注重連結,因為什麼都可以計算,傾向於模擬神經元的運作,而不是神經系統的運作(預設每個神經都是相同),任何模樣皆可後天訓練。對於社會科學的人而言,就是先天論與後天論的差別,不過現在談的東西都是機器。


研究的重點也不同。電腦科學/計量主義很重視符號,以及訊息如何轉化成內在表徵、如何運算等,因為大腦各區域因應不同功能或任務而會有不同的運作方式,還是盡量模擬人類大腦運作;平行分散模式/連結主義著重在怎麼從環境中學習該做的事情,重點是學習而非結構,什麼都可以訓練,所有運算都相同。


從視覺系統談大腦功能。眼睛上有感光細胞,光線經過上視丘,最後到達大腦;大腦與我們所看到的東西,在早期視界是一對一的關係,從圖例來說,ABC 三個點是不同位置,投射到大腦裡就是不同位置,大腦每個神經所負責的區域都不同,都是一對一關係;每個感光細胞都只會看到一點光,只有看到物體的一小部分。 簡言之,細胞接收另一細胞訊息的過程是一種疊積(convolution,又稱卷積、褶積或旋積)狀態。面對線性系統,可用一個點測試其反應,透過輸入的刺激以及其疊積狀態,就可以預測系統對其他刺激的反應。延續視覺的例子。由於偵測到的亮度不同,大腦對於圖像的理解也會有差異,這就是接受域(receptive field)疊積後成像的結果。多個視神經偵測同個邊界,因為光感應所造成相異或相反的結果;基本而言,視神經細胞對線條的反應比邊界強烈,若感知到水平線有變化,大腦中的垂直線也會跟著變動。


每個神經系統都有自個對幾何特徵敏感的項目,但各神經系統能理解的部分都不同,只看到一部分的訊息、不完整的圖像,例如對水平方向敏感的神經,對於橫線條會有強烈反應,但它會完全看不到直線;換言之,對於水平方向敏感的神經,它會完全看不到垂直方向的訊息。物體的每個位置都有專屬的神經做加速反應,再層層傳遞訊息到大腦,組裝成完整圖像,這就是階序性運作模式(hierarchical processing)。換言之,所有的物件在視覺上都可以拆解,如人體,手臂,手掌,手指等圓柱辨識的過程,再從各種圓柱形組裝回原形;另一派認為、大腦沒這麼複雜,它只負責辨識一些基本形狀,點-圈-線段-曲線-形狀-物體,任何物體都是這些形狀的排列組合。


進一步說、人體中總會找到專屬神經對特定物件作反應,這就是所謂的祖母細胞(grandma cell)。有人取笑:若這細胞死掉,人就無法認得自己的祖母;且世界上的事物何其多,難道每事每物都要準備一個細胞?階序性運作模式這樣的核心概念,讓許多心理學家不以為然,但晚近有找到祖母細胞,就是對特殊物品特別有反應的細胞。


視神經辨識圖像的三個關鍵為:一、每個細胞都有接收域;二、每個細胞接受到前個細胞訊息的疊積反應;三、細胞接收訊息後,產生更加複雜訊息並送到下一層的階序性運作模式。

Riesenhuber與Poggio在1999年就用前述的概念發展出Hmax模式:當圖像印入眼簾時,點結合成線,線條組織成輪廓,之後愈趨複雜。在當時頗受好評,然而深度學習在2012年橫空出世,發現它很大部分是在做影像處理,分辨影像元素的篩選機制完全可以訓練,而人類大腦的基因也可說是幾百萬年訓練而成。考量大腦運作模式,發現腦部各區域的階序與疊積過程有高度相關,這使得大腦與 AI 兩者的感知特徵非常相似。


大腦是個非常有效率的系統,深度學習以神經網絡模式去認識環境,也是要用較佳的訊息處理能力,這樣的特質條件使得兩者的感知模式有趨同的現象,深度學習經過訓練後、竟然與百萬年進化的基因處理方式相近,如此我們才肯定深度學習可以輔助理解大腦的模擬。又至今談到的兩個取徑,大腦模擬就是按照神經科學的規則,模擬每個細胞並模擬大腦反應;平行處理模式/連結主義,則只在意首要規則。這兩個不同取徑卻得到相似的結果。

是否要建立彷彿人類的AI?我們能否做到又該如何做?這三個議題是現階段該討論的AI發展議題。就第一個問題而言,有些人希望如此,例如對長照機器人的期待;深度學習方法長期忽略神經科學理論卻還是可以發展地很好,例如影像辨識在2014年就可以超越人類,但是對於神經科學學界來說,深度學習還不是解方,要在圖像辨識表現地比人類好,除了AI、黑猩猩亦可,這已獲得實驗證實。


人腦有效地與環境互動,不只是現在,也要在未來的環境如此。換言之、大腦具備高效率且高適應性,能快速觀察到環境變化。AI在這部分無疑是遜於人類,所以人類智能與人工智能在這裡就有明顯差異;人類的高效適應性是為了生存,現今的AI研究較少談到適應能力——透過訓練就可以成為健全的AI,但是換個環境就必須要重新訓練。


如果人類無法辨識與自己互動的對象是真人或AI(如turing test)時,是否就可以宣稱電腦有智能?雖然這樣的電腦可以騙過人類,似乎是好現象,但這其實是過度優化的結果,反而騙不過人類,因為人類會有誤差與錯覺等的判斷失誤,而AI會忽略,導致它沒有人類的常態。


就科技發展而言,近似人類的AI有望可以做到,透過有效的訓練與學習,過去機器人被視為冷冰冰的形象,將由有效的互動反應奪回人類好感;再來,大腦基於幾百萬年的演化,對於例外的掌握及環境的變化有一套方便的捷思法(heuristics),好讓其效能更強,這也是機器學習不斷向大腦求教的主因,副作用會是重蹈人類的覆轍。對社會科學研究而言,人類常採取最簡單也最有合宜的方式去做事,造成對於許多事物有刻板印象,而不去深究細節,這是人類的慣習,對電腦來說就是立基在先驗機率。如果似人AI存在的話,我們就必須要面對這樣的問題——人類的偏見,AI也會有。


綜合討論


提問:人類大腦的運作就是一種深度學習的過程?

回答:大腦的運作跟深度學習很類似,所以「是否要AI模仿大腦」、「是否要有一個類人的AI」這種爭論才會持續不斷;圖靈機就是模仿大腦的一個里程碑。

提問:一個與人類相似的機器人,只要溝通過後,人們就能夠分辨。因為它的特徵與長處,會明顯與人類不同?

回答:現在有許多用於語音服務的聊天機器人,還有像Erica這樣的高階機器人,閒話家常時人們會無法分辨,但若討論艱澀或超乎常理的話題時,會陷入「無法理解」的跳針狀態,因為它的腦袋中沒有那些資料。許多富含社會脈絡意義的語句,它也會無法應對。

提問:關於祖母細胞,是說對於一個事物、大腦有特定神經細胞對其編碼,但又以視覺來說,每個物件從不同角度觀察而有各種成像,終究還是可以正確辨識並理解事物,這兩者概念是否有所衝突?

回答:沒有衝突,就是祖母細胞的概念。這細胞是對一個物件編碼,而非影像;當影像愈趨複雜時,負責不同角度的細胞就會有所分配,持續處理訊息,所以祖母細胞其實是以全觀角度在看,無論什麼角度她都是祖母——她的臉、戴面具、叫名字等,都會認知到同一個人,這細胞就是為了辨識她而存在,也是前面談的階序性運作模式,許多不同角度綜合後成為具體的再現,再連結概念,整個過程即是祖母細胞的運作模式。


提問:前面談到許多AI是否要長得像人的各種優缺點,要滿足使用者好感又要顧及效能等;也談到、類人的AI也將帶有人類的偏見,這又回到剛才的關鍵議題:完全去除偏見的AI,是否真的比真實世界薰陶下的AI,其效果更好?又我們能對偏見的容忍程度該如何決定?

回答:若是一個駕駛飛機的機器人,我們會期待它具邏輯性、不用像人,而若是長照機器人則是要越像人越好。大腦的運算速度其實比電腦慢,效率好的原因是因捷思法,因為建立許多假設,進而造成刻板印象,這就成為兩難,特別是AI接觸到新的環境都要重新學,唯有透過先驗機率(priori probability)來達成平衡,以過往經驗來判斷應對方式,不用重新學習。若所設計的 AI 就是要採用捷思法提升效能,就很難避免刻板印象的建立。


提問:美國社會學會底下的Journal of health and social behavior,其主編在2020 年提出:該期刊將優先接受能把生物學、人類行為或心理學知識融入社會學或健康研究的論文。早期社會學較多是批判生物決定論的立場,強調後天建構論,現在由於生物學知識已大幅進展,可以把生物決定論與環境互動論兩者結合。從心理學角度出發,相較於二十年前,有什麼對於人類社會或行為的嶄新理解?

回答:二十世紀初,學界主張生物學決定行為,而後行為主義當道,認為一切可由學習而得,動物亦是;1960年代因社會動盪,環境決定論躍升成主流,無論在社會學或心理學界。近幾年由於遺傳學的發展,還有神經科學的進步,知識界的進展讓許多領域邊界愈趨模糊,如心理學之中的人格心理學,認為人類有多項特質、對立派就認為環境會使人們行為趨同,性格屬流動而非固定,接著又由行為遺傳學取代之,認為基因是人的差異來源……近期,環境心理學又逐漸回到主流地位。

總結而言,人的行為來源有幾種。一是生物系統:人類經過幾百萬年的演化,若從哺乳類追溯則是幾億年,過去祖先們的學習經驗是先天的基礎,利於往後的學習;捷思法的出現,就是因為效率很高。二是環境影響:語言學家 Noam Chomsky 說、語言學習能力為與生俱來,但語言種類為後天選擇,而環境的差異還包含社會文化。

相較其他學科,心理學重視生理機制對行為的作用,這就是神經研究重視大腦模擬的初衷:透過一個大腦來了解行為,未來期待用多個大腦來模擬團體與社會。若AI的發展讓這想法實現,對社會科學勢必有重大衝擊及改變,也必須要適應如此潮流;至今的神經模擬已對神經系統研究有重大影響,而社會科學的困難主要是影響因素太多太難掌握,若可以上述大腦模擬的方式進行,這些困難會迎刃而解。

提問:因應疫情之故,許多國家施行保持社交距離(social distancing)的措施,對人類的心理與情緒造成影響。若能事先模擬出隔離之下的心理狀態,進而是社會互動模式,或許這可以給予政策建議。

回答:台北於2003年SARS(Severe Acute Respiratory Syndrome,嚴重急性呼吸道症候群相關冠狀病毒)肆虐期間,就有些心理學家做過類似研究,這些當然有對政策的幫助,不過效益不大,因為分析結果的預測性都不夠好;神經科學對大腦的理解也是近幾年才有進展,許多神經的功能還是未知,很像30年前分子生物學對基因的探索,現在的認識都還太粗略,可說是手繪地圖與電子地圖的差別,還有一段長路要走,還要大家一起努力。

瀏覽數: