-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
人工智能模型如何建立(人工智能模型如何建立的)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于人工智能模型如何建立的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
ChatGPT國內(nèi)免費(fèi)在線使用,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁版、PC客戶端
官網(wǎng):https://ai.de1919.com
本文目錄:
一、AI生成模型:超越數(shù)據(jù)觀測與計(jì)算機(jī)模擬的第三條科學(xué)探索之路?
導(dǎo)語
最先進(jìn)的人工智能算法已經(jīng)開始在探測星系的演化、計(jì)算量子力學(xué)波函數(shù)、 探索 新的化合物等領(lǐng)域施展拳腳。那么,還有沒有那種無法自動化而只能由科學(xué)家完成的工作?
如今的物理學(xué)和天文學(xué)實(shí)驗(yàn)會產(chǎn)生海量的數(shù)據(jù),已經(jīng)沒有人或團(tuán)隊(duì)能夠跟進(jìn)所有的這些數(shù)據(jù)了。其中一些數(shù)據(jù)每天以TB級的規(guī)模增加,而且這個趨勢不會減弱。在二十一世紀(jì) 20 年代中期射電望遠(yuǎn)鏡 Square Kilometer Arra 將投入使用,它每年產(chǎn)生的數(shù)據(jù)量和整個互聯(lián)網(wǎng)的數(shù)據(jù)量一樣多。
面對數(shù)據(jù)洪流,許多科學(xué)家開始求助于人工智能。只需要少量的人工輸入,人工智能系統(tǒng)(如神經(jīng)網(wǎng)絡(luò))就能夠在數(shù)據(jù)海洋中漫游,識別異常,挖掘出人類尚未發(fā)現(xiàn)的模式。
當(dāng)然,利用計(jì)算機(jī)來輔助科學(xué)研究的 歷史 可以追溯到約 75 年前,然而人類幾千年前就在手工調(diào)查研究數(shù)據(jù)來尋找其中的有意義的模式。但是,近期一些科學(xué)家認(rèn)為以機(jī)器學(xué)習(xí)、人工智能為代表的新技術(shù)能以一種全新的模式去進(jìn)行科研工作。其中一種被稱為生成模型的方法,能從對觀測數(shù)據(jù)的諸多解釋中找到最可信的理論,更為重要的是,該方法在研究中無需預(yù)先編入對于系統(tǒng)可能起作用的物理過程。其擁護(hù)者認(rèn)為,生成模型的創(chuàng)新程度足可以被視為理解宇宙的潛在的“第三種方法”。
在傳統(tǒng)上,我們是通過 觀測 來了解自然的?;叵胍幌?,開普勒就是通過研究第谷的行星位置表,辨識潛在的行星運(yùn)行模式,才得以推斷出行星是沿橢圓軌道運(yùn)行的。同樣的,科學(xué)可通過 模擬 來獲得進(jìn)步。一位天文學(xué)家可能會模擬銀河系及其鄰近的仙女座星系的運(yùn)動,并預(yù)測它們將在幾十億年后碰撞。觀測和模擬都有助于科學(xué)家生成假設(shè),然后用進(jìn)一步的觀測來檢驗(yàn)假設(shè),而生成模型不同于這兩種方法。
瑞士聯(lián)邦理工學(xué)院的天文物理學(xué)家 Kevin Schawinski 也是一位生成模型的積極支持者。他認(rèn)為:“ 生成模型是介于觀測和模擬之間的第三種方法, 這是解決問題的另一種方式?!?/p>
Kevin Schawinski 是一名天體物理學(xué)家,他經(jīng)營著一家名為 Modulos 的人工智能公司,他認(rèn)為一種名為生成模型的技術(shù)提供了第三種了解宇宙的方式。
一些科學(xué)家僅僅把生成模型及其它新技術(shù)當(dāng)作傳統(tǒng)科研中的工具,但是大多數(shù)研究者都認(rèn)為 AI 的影響力巨大,并且在科學(xué)研究領(lǐng)域會發(fā)揮越來越大的作用。費(fèi)米國家加速器實(shí)驗(yàn)室的天體物理學(xué)家 Brian Nord 使用人工神經(jīng)網(wǎng)絡(luò)來研究宇宙。他擔(dān)心沒有什么是不能通過自動化完成的事情,“這個推測倒是有點(diǎn)令人恐慌。”
來自“生成”的 探索
從研究生畢業(yè)時起,Schawinski 就因用數(shù)據(jù)驅(qū)動科學(xué)研究而聞名。在攻讀博士學(xué)位期間,他面對的任務(wù)是,根據(jù)星系的外觀數(shù)據(jù)對數(shù)千個星系進(jìn)行分類。因?yàn)闆]有什么現(xiàn)成的軟件能幫助他完成這項(xiàng)工作,他決定用眾包的方式完成這項(xiàng)工作——于是,銀河動物園(Galaxy Zoo)公民科學(xué)項(xiàng)目誕生了。
從 2007 年開始,普通的電腦用戶只要記錄下他們推測的星系最佳歸類,就能幫助到天文學(xué)家。通過多數(shù)票勝出來判定,通常能帶來正確的分類結(jié)果。
這是一個成功的項(xiàng)目,但 Schawinski 也注意到, AI 讓這個模式過時了——今天,一個具有機(jī)器學(xué)習(xí)和云計(jì)算背景的天才科學(xué)家只需要花費(fèi)一個下午就能完成這個工作。
在 2016 年,Schawinski 把目光投向了生成模型,這個強(qiáng)大的新工具。本質(zhì)上來說,生成模型是在求解,當(dāng)給定條件 X 和觀測結(jié)果 Y 時,概率 P(X,Y) 有多大。這個方法已經(jīng)被證明是非常有效的。
生成模型中最為著名的就是生成對抗網(wǎng)絡(luò)(GAN)。經(jīng)過充分的訓(xùn)練后,GAN 模型能夠修復(fù)損壞和像素缺失的圖像,也能讓模糊的圖像變得清晰。該模型通過競爭(對抗)來學(xué)習(xí)推斷缺失的信息,這個神經(jīng)網(wǎng)絡(luò)的一部分被稱作生成模型(generator):生成虛擬的數(shù)據(jù);另一部分被稱為判別模型(discriminator):把生成出來的虛假數(shù)據(jù)和真是數(shù)據(jù)分割開來。兩個部分交替訓(xùn)練,逐步優(yōu)化(類似于博弈)。
或許,你已經(jīng)看過最近流傳甚廣的GAN生成的假面孔。正如那個標(biāo)題所言“這些人并不存在卻又真實(shí)得嚇人”。
上面看到的臉孔都不是真實(shí)的,上面的 A 列,和左側(cè)的 B 列都是由生成對抗網(wǎng)絡(luò)(GAN)使用真實(shí)的面部元素構(gòu)建的。然后,GAN 將 A 中的面部的基本特征(性別,年齡和臉形)與 B 中的面部的精細(xì)特征(頭發(fā)顏色、眼睛顏色)相結(jié)合,構(gòu)建出了上圖表格中的所有人臉圖像。
潛在空間
概括地說,生成模型獲得數(shù)據(jù)(大多數(shù)是圖像),并把他們分解成抽象的基本要素——科學(xué)家將其稱為數(shù)據(jù)的“潛在空間”。算法能控制潛在空間中的元素,以此來探究這些元素如何影響原始的數(shù)據(jù)。這個方法有助于揭示該系統(tǒng)運(yùn)作的物理過程。
潛在空間是一個抽象的難以想象的概念。不過我們可以做一個類比:當(dāng)你在試圖確定一個人臉的性別時,你的大腦可能在做什么呢?也許會注意到人的發(fā)型、鼻子的形狀,甚至在運(yùn)用一些你無法用言語描述的判斷模式。同樣的,計(jì)算機(jī)程序也在數(shù)據(jù)中尋找顯著的特征。即便計(jì)算機(jī)并非不知道什么是性別,什么是小胡子,但如果我們提供給機(jī)器學(xué)習(xí)系統(tǒng)的數(shù)據(jù)集標(biāo)注了“男性”和“女性”,并且一部分人還有一個標(biāo)簽叫“小胡子”,計(jì)算機(jī)能快速地推斷出其中的關(guān)聯(lián)性。
生成模型與星系演化
12月發(fā)表在《天文學(xué)與天體物理學(xué)》(Astronomy & Astrophysics)上的一篇論文中,Schawinski 與他在蘇黎世聯(lián)邦理工學(xué)院的同事 Dennis Turp 和 Ce Zhang 使用生成模型來研究星系在演化過程中所經(jīng)歷的物理變化。
因?yàn)樗麄兪褂玫能浖c GAN 相似,但其在對潛在空間處理的技術(shù)與 GAN 有所差異,所以從技術(shù)角度來說這不是 GAN。他們的模型創(chuàng)建了人工數(shù)據(jù)集,去測試假設(shè)的物理過程。比如說,他們想知道恒星形成的“淬熄”(形成速率快速下降)與星系環(huán)境密度的增加之間的關(guān)系。
對 Schawinski 來說,關(guān)鍵問題是僅從數(shù)據(jù)中能挖掘出多少和恒星與星系演變相關(guān)的信息。“讓我們忘卻所有的關(guān)于天體物理學(xué)的知識。僅依靠數(shù)據(jù)本身,我們能在多大程度上重新發(fā)現(xiàn)這些知識?”
首先,星系的圖片被壓縮至他們的潛在空間,然后 Schawinski 在這個空間中調(diào)整元素,使其能對應(yīng)上星系的特定環(huán)境變化,比如周圍物質(zhì)的密度。這樣就有了一個假設(shè)生成器。通過重構(gòu)這個星系,讓大量原本處于低密度環(huán)境中的星系處于高密度環(huán)境中以此來看看帶來了什么不同。
這三位研究者注意到隨著星系從低密度環(huán)境走向高密度環(huán)境,它們的顏色會變得更紅,恒星也變得更加集中。Schawinski 指出這一點(diǎn)與現(xiàn)有的星系觀測相吻合,問題是,為什么會這樣?
Schawinski 說,后續(xù)的工作還沒有實(shí)現(xiàn)自動化,“人類必須參與其中,那么,什么樣的物理原理可以解釋這種效應(yīng)?”對于這個過程,可能有兩種解釋,一是在高密度環(huán)境中,星系更紅是因?yàn)槠渲邪烁嗟膲m埃;或者是因?yàn)楹阈堑男纬蓽p少了(換句話說,恒星更老了)。
現(xiàn)在有了生成模型,這兩種思路都能接受檢驗(yàn)。改變與與塵埃和恒星形成率相關(guān)的潛在空間元素,就能觀測這種改變對星系顏色的影響。Schawinski 說:“答案很顯然,星系更紅是因?yàn)楹阈切纬陕试谙陆?,而不是因?yàn)閴m埃。因此,我們應(yīng)該采納這個解釋?!?/p>
利用生成模型,天體物理學(xué)家可以研究星系如何從低密度環(huán)境走向高密度環(huán)境,以及這些變化背后的物理原理。
生成模型相較于傳統(tǒng)方式的優(yōu)勢
這種方法與傳統(tǒng)的模擬方法相近,但與之有關(guān)鍵的差別。Schawinski 表示:“模擬本質(zhì)上是由假設(shè)驅(qū)動的。也就是說,我們自認(rèn)為已經(jīng)洞悉了觀測現(xiàn)象背后的物理法則。所以,我們把恒星形成規(guī)律、暗物質(zhì)行為的原理等等這些我們自認(rèn)為正確的假設(shè)放在一起,模擬運(yùn)行。但是,模擬環(huán)境真的與實(shí)際情況吻合嗎?”。他用生成模型所做的事情與模擬完全相反,“我們不知道任何事情,不做任何假設(shè),我們希望數(shù)據(jù)本身能告訴我們可能會發(fā)生什么?!?/p>
生成模型在這項(xiàng)研究中取得的成功并不意味著天文學(xué)家和研究者就是多余的。但這似乎提醒研究者們——僅僅掌握了大量數(shù)據(jù)的人工智能系統(tǒng)就能夠完成對天體物理學(xué)的學(xué)習(xí)。Schawinski 說:“這不是完全自動化的科學(xué),但這意味著我們至少有能力去構(gòu)建部分工具,使科學(xué)過程自動化。”
雖然生成模型非常強(qiáng)大,但這是否真的代表了一種新的科學(xué)研究方法還有待商榷。
對于紐約大學(xué)和 Flatiron 研究所的宇宙學(xué)家 David Hogg 來說,這項(xiàng)技術(shù)令人印象深刻,但充其量也只是一種從數(shù)據(jù)中提取模式特征的復(fù)雜方法——這是天文學(xué)家?guī)讉€世紀(jì)以來都在做得事情。換而言之,這是觀測、分析的高級形式。
和 Schawinski 相同,Hogg 的工作也充分應(yīng)用人工智能;他一直在利用神經(jīng)網(wǎng)絡(luò)來對恒星進(jìn)行基于光譜特征的分類,并使用數(shù)據(jù)啟動的模型來推斷恒星的其他物理屬性。但是他認(rèn)為他的工作和 Schawinski 的一樣,都是經(jīng)過檢驗(yàn)的科學(xué)。Hogg 表示:“我不認(rèn)為這是第三種方法。只是我們這個社群在對數(shù)據(jù)處理的方法上更加復(fù)雜而已。特別的是,我們越來越善于將數(shù)據(jù)與數(shù)據(jù)進(jìn)行比較。但是依我看來,我的工作仍然是在做觀測?!?/p>
人工智能:
勤奮而“難以捉摸”的科研助手
無論在概念上是否有創(chuàng)新性,人工智能和神經(jīng)網(wǎng)絡(luò)已經(jīng)顯然在當(dāng)代天文學(xué)和物理學(xué)研究中發(fā)揮了關(guān)鍵作用。在海德堡理論研究所工作的物理學(xué)家 Kai Polsterer 領(lǐng)導(dǎo)著一個天體信息學(xué)小組,這個小組主要關(guān)注以數(shù)據(jù)為中心的天體物理學(xué)研究新方法。從星系數(shù)據(jù)集中提取紅移信息曾經(jīng)是一項(xiàng)艱巨的任務(wù),而現(xiàn)在他們小組使用機(jī)器學(xué)習(xí)算法就能解決這個問題。
Polsterer 認(rèn)為這些基于基于人工智能的新系統(tǒng)是“勤奮的助手”,可以連續(xù)處理數(shù)據(jù)數(shù)個小時而不抱怨單調(diào)無聊,不抱怨工作條件。這些系統(tǒng)可以完成所有枯燥乏味的繁重工作,研究者就能脫身去做“又酷又有趣的科學(xué)工作”。
Polsterer 警告說,這些系統(tǒng)并不是完美的,算法只能去做他們被訓(xùn)練過的事情,系統(tǒng)對輸入的數(shù)據(jù)是“無感覺的”。給 AI 系統(tǒng)一張星系圖片它可以估算其紅移和年齡,但是你給同一個系統(tǒng)一張自拍照或者一張臭魚爛蝦的照片,它也會照方抓藥估算出一個(錯誤的)年齡。Polsterer 認(rèn)為,人類科學(xué)家的監(jiān)督工作非常重要。工作還是要回到研究者身上,研究者才是要負(fù)責(zé)解釋這些現(xiàn)象的人。
就這一點(diǎn)而言,費(fèi)米實(shí)驗(yàn)室的 Nord 警告道,神經(jīng)網(wǎng)絡(luò)不僅要給出結(jié)果,也要給出相關(guān)的誤差線,如果在科學(xué)研究中,你做了一個測量但沒有報告相關(guān)的誤差估計(jì),就沒有人會認(rèn)真對待這個結(jié)果。
就像許多的人工智能研究員一樣,Nord 也關(guān)注神經(jīng)網(wǎng)絡(luò)給出的結(jié)果的可解釋性,通常來說,一個 AI 系統(tǒng)在給出結(jié)果時無法明確地表示出這個結(jié)果是如何獲得的。
然而,并不是每個人都覺得結(jié)果不透明是一個必須關(guān)注的問題,法國CEA Saclay理論物理研究所的研究員 Lenka Zdeborová 指出,人類的直覺同樣難以捉摸,給你看一張貓的圖片,你能立刻認(rèn)出這是一只貓,但是你并不知道你是怎樣做到這一點(diǎn)的,從這個角度上來說,人的大腦就是個黑盒。
并不僅僅是天體物理學(xué)家和宇宙物理學(xué)家在向人工智能助力、數(shù)據(jù)驅(qū)動的科學(xué)研究發(fā)展。Perimeter 理論物理研究所和安大略滑鐵盧大學(xué)的量子物理學(xué)家 Roger Melko 已經(jīng)使用神經(jīng)網(wǎng)絡(luò)來解決該領(lǐng)域中的一些最棘手最重要的問題,例如多粒子系統(tǒng)的波函數(shù)的數(shù)學(xué)表示。
因?yàn)椴ê瘮?shù)的數(shù)學(xué)形式可能會隨著它所描述的系統(tǒng)中的粒子數(shù)量呈指數(shù)級增長,這被 Melko 稱為是“指數(shù)維度詛咒”,在這樣的工作中 AI 就是不可缺少的組成部分了。
這個困難類似于在國際象棋和圍棋中找到最好的走法:玩家會試圖多看一步,想想對手會出什么招,然后再選擇自己的最佳應(yīng)對策略。但是隨著思考步數(shù)的增加,復(fù)雜性也大為增加。
當(dāng)然, AI 已經(jīng)攻克了這兩個領(lǐng)域。 1997 年 5 月 11 日, 深藍(lán)計(jì)算機(jī)在國際象棋領(lǐng)域戰(zhàn)勝了人類;2017年4月10日 ,AlphaGo 戰(zhàn)勝了柯潔,AI 在圍棋領(lǐng)域戰(zhàn)勝了人類。Melko 認(rèn)為,量子物理學(xué)也面臨同樣的問題。
機(jī)器的思想
無論是 Schawinski 所聲稱的他找到的是科學(xué)研究的“第三方法”,還是如 Hogg 所說的這“僅僅是傳統(tǒng)上的觀測和數(shù)據(jù)分析”。我們可以明確的是, AI 正在改變科學(xué) 探索 的方式并且在加速科學(xué)發(fā)現(xiàn),值得探討的是,這場 AI 革命在科學(xué)領(lǐng)域能走多遠(yuǎn)?
有時候,人們會對“人工智能科學(xué)家”的成就大肆褒獎。十年前,一個名叫亞當(dāng)?shù)?AI 機(jī)器人化學(xué)家研究了面包師傅的酵母的基因組,并找出了負(fù)責(zé)制造某種特定氨基酸的是哪些基因。(亞當(dāng)觀察缺少某些特定基因的酵母菌落,并與擁有這些基因的菌落的行為進(jìn)行比較,由此找到差異完成研究。)
當(dāng)時Wired雜志的標(biāo)題是:機(jī)器人獨(dú)立完成科學(xué)發(fā)現(xiàn)。
最近,格拉斯哥大學(xué)的化學(xué)家 Lee Cronin 在使用機(jī)器人去隨機(jī)混合化學(xué)物質(zhì),由此來觀測會形成什么樣的化合物,并通過質(zhì)譜儀、核磁共振機(jī)和紅外分光計(jì)實(shí)時監(jiān)控反應(yīng),這個系統(tǒng)最終能學(xué)會預(yù)測哪些組合的化學(xué)反應(yīng)最為劇烈。Cronin 表示即使這個系統(tǒng)不能帶來新的發(fā)現(xiàn),機(jī)器人系統(tǒng)也能讓化學(xué)家的研究效率提高 90%。
去年,蘇黎世聯(lián)邦理工學(xué)院的另一組科學(xué)家們在訓(xùn)練神經(jīng)網(wǎng)絡(luò)從數(shù)據(jù)中推導(dǎo)物理定律。他們的系統(tǒng)類似于“機(jī)器人開普勒”,利用從地球上觀測到的太陽和火星的位置信息,重新發(fā)現(xiàn)了日心說;并且通過觀測小球碰撞模型發(fā)現(xiàn)了動能守恒。因?yàn)槲锢矶赏ǔ卸喾N表述形式,科學(xué)家們想知道這個系統(tǒng)能否提供種更簡潔的方法來思考已知的物理定律。
這些都是 AI 啟動、助力科學(xué) 探索 的例子。盡管在每一個例子中,這些新方法的革命性都會收到爭議。但在這個信息浩如煙海且高速增長的時代,最值得商榷的問題可能是:僅從數(shù)據(jù)中,我們能獲得多少信息?
在 《The Book of Why: The New Science of Cause and Effect》一書中,計(jì)算機(jī)科學(xué)家 Judea Pearl 和科學(xué)作家 Dana Mackenzie 斷言到:數(shù)據(jù)“愚蠢至極”。他們寫到: 關(guān)于因果性的問題“永遠(yuǎn)不能僅憑數(shù)據(jù)去尋找答案”。
“每當(dāng)你看到以無模型的方式分析數(shù)據(jù)的論文或研究時,你可以肯定的是這項(xiàng)研究成果僅僅是總結(jié),或許做了轉(zhuǎn)述,但絕對不是在解釋數(shù)據(jù)?!盨chawinski 對 Pearl 的觀點(diǎn)抱有同感,“只使用數(shù)據(jù)”這個想法有點(diǎn)類似于“稻草人”。他也從未生成以這樣的方式做因果推斷。他想說的是:“和我們通常的工作相比,我們可以用數(shù)據(jù)多做點(diǎn)事?!?/p>
另一個經(jīng)常聽到的觀點(diǎn)是: 科學(xué)需要創(chuàng)造力。
可是到目前為止,我們還不知道,如何將創(chuàng)造力編入計(jì)算機(jī)。(Cronin 的機(jī)器人化學(xué)家只是在簡單地嘗試科研工作,似乎不能算是特別有創(chuàng)造力)Polsterer 認(rèn)為:“創(chuàng)建一套理論,有理有據(jù)的理論,我認(rèn)為需要創(chuàng)造力,而創(chuàng)造力離不開人類?!?/p>
然而,創(chuàng)造力來自何方呢?Polsterer 懷疑這和 不喜歡無聊 有關(guān),這恐怕是機(jī)器所沒有的體驗(yàn)?!耙獡碛袆?chuàng)造力,你必須厭惡無聊,然而我認(rèn)為電腦就永遠(yuǎn)不會感受到無聊?!比欢?,“創(chuàng)造力”、“靈感”卻常常用來描述深藍(lán)、AlphaGo 這樣的 AI 程序。我們在描述機(jī)器的思想時的困難映射出我們在描述自己思維過程時的困難。
Schawinski 最近離開了學(xué)術(shù)界,去了私人企業(yè)。他現(xiàn)在經(jīng)營著一家名為 Modulos 的初創(chuàng)公司,該公司雇傭了許多聯(lián)邦理工學(xué)院的科學(xué)家。根據(jù)該公司的網(wǎng)站介紹,該公司位于“人工智能和機(jī)器學(xué)習(xí)這股風(fēng)潮的風(fēng)眼中”。無論當(dāng)前人工智能技術(shù)和成熟的人工智能之間存在多大的差距,他和其他專家都認(rèn)為機(jī)器已經(jīng)準(zhǔn)備好了去完成更多的科學(xué)家的工作。不過,AI 的局限性還有待考證。
Schawinski 暢想道:“在可以預(yù)見的未來,有沒有可能去制造出一臺能過發(fā)現(xiàn)物理定律、數(shù)學(xué)原理的機(jī)器,甚至超越當(dāng)今最聰明的人類的能力極限?科學(xué)的未來終將被人力所不能及的機(jī)器所掌握么?這是一個好問題,但我不知道答案?!?/p>
推薦閱讀
Nature機(jī)器智能:破解因果推斷難題
物理學(xué)家要失業(yè)?機(jī)器學(xué)習(xí)能自學(xué)量子力學(xué)!
做科研做到絕望是一種什么樣的體驗(yàn)?
科研投入越來越多,重大成果的產(chǎn)出卻越來越少?
要不要加入我們?一起影響世界!
集智俱樂部QQ群|877391004
商務(wù)合作及投稿轉(zhuǎn)載|swarma@swarma.org
搜索公眾號:集智俱樂部
加入“沒有圍墻的研究所”
讓蘋果砸得更猛烈些吧!
二、如何組建人工智能團(tuán)隊(duì):11個關(guān)鍵角色
音樂家、化學(xué)家、物理學(xué)家能為企業(yè)的人工智能團(tuán)隊(duì)帶來什么啟發(fā)?將有很多。人們需要了解人工智能的一系列技能和角色,其中包括非技術(shù)性的技能和角色,它們將推動人工智能的成功應(yīng)用。
人工智能計(jì)劃的成功可能取決于藝術(shù)和哲學(xué),也取決于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)。這是因?yàn)槠髽I(yè)有效部署人工智能需要建立一個全面的團(tuán)隊(duì),其中包括來自各種背景和技能集的人員,以及非技術(shù)角色。
Ness數(shù)字工程公司首席技術(shù)官M(fèi)osheKranc說,“任何人工智能計(jì)劃都需要IT專家和行業(yè)領(lǐng)域?qū)<业慕Y(jié)合。IT專家了解機(jī)器學(xué)習(xí)工具包:哪些算法系列最有可能解決特定問題?如何調(diào)整特定的算法以提高結(jié)果的準(zhǔn)確性?而行業(yè)領(lǐng)域?qū)<規(guī)硖囟I(lǐng)域的知識:哪些數(shù)據(jù)源可用?數(shù)據(jù)有多臟?機(jī)器學(xué)習(xí)算法的建議質(zhì)量如何?如果沒有行業(yè)領(lǐng)域?qū)<业妮斎?,IT專家可能無法回答這些問題?!?/p>
因此得出的結(jié)論是:人工智能的成功確實(shí)依賴于團(tuán)隊(duì),而不是任何個人或角色。
SAS公司執(zhí)行副總裁兼首席信息官Keith Collins說,“當(dāng)建立一支有效的人工智能團(tuán)隊(duì)時,我們需要尋求行業(yè)專家或超級團(tuán)隊(duì),而團(tuán)隊(duì)合作才會贏得勝利。多元化的學(xué)科是人工智能成功的關(guān)鍵。”
人工智能人才的四大核心類型
Collins認(rèn)為人工智能團(tuán)隊(duì)需要四個核心類型的人員:
•了解業(yè)務(wù)流程對于建立真實(shí)場景和有價值的結(jié)果至關(guān)重要的人員。
•了解機(jī)器學(xué)習(xí)、統(tǒng)計(jì)、預(yù)測和優(yōu)化等分析技術(shù)并且正確使用的人員。
•了解數(shù)據(jù)來自哪里,質(zhì)量如何,如何維護(hù)安全和信任的人員。
•了解如何通過結(jié)果來實(shí)施分析的人工智能架構(gòu)師。
Collins指出,與其他IT領(lǐng)導(dǎo)者和人工智能專家一樣,這些核心學(xué)科或角色可以從各種背景中汲取靈感。他以音樂、化學(xué)、物理等學(xué)科為例。
他說:“這些學(xué)科鼓勵人們從復(fù)雜的交互系統(tǒng)中理解科學(xué)的過程和思維。他們通常擅長建立良好實(shí)驗(yàn)所需的批判性思維技能和應(yīng)用機(jī)器學(xué)習(xí)的成果?!?/p>
多元化人工智能團(tuán)隊(duì)的價值
多元化團(tuán)隊(duì)的價值范圍廣泛:例如,它可以幫助企業(yè)更好地應(yīng)對人工智能偏見。解決業(yè)務(wù)問題(包括最大和最棘手的問題)也很重要,這可能是企業(yè)首先制定人工智能戰(zhàn)略的原因之一。
Very公司高級數(shù)據(jù)科學(xué)家和物聯(lián)網(wǎng)實(shí)踐主管Jeff McGehee說,“人們普遍認(rèn)為,多樣化的意見對于解決所有復(fù)雜的問題至關(guān)重要。多樣性與生活體驗(yàn)有關(guān),專業(yè)背景是大多數(shù)人生活體驗(yàn)的重要組成部分,它可以為人工智能項(xiàng)目增加維度,并為尋找創(chuàng)新解決方案提供新的視角?!?/p>
McGehee還指出,建立人工智能或其他不同的團(tuán)隊(duì)需要企業(yè)的積極努力,并作為招聘和雇傭?qū)嵺`的一部分。企業(yè)會發(fā)現(xiàn)實(shí)現(xiàn)多樣性可能不是一個可行的團(tuán)隊(duì)建設(shè)策略。
考慮到這一點(diǎn),需要了解對于人工智能團(tuán)隊(duì)具有價值的一系列專家和角色,其中包括非技術(shù)角色。
1.領(lǐng)域?qū)<?/p>
人們可以將這些角色和人員視為主題專家。無論使用哪個術(shù)語,都需要了解他們對企業(yè)的人工智能計(jì)劃的重要性。
McGehee說,“開發(fā)人工智能系統(tǒng)需要深入了解系統(tǒng)運(yùn)行的領(lǐng)域。開發(fā)人工智能系統(tǒng)的專家很少會成為系統(tǒng)實(shí)際領(lǐng)域的專家。行業(yè)領(lǐng)域?qū)<铱梢蕴峁╆P(guān)鍵見解,使人工智能系統(tǒng)發(fā)揮最佳性能。”
Ness公司Kranc指出,這些專家可以解決其所在領(lǐng)域針對企業(yè)和戰(zhàn)略的問題。
他表示,行業(yè)領(lǐng)域?qū)<翌愋腿Q于要解決的問題。無論所需的洞察力是在創(chuàng)收和運(yùn)營效率還是在供應(yīng)鏈管理方面,行業(yè)領(lǐng)域?qū)<叶夹枰卮疬@些問題:
•哪些見解最有價值?
•收集的有關(guān)行業(yè)領(lǐng)域的數(shù)據(jù)是否可以作為見解的基礎(chǔ)?
•得出的見解是否具有意義?
以下將介紹一些特定的行業(yè)領(lǐng)域示例,但首先了解一下人工智能團(tuán)隊(duì)中的其他一些關(guān)鍵角色。
2.數(shù)據(jù)科學(xué)家
Jane.ai公司人工智能研發(fā)主管Dave Costenaro表示,這是人工智能團(tuán)隊(duì)在新建項(xiàng)目上工作的三個關(guān)鍵需求中的第一個。其示例項(xiàng)目包括聊天代理、計(jì)算機(jī)視覺系統(tǒng)或預(yù)測引擎。
Costenaro說,“數(shù)據(jù)科學(xué)家有著各種背景,如統(tǒng)計(jì)學(xué)、工程學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)、哲學(xué)、音樂等,通常都具有強(qiáng)烈的好奇心,這迫使他們深入系統(tǒng)中尋找和使用模式,例如他們可以為人工智能項(xiàng)目提供什么,確定它能做什么,并訓(xùn)練它做到這一點(diǎn)?!?/p>
3.數(shù)據(jù)工程師
Costenaro說,“程序員從數(shù)據(jù)科學(xué)家那里獲得想法、模型、算法,并通過規(guī)范化代碼、使其在服務(wù)器上運(yùn)行以及成功地與適當(dāng)?shù)挠脩簟⒃O(shè)備、API等進(jìn)行對話,并將它們變?yōu)楝F(xiàn)實(shí)。”
4.產(chǎn)品設(shè)計(jì)師
Costenaro表示,三項(xiàng)關(guān)鍵需求的最終結(jié)果也說明了人工智能團(tuán)隊(duì)的非技術(shù)專業(yè)知識的價值。
他說:“產(chǎn)品設(shè)計(jì)師也來自各種背景,例如藝術(shù)、設(shè)計(jì)、工程、管理、心理學(xué)、哲學(xué)。他們?yōu)樗韬陀杏玫臇|西制定了路線圖?!?/p>
5. 人工智能倫理學(xué)家和 社會 學(xué)家
人工智能倫理學(xué)家和 社會 學(xué)家可能在某些部門(特別是醫(yī)療保健或政府部門)中發(fā)揮著至關(guān)重要的作用,但在廣泛的使用案例中似乎可能會變得越來越重要。
McGehee說,“人工智能系統(tǒng)的一個重要組成部分是了解它如何影響人們,以及代表性不足的群體是否受到公平對待。如果一個系統(tǒng)具有前所未有的準(zhǔn)確性,但沒有產(chǎn)生預(yù)期的 社會 影響,它注定會失敗?!?/p>
6.律師
McGehee表示,在這個新興領(lǐng)域也看到了對法律專業(yè)知識的單獨(dú)而相關(guān)的需求。McGehee說,“GDPR法規(guī)為制定圍繞算法決策的法規(guī)樹立了先例。隨著世界各國對人工智能在工業(yè)中的應(yīng)用越來越了解,預(yù)計(jì)將出臺更多的法律。精通這一領(lǐng)域的律師可能是一種寶貴的財(cái)富?!?/p>
由于行業(yè)領(lǐng)域?qū)<胰绱酥匾鏚ranc和McGehee所闡述的那樣,有必要研究一些行業(yè)領(lǐng)域的具體例子,其中包括技術(shù)和非技術(shù)領(lǐng)域。這些領(lǐng)域應(yīng)該是人工智能團(tuán)隊(duì)建設(shè)的一部分,具體取決于企業(yè)的特定目標(biāo)和用例。
Jane.ai公司的Costenaro指出,“由于人工智能通常只是增強(qiáng)現(xiàn)有商業(yè)用例的一個使能層,因此過去支持過這個用例的團(tuán)隊(duì)成員仍然是具有價值的,出于同樣的原因也是必不可少的。”
Costenaro提供了五個可能具有價值的人工智能貢獻(xiàn)者的角色示例,并解釋了如何在人工智能環(huán)境中調(diào)整和增強(qiáng)現(xiàn)有角色。
7. 高管和策略師
Costenaro說,“企業(yè)高管領(lǐng)導(dǎo)層將需要考慮哪些業(yè)務(wù)模式可以通過人工智能實(shí)現(xiàn)自動化和改進(jìn),并權(quán)衡來自以下團(tuán)隊(duì)的新機(jī)會和風(fēng)險,如數(shù)據(jù)隱私、人機(jī)交互等。”
8. IT主管
不要對非技術(shù)角色的價值感到困惑:如果沒有IT,企業(yè)的人工智能戰(zhàn)略就不會走得太遠(yuǎn)。 Costenaro指出,IT團(tuán)隊(duì)需要解決以下問題:“如果正在為模型培訓(xùn)積累和存儲大量數(shù)據(jù),那么將如何確保數(shù)據(jù)的隱私性和安全性?此外,將如何存儲并從服務(wù)器到客戶的設(shè)備快速可靠地提供服務(wù)?”
Costenaro補(bǔ)充道,這也將推動對DevOps專業(yè)人士和擁有云原生技術(shù)(如容器和編排)專業(yè)知識人員需求的不斷增長。而IT部門有機(jī)會使用諸如聊天機(jī)器人之類的人工智能工具來簡化內(nèi)部服務(wù)。
9.人力資源領(lǐng)導(dǎo)者
Costenaro說,“與此類似,人力資源部也有很多機(jī)會通過使用像聊天機(jī)器人這樣的人工智能工具來為客戶提供服務(wù),從而提高效率。”
此外,人力資源似乎很可能成為評估組織內(nèi)人工智能影響的一個重要參與者,這與McGehee將倫理學(xué)家和律師等角色包括在內(nèi)并沒有不同。
10.營銷和銷售領(lǐng)導(dǎo)者
正如Kranc指出的那樣,如果企業(yè)的人工智能計(jì)劃與創(chuàng)收相關(guān),那么應(yīng)該考慮從銷售和營銷等領(lǐng)域添加領(lǐng)域?qū)I(yè)知識。
Costenaro還指出,作為人工智能項(xiàng)目的一部分,銷售和營銷專業(yè)人員可能需要利用銷售自動化工具和機(jī)器人流程自動化(RPA)等技術(shù)來增強(qiáng)他們現(xiàn)有的技能和流程。
11.運(yùn)營專家
在整個IT部門內(nèi),運(yùn)營和DevOps專業(yè)人員都有特定的領(lǐng)域?qū)I(yè)知識來實(shí)施人工智能計(jì)劃。Costenaro列舉了以下問題作為需要在哪里運(yùn)用專業(yè)知識的例子:
•哪些可以實(shí)現(xiàn)自動化和改進(jìn)?
•如果使用機(jī)器學(xué)習(xí)模型,將如何創(chuàng)建新的數(shù)據(jù)收集流程以持續(xù)培訓(xùn)和改進(jìn)這些模型?
•可以從開源存儲庫中獲取現(xiàn)成的、預(yù)先訓(xùn)練好的模型和/或數(shù)據(jù)集,從而獲得巨大的先機(jī)嗎?第三方供應(yīng)商提供的API服務(wù)是否會考慮一些任務(wù)和用例?
雖然人工智能可以解決一些重大問題,但也一定會產(chǎn)生新的挑戰(zhàn)。這就是構(gòu)成多元化團(tuán)隊(duì)的根本原因。
McGehee說。“具有不同背景和個性的人員關(guān)注不同的項(xiàng)目細(xì)節(jié)和限制因素,這很有用,因?yàn)樗岣吡怂兄匾?xì)節(jié)的可能性,并提供了確定解決方案的整體方法?!?
三、教人工智能以“我”的視角看世界
來源: 科技 日報
教人工智能以“我”的視角看世界
世界是多維的,生活中同樣的景物在不同的視角下會呈現(xiàn)出不同的形態(tài)。若要讓人工智能更像人類,就要讓其視角更接近人。從人類的角度觀察環(huán)境,人工智能或許會看到一個新的天地。
近日,由臉譜(Facebook)和9個國家的13所大學(xué)及實(shí)驗(yàn)室組成的學(xué)術(shù)聯(lián)盟宣布,11月將開源讓人工智能擁有以第一人稱視角與世界進(jìn)行交互能力的Ego4D(Egocentric 4D Perception)項(xiàng)目。這個項(xiàng)目包含超過3025小時的第一人稱視頻,涉及來自73個城市的700多名參與者的日常生活。這些視頻將有助于使人工智能認(rèn)知世界的方式更加趨向于人類。
那么,目前人工智能主要通過哪種視角認(rèn)知世界,不同視角對于人工智能認(rèn)知環(huán)境會產(chǎn)生哪些影響?人工智能感知環(huán)境、認(rèn)識世界主要通過哪些技術(shù)?想要認(rèn)知世界的方式更像人類,人工智能還需突破哪些瓶頸?
人工智能通常采用第三人稱視角
“要令人工智能系統(tǒng)如同人類一樣與世界交互,人工智能領(lǐng)域需要發(fā)展出一種全新的第一人稱感知范式。這意味著人工智能在實(shí)時運(yùn)動、交互時,要以第一人稱視角理解日?;顒印!蹦樧V首席研究科學(xué)家克里斯汀·格勞曼曾言。
如何理解人工智能的第一人稱和第三人稱視角?譚茗洲解釋道:“第一人稱視角代入感很強(qiáng),比如在玩 游戲 時,你如身臨其境,看到的 游戲 畫面就是你真實(shí)世界看到的畫面。第三人稱視角又叫作上帝視角,仿佛你一直飄在角色身邊一樣,如影隨形,可以看到角色本身及周圍的情況。例如,第三人稱視角下藏在掩體后可以看到掩體前面的情況;而在第一人稱視角下,囿于視角范圍,在掩體后則只能看到掩體本身。”
“再如自動駕駛,其視覺系統(tǒng)如果只從旁觀者的(如車的角度)收集數(shù)據(jù),即便通過數(shù)十萬個基于旁觀視角看到的車輛行進(jìn)圖像或視頻進(jìn)行訓(xùn)練,人工智能可能依然不知道如何去做,很難達(dá)到現(xiàn)在的自動駕駛水平。因?yàn)檫@種旁觀者的視角與坐在車內(nèi)方向盤前的視角很不一樣,第一人稱視角下,真人駕駛員做出的反應(yīng)還包括點(diǎn)剎、猛剎等行為,這些數(shù)據(jù)是從旁觀者視角無法搜集的。”譚茗洲進(jìn)一步說。
“以前人工智能界很少以第一人稱視角收集數(shù)據(jù)集,這個項(xiàng)目彌補(bǔ)了人工智能視角體系的短板。未來AR、VR的發(fā)展十分重要,如果人工智能可以從‘我’出發(fā),以第一人稱視角來觀察理解世界,將開啟人類和人工智能沉浸式體驗(yàn)的新時代?!弊T茗洲指出。
克里斯汀·格勞曼也表示:“下一代人工智能系統(tǒng)需要從一種完全不同的數(shù)據(jù)中學(xué)習(xí),即從事件中心視覺而不是邊線視覺展示世界的視頻中學(xué)習(xí)?!?/p>
建立真實(shí)世界數(shù)據(jù)集
目前讓人工智能感知環(huán)境、認(rèn)識世界,建立類人化的認(rèn)知體系主要通過什么“抓手”展開?
業(yè)內(nèi)專家指出, 歷史 證明,基準(zhǔn)和數(shù)據(jù)集是人工智能行業(yè)創(chuàng)新的關(guān)鍵催化劑。今天,幾乎可以識別圖像中任何對象的計(jì)算機(jī)視覺系統(tǒng)都是建立在數(shù)據(jù)集和基準(zhǔn)之上的,數(shù)據(jù)集和基準(zhǔn)為研究人員提供了一個研究真實(shí)世界圖像的實(shí)驗(yàn)臺。
“臉譜日前發(fā)布的這個項(xiàng)目,其實(shí)本身就是建立一個數(shù)據(jù)集,旨在訓(xùn)練人工智能模型更像人類。其開發(fā)了5個圍繞第一人稱視覺體驗(yàn)的基準(zhǔn)挑戰(zhàn),即把第一人稱視角拆解成5個目標(biāo),開展相應(yīng)的訓(xùn)練集競賽。”譚茗洲指出。
Ego4D的5個基準(zhǔn)是:情景記憶,什么時候發(fā)生?預(yù)測,我接下來可能會做什么?手—物交互,我在做什么?視聽日記,誰在什么時候說了什么?社交互動,誰在和誰互動?
譚茗洲強(qiáng)調(diào),上述基準(zhǔn)測試將促進(jìn)開發(fā)人工智能助手所必需的構(gòu)建模塊的研究。人工智能助手不僅可以理解現(xiàn)實(shí)世界中的指令并與之交互,同時可以在元宇宙中實(shí)現(xiàn)對元宇宙中指令的理解和交互。
為了建立這個數(shù)據(jù)集,與臉譜合作的大學(xué)團(tuán)隊(duì)向研究參與者分發(fā)了現(xiàn)成的頭戴式攝像頭和其他可穿戴傳感器,以便捕獲第一人稱的、未經(jīng)編輯的日常生活視頻。項(xiàng)目的重點(diǎn)是參與者從日常場景中捕獲視頻,比如購物、烹飪、邊玩 游戲 邊聊天,以及與家人和朋友進(jìn)行其他團(tuán)體活動等。
視頻采集了攝像頭佩戴者在特定環(huán)境中選擇注視的對象,以及攝像頭佩戴者如何從自我中心角度與人和物互動。到目前為止,攝像頭佩戴者已經(jīng)執(zhí)行了數(shù)百項(xiàng)活動,并與數(shù)百種不同的對象進(jìn)行交互,項(xiàng)目的所有數(shù)據(jù)都是公開的。
“臉譜這項(xiàng)研究能夠更快地推動人工智能領(lǐng)域自我中心認(rèn)知研究的進(jìn)步。這將對我們未來的生活、工作和 娛樂 方式產(chǎn)生積極影響?!弊T茗洲表示。
讓人工智能認(rèn)知能力更像人
人工智能發(fā)展的終極目標(biāo)是讓人類受益,讓我們能夠應(yīng)對現(xiàn)實(shí)世界中日益復(fù)雜的挑戰(zhàn)。想象一下,通過AR設(shè)備能夠在琴、棋、書、畫課堂中準(zhǔn)確顯示如何彈琴、下棋、握筆和勾勒;形象生動地指導(dǎo)家庭主婦根據(jù)食譜烘焙燒烤、烹飪菜肴;健忘的老人借以眼前全息圖的幫助回憶過去……
臉譜強(qiáng)調(diào),希望通過Ego4D項(xiàng)目為學(xué)術(shù)界和行業(yè)專家開辟一條全新的道路,幫助構(gòu)建更智能、更靈活和更具交互性的計(jì)算機(jī)視覺系統(tǒng)。隨著人工智能越加深入理解人類的日常生活方式,相信將這個項(xiàng)目能以前所未有的方式對人工智能的體驗(yàn)進(jìn)行情境化和個性化。然而,目前的研究還只是觸及自我中心認(rèn)知的皮毛。
“第二,還需要以事件和行為的關(guān)聯(lián)為研究中心,定義人工智能的行為。一件事情的發(fā)生包括多個行為,要用人類反饋的方式訓(xùn)練人工智能系統(tǒng),使人工智能的行為與我們的意圖一致。”譚茗洲進(jìn)一步表示。
譚茗洲強(qiáng)調(diào):“此外,聽覺和視覺、語言和行為等之間還需要配合、響應(yīng)、聯(lián)動,這就要構(gòu)建多模態(tài)交互模型,縱深研究視角為何會聚焦投向并與意圖識別相結(jié)合,形成與行為之間聯(lián)動的機(jī)制等?!?
四、學(xué)習(xí)人工智能,需要什么數(shù)學(xué)基礎(chǔ)?
需要必備的知識有:
1、線性代數(shù):如何將研究對象形式化?
2、概率論:如何描述統(tǒng)計(jì)規(guī)律?
3、數(shù)理統(tǒng)計(jì):如何以小見大?
4、最優(yōu)化理論: 如何找到最優(yōu)解?
5、信息論:如何定量度量不確定性?
6、形式邏輯:如何實(shí)現(xiàn)抽象推理?
7、線性代數(shù):如何將研究對象形式化?
人工智能簡介:
1、人工智能(Artificial Intelligence),英文縮寫為AI。
2、它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
人工智能涉及的學(xué)科:
哲學(xué)和認(rèn)知科學(xué),數(shù)學(xué),神經(jīng)生理學(xué),心理學(xué),計(jì)算機(jī)科學(xué),信息論,控制論,不定性論,仿生學(xué),社會結(jié)構(gòu)學(xué)與科學(xué)發(fā)展觀。
以上就是關(guān)于人工智能模型如何建立相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。
推薦閱讀:
人工智能設(shè)計(jì)師月薪(人工智能設(shè)計(jì)師月薪一般多少)
優(yōu)秀的文案策劃范文(文案策劃沒有經(jīng)驗(yàn)可以做嗎)
網(wǎng)站模板之家免費(fèi)下載(網(wǎng)站模板之家免費(fèi)下載)