在人工智能領(lǐng)域,AGI(Artificial General Intelligence,人工通用智能)無疑是極具有挑戰(zhàn)性和吸引力的。在此浪潮之下,天澤智云也在系統(tǒng)性研究與布局工業(yè)AI,聯(lián)合創(chuàng)始人李杰教授作為IAI全球帶頭人更是從戰(zhàn)略高度思考未來與發(fā)展趨勢,圍繞工業(yè)AI的新可能為主題聯(lián)動內(nèi)部戰(zhàn)略研討,本文是李杰教授與團(tuán)隊(duì)的內(nèi)部研討過程,以文字形式展現(xiàn)供業(yè)界探討參考。
——天澤智云聯(lián)合創(chuàng)始人李杰(Jay Lee)教授與團(tuán)隊(duì)漫談ChatGPT類通用智能對工業(yè)智能的啟示
核心提要:
(相關(guān)資料圖)
1.通用的問答追求的或許是“海洋的可能性”,所以ChatGPT提供的答案目前看精密度不高,是“能用”(possible use),并不是“好用”(good use);而工業(yè)里更多需要“一條船的使用性”,ChatGPT在工業(yè)里目前或許只適合做“初選”。
2.工業(yè)需要的是能優(yōu)化操作的生成式精密預(yù)訓(xùn)練模型OperationGPPT(Operation GenerativePrecision Pre-trained Transferable model),而不是生成式的預(yù)訓(xùn)練模型,其目的是要收斂到讓運(yùn)營管理的績效不斷提升,而非發(fā)散地問答。
3.操作的精密預(yù)訓(xùn)練模型OperationGPPT應(yīng)該有三個(gè)特色:目的性,邏輯性,因果性。
4.ChatGPT值得借鑒的一個(gè)思路是,可以在工業(yè)里構(gòu)建Connected AI(連接的智能)來協(xié)同作業(yè),從而更快收斂到全局最優(yōu),來提質(zhì)增效。
5.李杰教授在馬里蘭大學(xué)工業(yè)人工智能中心(Center for Industrial Artificial Intelligence,IAI Center)的最新研究動向:AI Data Foundry(工業(yè)智能數(shù)據(jù)工坊),工業(yè)智能作為一種通用量測(metrology)工具的實(shí)現(xiàn),以及“One-day AI”。
這是一場來自內(nèi)部的戰(zhàn)略研討和技術(shù)交流...
李杰( Jay Lee)天澤智云聯(lián)合創(chuàng)始人美國馬里蘭大學(xué)Clark Distinguished Professor
工業(yè)人工智能中心(IAI Center)創(chuàng)始主任
世界經(jīng)濟(jì)論壇全球未來先進(jìn)制造與生產(chǎn)委員會成員
美國制造商協(xié)會(NAM)制造執(zhí)行領(lǐng)導(dǎo)委員會理事會成員
MTConnect董事會成員
麥肯錫高級顧問
天澤智云李教授,不知道您對于當(dāng)前AGI(通用人工智能)在工業(yè)中的應(yīng)用前景如何看呢?
AGI的應(yīng)用主要還是針對有海量數(shù)據(jù)的、重復(fù)性的場景。ChatGPT給的答案只是是一個(gè)“初選”,不代表是一個(gè)“對選”。ChatGPT的問題是它的精密度不高。你自己去使用,會發(fā)現(xiàn)他很多錯(cuò)誤,搜索三次,三次答案不一樣。所以,它對我們來講是一種幫你做初選的東西。工業(yè)界我們不希望太多的發(fā)散,希望收斂,ChatGPT基本上還是發(fā)散比較多,因?yàn)樗鸢笗屇阋馔猓╯urprise),是吧?但我們在工業(yè)界,答案不需要意外(surprise)。
李杰 天澤智云那是不是說明,在工業(yè)界里面單純強(qiáng)調(diào)生成式AI,其實(shí)這個(gè)思路本身就值得去再商榷呢?
對,因?yàn)樗旧硎穷A(yù)訓(xùn)練(pre-trained)的,所以你一定要有一些先驗(yàn)關(guān)系標(biāo)簽(prior relationshiplabel)。但是,在這種開源領(lǐng)域(open-sourceddomain)里面,比如搜索引擎(search engine),信息有很多冗余和噪聲(garbage),所以它能夠給你的答案會有很多可能性,反而對你沒有幫助。生成式AI的根本問題,我覺得是一個(gè)“可用”跟“有用”的問題。ChatGPT提供的答案是可用,但不見得有用。
第二個(gè),比如你(要ChatGPT)作一首詩,你一定不知道它會作什么詩,它是一個(gè)意外(surprise)。我們工業(yè)界,你不希望是意外(surprise),你希望是更聚焦更準(zhǔn)。因?yàn)槲覀冾I(lǐng)域知識(domain)已經(jīng)大概知道會有幾個(gè)可能性,只是希望模型給我們做最準(zhǔn)一點(diǎn)。我們會希望,越是專家,可能性越少,專家要給出更肯定的答案——“就這樣就對了”。
李杰 天澤智云不過不知道在美國有沒有選擇擁抱這類技術(shù)的工業(yè)的、制造業(yè)的公司,他們是怎么去應(yīng)用這類技術(shù),只是用它問答的能力嗎?
因?yàn)镃hatGPT這類應(yīng)用是一個(gè)生成式的人工智能平臺(generative AI platform),所以你可以用在幾乎任何東西,只要是能夠一直重復(fù)使用,重復(fù)相關(guān)性的組配,但是,不代表它有用。生成式的(generative)不代表配的是對的,而是說你越配越多的可能性,是“能用”(possibleuse),并不是“好用”(good use)??墒窃诠I(yè)界我們更要的是精密的生成式預(yù)訓(xùn)練模型(Generative Precision Pre-trained Transferable model),是“GPPT”,而不是“GPT”。這是我個(gè)人的看法了。
李杰 天澤智云本質(zhì)上還是海量資料的整合、總結(jié)。
對。比如我們一個(gè)學(xué)生,他用ChatGPT做作業(yè),我們一看就看出來,為什么?因?yàn)樗v的都對,但不是我上課教的,沒有用我上課的資料。我上課的資料不在ChatGPT里面。ChatGPT提供的是海洋式的可能性,但是工業(yè)我要的只是一條船的“使用性”。
這就是為什么說,工業(yè)智能如果通用化,不應(yīng)單純是一個(gè)語言的生成式模型,它應(yīng)該是一個(gè)操作的精密模型。操作的生成式預(yù)訓(xùn)練模型(OperationGPPT)應(yīng)該有三個(gè)特色:第一個(gè)是它的目的性,要產(chǎn)能最大,維護(hù)成本最低,這是優(yōu)化的目標(biāo)函數(shù)(objective function);第二個(gè),它有它的邏輯性:什么時(shí)候該做什么,隨工況(regime)變化而變化,它一定有是由某種操作邏輯決定的;第三個(gè),很重要的,它有因果性,好跟壞、大跟小、高跟低,它一定有因果關(guān)系。
所以說,一個(gè)是ChatGPT,一個(gè)是OperationGPPT。對比起來(編者按:如下表所示),ChatGPT是發(fā)散的,然后工業(yè)是收斂的;ChatGPT通用的可能性是很多的,而對我們工業(yè)界,領(lǐng)域?qū)S械木苄砸?,等等?/p>李杰
表1AGI生成式預(yù)訓(xùn)練模型ChatGPT與IAI操作優(yōu)化的精密模型OperationGPPT特性對比
ChatGPT | OperationGPPT |
發(fā)散的 | 收斂的 |
提供可能性 | 聚焦使用性 |
通用 | 精密 |
明白。確實(shí),工業(yè)領(lǐng)域不同的目標(biāo)和要求,決定了工業(yè)領(lǐng)域的通用智能形態(tài)和研究的方向也會有不同。另外,不知道李教授您在馬里蘭大學(xué)的工業(yè)智能中心(Center for Industrial Artificial Intelligence,IAI Center)現(xiàn)在有什么新的研究動向?
我們現(xiàn)在在學(xué)校做三個(gè)東西。
一個(gè)就是我們的“工業(yè)AI Data Foundry(工業(yè)智能數(shù)據(jù)工坊)”,我建了一個(gè)數(shù)據(jù)群,75組到100組的數(shù)據(jù),包括以前的PHM(故障預(yù)測與健康管理)的數(shù)據(jù)競賽(Data Challenge)的數(shù)據(jù),我們希望訓(xùn)練學(xué)生用這些數(shù)據(jù)來增加工業(yè)AI的分析能力。比如說,我從齒輪做到發(fā)動機(jī)、做到醫(yī)療、做到半導(dǎo)體,學(xué)生做完信心就會增加。傳統(tǒng)的人工智能科學(xué)(AIscience)只希望做一些數(shù)據(jù)量很大的問題,但真正工業(yè)界的AI不見得是數(shù)據(jù)量很大的問題。你要做有用的事情。
第二個(gè),我要把工業(yè)智能建模的速度增快。我希望把工業(yè)AI變成一個(gè)量測(metrology)的觀念,將工業(yè)AI變成一個(gè)很強(qiáng)的量測工具,可以用來量機(jī)器好壞、量制程好壞、量人健不健康,等等,讓工業(yè)AI變成一個(gè)響應(yīng)服務(wù)趨近模型(response service approximation),“RSA”。RSA是個(gè)元模型(meta-model),也是一個(gè)代理模型(surrogate model),它可以被用來量測輸入和輸出(input and output),去替代需要用很昂貴的儀器、算法計(jì)算的場景。所以,一個(gè)是新的定義,一個(gè)是新的做法。
第三個(gè),我希望以后我們開發(fā)工業(yè)AI,能在一天之內(nèi)開發(fā)完畢,叫 “One-day AI(一日智能)”,這是我的一個(gè)夢想。
李杰 天澤智云其實(shí)剛剛說的,如何能快速構(gòu)建模型,也是我們的模力工場產(chǎn)品現(xiàn)在努力演進(jìn)完善的一個(gè)方向。其他不知道李教授您還有補(bǔ)充嗎?
事實(shí)上,ChatGPT的觀念可以用在這里:因?yàn)楝F(xiàn)在的AI模型是分散的,每個(gè)應(yīng)用可能都有一個(gè)AI模型,它們之間沒有串通在一起。參考ChatGPT的觀念,以后這些模型完全可以是一個(gè)“Connected AI(連接的智能)”。ConnectedAI的好處是,它可能有很強(qiáng)的收斂性,要“快”跟“準(zhǔn)”。
現(xiàn)在每個(gè)AI都是獨(dú)立的一個(gè)智慧孤島,它們之間沒有連在一起。所以要ConnectedAI很重要,不是說只是更多的AI,更多的AI不見得有用的,而是要能夠協(xié)同(coordinated)和合作的。譬如工廠里面有刀具的AI、沖壓過程(stamping)的AI、工業(yè)機(jī)器人(robot)的AI,每個(gè)對象可能都有AI,但是基本上最后的目的還是一個(gè)質(zhì)量問題、效率問題。
李杰 5月31日,\"工業(yè)互聯(lián)網(wǎng)專場\"等你來撩!掃碼即可報(bào)名參會