大模型增強
業(yè)務(wù)協(xié)作
行業(yè)解決方案
企業(yè)服務(wù) 軟件與信息服務(wù)
汽車行業(yè) 汽車行業(yè)
物流快遞 物流快遞
地產(chǎn)家居 房地產(chǎn)行業(yè)
教育 教育行業(yè)
原創(chuàng)
2024/01/16 17:24:15
來源:天潤融通
2621
本文摘要
在 AI 的技術(shù)浪潮下,開發(fā)者們將如何把握機遇、迎接挑戰(zhàn)?天潤融通CTO安靜波與SegmentFault 思否創(chuàng)始人 & CTO 祁寧、PingCap 聯(lián)合創(chuàng)始人 & CTO 黃東旭,北京極客邦科技創(chuàng)始人 & CEO,InfoQ中國創(chuàng)始人霍太穩(wěn)一起,就 re:Invent 2023 的前沿洞察展開了一場深度對話。
幾周前,2023 亞馬遜云科技 re:Invent 在拉斯維加斯圓滿落幕,AI成為這場云計算“春晚”最重要的關(guān)鍵詞。
那么,在 AI 的技術(shù)浪潮下,開發(fā)者們將如何把握機遇、迎接挑戰(zhàn)?天潤融通CTO安靜波與SegmentFault 思否創(chuàng)始人 & CTO 祁寧、PingCap 聯(lián)合創(chuàng)始人 & CTO 黃東旭,北京極客邦科技創(chuàng)始人 & CEO,InfoQ中國創(chuàng)始人霍太穩(wěn)一起,就 re:Invent 2023 的前沿洞察展開了一場深度對話。
【以下是對話全文】
霍太穩(wěn):如果用一個詞來形容今年的技術(shù)圈,毫無疑問是大模型 LLM 或者說生成式 AI,大家從各自領(lǐng)域聊一聊對生成式 AI 的看法?
祁寧:我覺得大模型其實引爆了一波開源的工具,或者推動了項目的發(fā)展。生成式 AI 本身也是跟開源息息相關(guān),包括 Transformer、Open AI和一些工具集?,F(xiàn)在 AI 領(lǐng)域已經(jīng)出現(xiàn)了很多開源大模型,讓開發(fā)者可以了解生成式 AI 最新一些進展,體驗最新的技術(shù)。
黃東旭:不管是對生成式 AI ,還是對機器學(xué)習(xí)來說,數(shù)據(jù)都是這一切的根源,怎么存儲好數(shù)據(jù),用好數(shù)據(jù)庫軟件,我覺得還是一個長期會存在的事情。
但生成式 AI,也對新一代的數(shù)據(jù)庫提出了很多不一樣的需求。比如今年向量索引被提到很高的一個位置。同時,生成式 AI 或者 LLM 訪問數(shù)據(jù)的模式變了。
過去大企業(yè)要把所有數(shù)據(jù)都整合在一起,然后在上面提供服務(wù),但現(xiàn)在會發(fā)現(xiàn) LLM 去訪問數(shù)據(jù)可能是從邊緣開始去連接,同時訪問的都是跟個人相關(guān)的、或者和企業(yè)相關(guān)的數(shù)據(jù)集。以前我們很多時候拿到了數(shù)據(jù),不知道該怎么去產(chǎn)生 Insight,因為它取決于 Data Scientist 或者應(yīng)用開發(fā)者的想法。但現(xiàn)在你只要把數(shù)據(jù)庫暴露給生成式 AI,它就可以幫你做數(shù)據(jù)的整合和加工,它可能會產(chǎn)生更多新的應(yīng)用場景和新的 Insight。由這種動機出發(fā),對于數(shù)據(jù)庫,不管是底層的技術(shù)還是應(yīng)用場景,以及這個應(yīng)用的交互方式,我覺得都產(chǎn)生了巨大的影響。
安靜波:過去七八年云計算一直是技術(shù)創(chuàng)新最活躍的地方。對于一些企業(yè)應(yīng)用來說,跟隨云的腳步做創(chuàng)新是一個很高效的方式。過去我們采用這樣的方式完成了最早的一次快速成長,然后到做大做強。
今年 ChatGPT 引爆了大模型相關(guān)的技術(shù),我這次去 re:Invent 的一個最重要目的,就是去看一下行業(yè)前沿的對于生成式 AI 的認知,做一些技術(shù)判斷。因為從年初就感覺,大模型的影響是革命性的,它不是一個局部的技術(shù)革新,會對整個產(chǎn)業(yè)、軟件產(chǎn)業(yè)、甚至說對人類都會有革命性的影響。我們是做企業(yè)服務(wù)的,所以我們今年也在不斷探索如何將大模型的能力和應(yīng)用場景結(jié)合,而且也找到了一些實踐場景。
這次參會也很受啟發(fā),不管是企業(yè)的招人用人,甚至說產(chǎn)品的重構(gòu),越早深刻地認識,就越能占到先機。就像我們在 2014 年堅決上云給天潤融通帶來的價值是一樣。
霍太穩(wěn):今年發(fā)布會現(xiàn)場有一個讓人非常興奮的發(fā)布——Amazon Q。Amazon Q 是否正在重構(gòu)生成式 AI?這對行業(yè)帶來了什么樣的影響?
祁寧:我覺得亞馬遜云科技打了個樣。大家都知道生成式 AI 對企業(yè)很重要,現(xiàn)在很多企業(yè)也在做這一塊的,包括企業(yè)內(nèi)部的知識庫,或者是想用生成式 AI 做客服機器人,或者去對企業(yè)文檔做重構(gòu)。Amazon Q 其實是一個整合,它把這一些技術(shù)給整合起來,然后告訴大家一個標準,告訴一個可以交付的 To B 應(yīng)用應(yīng)該長什么樣子,應(yīng)該具備什么樣的功能。
黃東旭:Amazon Q 未來可能會成為亞馬遜云科技這些應(yīng)用的一個入口,現(xiàn)在只是先把這個入口放出去了。
安靜波:我回來的時候仔細看了 Amazon Q 的文檔,并真真正正地去使用了,我覺得有幾點是很出乎我的意料的。比如說你使用它會發(fā)現(xiàn),它去管理你的知識的時候,已經(jīng)對接了 47 個 Connector。這對于企業(yè)來說很震撼,因為我就很需要這樣的東西,而不是需要一個類似于 GPT4 或 5,它商業(yè)化還需要安全管理,還需要連接知識庫等等。Amazon Q 甚至已經(jīng)做到這么多的連接器,還可以設(shè)定有效期,因為大家知道知識是有有效時間,包括需要安全控制,這都是企業(yè)真正商業(yè)落地需要的。另外,Amazon Q 作為一個開箱即用的產(chǎn)品還解決了運行環(huán)境的問題。如果我們現(xiàn)在自己的團隊去搞一個開源大模型,需要消耗了大量的時間進行探索,然后花了大量時間還要做服務(wù)保障,這顯然并不是最好的一個方式。
霍太穩(wěn):亞馬遜云科技提倡“負責(zé)任的 AI”,那么關(guān)于生成式 AI 的安全問題,大家是如何理解的?
安靜波:負責(zé)任的 AI 肯定是 AI 發(fā)展的前提。我們有時候在國內(nèi)參會跟一些監(jiān)管部門去溝通。他們提到一個說法,就是你做 AI 的東西,你的投入里有 30% 是跟安全有關(guān)的。
亞馬遜云科技構(gòu)建了這個生成 AI 的開發(fā)和運行環(huán)境,安全是商業(yè) Ready 的必需品。沒有安全可控制就不可能有商業(yè)應(yīng)用 Ready。我認為不論是國內(nèi)還是國外,對這個安全可控制都有極高的要求。
我看到關(guān)于監(jiān)管和落地的一個趨勢,從技術(shù)的成熟到個人消費者的大量的應(yīng)用,再到商業(yè)的企業(yè)應(yīng)用,然后才會有面向 Public 的公眾應(yīng)用,政策是一定會隨之跟進的。技術(shù)先發(fā)展,然后大規(guī)模的消費者應(yīng)用,然后企業(yè)應(yīng)用,然后公共法規(guī)跟上,這是一個過程。
我覺得 AI 安全這個課題不管國內(nèi)還是國外都有一個很大的市場,未來有兩類,一類是垂直領(lǐng)域,會有很大的 AI 的安全公司出現(xiàn);第二個云廠商也會有很好的安全產(chǎn)品出來。
黃東旭:現(xiàn)在我們討論的生成式 AI 的安全問題,跟我們過去討論其他人寫的軟件安全問題,是完全不一樣的兩個問題。過去我有源代碼,是可解釋的。但現(xiàn)在我們構(gòu)建 AI 應(yīng)用的方式,嚴格來說都是個黑盒。我覺得所有的這些安全,都取決于 AI Alignment 技術(shù)的創(chuàng)新。
祁寧:我覺得現(xiàn)在安全,可能跟我們之前傳統(tǒng)意志安全不一樣。我們之前的安全可能是代碼層,現(xiàn)在的安全更多是建立在邏輯層面上。未來,去構(gòu)建 Prompt 的時候,可能就要考慮怎么樣建立一個安全的 Prompt 去更好地符合倫理道德。
霍太穩(wěn):對于今年現(xiàn)場發(fā)布的 Amazon S3 Express One Zone 和 Amazon Graviton4 的價值,大家怎么看?
安靜波:Amazon S3 是一個很經(jīng)典的產(chǎn)品,大家可能都覺得沒什么可 Reinvent 了,但是它出來一個更新,你會發(fā)現(xiàn)還是有驚喜的。
舉個例子,比如說 Intelligent-Tiering,我們會監(jiān)控每一個客戶他的訪問頻度,如果說他三個月不訪問了,我就把他放到 S3 Glacier 里,如果客戶什么時候訪問,我會再給他挪出來。這個功能我需要花大量的時間去做開發(fā)、測試。而這次發(fā)布的 Intelligent-Tiering ,就能夠自動根據(jù)用戶訪問與否進行相應(yīng)的處理。這個功能原先要我們自己來做,但我沒想到這么古老的 Amazon S3 還在不斷地做降本和創(chuàng)新。
另外,基于亞馬遜云科技,我們在 2015 年基本上把當(dāng)時所有的云服務(wù)都做了重構(gòu),包括使用了 Amazon EC2,Amazon S3、Amazon RDS 等大量的產(chǎn)品。國內(nèi)很多時候只是賣產(chǎn)品,但是亞馬遜云科技是真的在為 Builder 去做服務(wù)。因此,基于海外的生態(tài),我們就可能會考慮還是基于亞馬遜的產(chǎn)品去快速的去迭代、快速的上線。
黃東旭:我先說為什么 Serverless 如此重要。從成本上,它對開發(fā)者的負擔(dān)是非常低的。過去我們開發(fā)個應(yīng)用,最古老的時候還要去買服務(wù)器、找機房,還要托管;后來云計算剛剛開始出來,只需要買虛擬機,然后買服務(wù)、寫應(yīng)用,但是仍然需要管理虛擬機的狀態(tài),以保證它的高可用?,F(xiàn)在這些都不需要操心了,只需要關(guān)心業(yè)務(wù)。從用戶體驗來說這是一個飛躍。因為好用的東西,一定會打敗不好用的東西。
從技術(shù)上來說,有 Serverless 了以后,才能更好地去利用云上的資源。我覺得 Serverless 這個產(chǎn)品形態(tài),是能夠支持像我們這樣的基礎(chǔ)軟件提供商去打造盈利模式的。
舉個簡單例子,我們 TiDB Serverless 上線了以后其實可以提供一個免費的 Database 給全世界所有人,這在以前是不可行的。因為其實可能 99% 的免費用戶的用量是不太多的,所以我可以用一個更加共享,或者更加彈性的資源策略去應(yīng)對,我從那些有高要求的用戶那邊收到錢就行了。
所以我覺得 Amazon S3、Amazon EC2、Amazon DynamoDB 這幾個產(chǎn)品雖然都是亞馬遜云科技一直以來有的東西,但正是幾個產(chǎn)品構(gòu)建了整個亞馬遜云科技云的彈性的基石。所以在這上面任何一點創(chuàng)新都會帶來巨大的的影響。
總的來說,Serverless 一定是未來的方向,因為用戶體驗變得更好了。對于 PingCAP 這樣的基礎(chǔ)軟件廠商來說,不管是 Serverless ,還是這些基礎(chǔ)設(shè)施的更新,它產(chǎn)生的影響也是更加深遠的,不僅是亞馬遜云科技,而是整個生態(tài),所有人都會共享這個進步。
霍太穩(wěn):亞馬遜云科技的 CTO Werner Vogels 在會上發(fā)布了儉約架構(gòu)師的七大黃金法則,想聽聽大家對此的看法?
黃東旭:我談一談這條,把成本視作非功能性的需求。我最近這一年有一個親身經(jīng)歷的例子。我們在做 TiDB Serverless 的時候其實在內(nèi)部測試了好幾版??赡芤婚_始成本優(yōu)化了 10%、20% 差不多了,然后我們直接說咱們應(yīng)該敢想一點,能不能把這個成本下降“1000 倍”。最后我們?yōu)榱诉_到這個目標,團隊就會被迫放棄掉現(xiàn)有的一些固化的思想,再去做一些更大的技術(shù)創(chuàng)新,去做業(yè)務(wù)的重構(gòu)。這也是為什么我們在云上開始使用 S3 作為我們新一代數(shù)據(jù)庫引擎的基石。當(dāng)我們把成本作為一個很重要的事情去思考的時候,它可能會帶來一些選擇和技術(shù)上的 Think out of the box。
第二點我印象特別深刻,無法觀測的系統(tǒng)將帶來無法估量的成本。我去面試一些 Senior 的研發(fā),包括一些系統(tǒng)的架構(gòu)師的時候,我很關(guān)注架構(gòu)師對于這些系統(tǒng)的可觀測性的重視度。有經(jīng)驗的架構(gòu)師可能在構(gòu)建系統(tǒng)的時候,就會把可觀測性,跟系統(tǒng)的功能、成本,擺到同樣重要的位置。只有當(dāng)系統(tǒng)是可觀測的,才可能有調(diào)優(yōu)的機會,以及如果有什么問題,才有去修復(fù)的機會。
可觀測性不僅是衡量業(yè)務(wù)的一個指標,也是衡量內(nèi)部團隊質(zhì)量的一個手段。比如團隊質(zhì)量不高,構(gòu)建了一個不健壯的系統(tǒng),可能用戶量小的時候沒什么問題,但是用戶量一上來,或者有新的需求的時候,就可能要推倒重來。
安靜波:我覺得大部分的架構(gòu)師是從研發(fā)一線的架構(gòu)師,到高級的架構(gòu)師,再到總架構(gòu)師。
在國外可能架構(gòu)師就能負責(zé)很多方面了,不僅要負責(zé)代碼數(shù)據(jù),還要負責(zé)基礎(chǔ)設(shè)施、成本、業(yè)務(wù)。我們常說在國內(nèi)做 CTO 的關(guān)鍵就是業(yè)務(wù)跟技術(shù)的結(jié)合。這里邊第二條最重要的是架構(gòu)和業(yè)務(wù)之間的關(guān)聯(lián)。而業(yè)務(wù)里邊最重要的一點,是業(yè)務(wù)的發(fā)展和成本之間是呈正相關(guān)的。
我們經(jīng)常講要降本增效,尤其是云上如何去降低成本。有一個前提是跟業(yè)務(wù)保持一定的比例,首先要有業(yè)務(wù)的規(guī)劃,然后才有云上架構(gòu)的規(guī)劃。比如明年我的業(yè)務(wù)用量要比現(xiàn)在多上 5 倍,那架構(gòu)的調(diào)整和節(jié)省成本的方式跟明年的業(yè)務(wù)如何結(jié)合是與今年完全不一樣。做技術(shù)的人有時候會忘掉業(yè)務(wù)強相關(guān)這一點,忽略了業(yè)務(wù)對技術(shù)的影響。所以我特別想提出來就這一條。
此外,我們信賴一個法則,即所有的事情都必須是可觀測的。你看剛才講成本可觀測,然后我的系統(tǒng)的架構(gòu)運行指標可觀測。因為我們做實時通信的系統(tǒng),單一一個系統(tǒng)每分鐘要采集 7 萬多個指標,它所有的目的就是我們講的叫無度量不優(yōu)化。包括優(yōu)化成本也是優(yōu)化,沒有度量就絕對不能優(yōu)化。那么研發(fā)團隊也是一樣的,如果不能度量,其實我們不能大量地發(fā)展團隊。我們也是從幾十人上百人發(fā)展到現(xiàn)在有六七百人的這樣一個規(guī)模,這時候必須有嚴格的度量方式,雖然這種度量的方式我們不能 100% 依賴它。
祁寧:我們當(dāng)時還 Battle 了一下他那個演講的標題要怎么翻譯。我認為它應(yīng)該是翻譯成節(jié)儉。
其實它的中心思想就是成本意識要貫通在架構(gòu)設(shè)計上來,自始至終就從成本這個角度去考慮。因為我們之前討論的架構(gòu)都是一個健壯的架構(gòu),或者一個可擴展的架構(gòu)、靈活的架構(gòu),但是它從一個成本的角度來考慮這件事情的時候,最終是要能夠?qū)崿F(xiàn)一個成本可控的架構(gòu)。
霍太穩(wěn):面對當(dāng)下生成式 AI 的技術(shù)浪潮,各位認為技術(shù)管理者在招人、用人方面需要做出什么改變?
黃東旭:我最近一年最大的影響可能是跟 Werner 的七條黃金法則最后一條比較相關(guān),就是 Open minded 在這個時代會變得更加重要。可能過去的這個經(jīng)驗在未來的這個幾個月就過時了,比如 AI 工程師。所以大家要保持一個開放的心態(tài)。
另外,我覺得現(xiàn)在工程師這個職業(yè),考核技術(shù)層面上的東西會越來越少。比如說具體到有幾個參數(shù)這種問題已經(jīng)沒必要了。因為 Copilot 也好,Amazon CodeWhisperer 也好,編程這件事情已經(jīng)被技術(shù)解決了。但是它對于一個系統(tǒng)的宏觀設(shè)計和感覺,這是 AI 目前做得不夠好的。所以我可能會更多的偏向于去考察一些更軟性的東西。
祁寧:對程序員來說,之前的某些技術(shù)成分可能是屬于手藝的成分,比如代碼寫的很好、執(zhí)行效率很高。但現(xiàn)在來說是這一部分的意義已經(jīng)不大了。ChatGPT 現(xiàn)在相當(dāng)于把大家都拉到了一個相對平等的一個起點。
但從另一個方面來講,就更需要考察程序員的整合能力,或者說他從架構(gòu)這方面考慮的能力變得更為重要。這個程序應(yīng)該往哪個方向去寫,哪些功能是必要的,健壯的架構(gòu)有哪些必要的實現(xiàn)……我覺他有沒有這樣的意識特別重要??赡芪覀円院蟛徽?Developer,招 Builder。Builder 可能更能定義我們要招的這樣一個角色。
安靜波:首先心態(tài)很重要。我印象特別深有一段對話,我們所有人都知道答案是生成式 AI,那么問題是什么?我們需要知道問題的人,要有思想的人。我們也是用這個標準去衡量候選人。有技能是一個基礎(chǔ),要衡量他有沒有思想,最直接的方式就是看他怎么向 AI 提問,觀察他提問的過程。
霍太穩(wěn):Werner 提到,“現(xiàn)在是成為構(gòu)建者最好的時代”,大家怎么看待這個事情?
黃東旭:有想法的人很多,做開源這么長時間,我是有這個親身體會,就是高手在民間。你永遠覺得你自己比較厲害的時候,社區(qū)里或者外部總會有人帶來 Surprise。我覺得生成式 AI 降低了技術(shù)門檻,讓這些有想法的人把想法變成現(xiàn)實。
同時,云本身在變成一個新的操作系統(tǒng)。以前我們要做應(yīng)用,還得學(xué) Linux,還得學(xué) Windows,學(xué)各種各樣基礎(chǔ)設(shè)施相關(guān)的東西。但現(xiàn)在在云上實現(xiàn)這些東西變得越來越簡單。加上 ChatGPT 和 AI 的這些能力,開發(fā)者能夠快速構(gòu)建出應(yīng)用;再加上云的彈性基礎(chǔ)設(shè)施,其實就已經(jīng)可以實現(xiàn) One man company 了。
創(chuàng)新的成本變得很低。對于 Builder 來說,想做東西,這個門檻現(xiàn)在至少是有史以來最低的時候,但我更看好未來,未來會更低。
霍太穩(wěn):從開發(fā)者角度,亞馬遜云科技發(fā)布的 Amazon Q、Amazon Bedrock、Amazon CodeWhisperer 等一系列生成式 AI 工具對他們的開發(fā)工作有什么影響?
祁寧:生成式 AI 爆火之后,我一直在想編程語言最終會不會消失。因為編程語言創(chuàng)造出來的時候,就是讓人懂機器,讓機器懂人要干什么。但是如果有了這種大語言模型,其實中間這一層可以被消解掉。人要干什么,他告訴大模型,由大模型去生成機器碼,那么程序員的意義在哪里?今天剛剛提到的 Builder 這個詞解答了這個問題。他其實是更多地去創(chuàng)造,知道怎么拿這些資源去整合出我們最終想要的一個解決方案,這個可能是他最重要的一個能力。所以說我覺得可能我們后面開發(fā)者的思維范式要有所轉(zhuǎn)變,可以更多的去擁抱這樣的一些工具。
安靜波:我感興趣的是 Amazon CodeWhisperer 里面提供一個 Professional 的一個版本。在 Professional 版本里,我們把自己的代碼上傳上去可以再提高 28% 的開發(fā)效率。
代碼轉(zhuǎn)換方面, Amazon Q 和 Amazon CodeWhisperer 配合可以極大提高效率。Keynote 提到亞馬遜云科技一個 5 人小團隊兩天就可以將 1000 個生產(chǎn)應(yīng)用程序從 Java 8 升級到 Java 17,而我們自己把 Java 8 的代碼升級到 Java 23,升級 1 個大概要一個月左右的時間,所以我們正在和他們一起利用亞馬遜云科技的這些工具去解決這個問題。
霍太穩(wěn):大家對 2024 年有哪些期待?大家認為明年的 re:Invent 可能會帶來哪些驚喜?
祁寧:AI 其實是一個很大商業(yè)機會,所以我覺得明年 AI 仍然會是 re:Invent 重要內(nèi)容。因為今年只是發(fā)布了一個初步的模型,明年應(yīng)該會有一個更具體的動作,包括根據(jù)今年行業(yè)的需求變化,明年應(yīng)該會有更多的應(yīng)用方面的更新。Amazon Q 我覺得明年會有一個更大的迭代。
黃東旭:我的期待比較實際一點,就是活下去。這個是最大的期待了。預(yù)測一下,我是覺得包括明年的 re:Invent 一切東西都會變得更簡單。因為我是覺得 AI 會更加深層次地改變現(xiàn)在的產(chǎn)品形態(tài),包括 Amazon Q 都只是小試牛刀,接下來我覺得會有更多的、更深層次的應(yīng)用,但是這個應(yīng)用的方向一定是會讓這些復(fù)雜變得更簡單。
安靜波:最主要的期待是國內(nèi)的大模型什么時候能商業(yè)落地,賦能各行業(yè)的應(yīng)用。對 re:Invent 的期待,比如說我們現(xiàn)在基于 ARM 的替換,實際上我們幾乎快完成 100% 的替換了,但這個替換過程很慢,希望未來能有加速的空間,期待亞馬遜云科技明年的創(chuàng)新能帶給我們這方面的驚喜。
結(jié)語
生成式 AI 對于每一個開發(fā)者的影響是不容懷疑的。圍繞生成式 AI,今年亞馬遜云科技在 re:Invent 也發(fā)布了一系列與企業(yè)業(yè)務(wù)相關(guān)的、與開發(fā)者工作相關(guān)的創(chuàng)新。正如 Werner 所說,“現(xiàn)在是成為構(gòu)建者最好的時代”,在這個過程中,持續(xù)的學(xué)習(xí)是非常重要的。不論是亞馬遜云科技還是其他公司,大家都可以去學(xué)習(xí)最新技術(shù),提升個人技能,并積極利用先進的生成式 AI 工具,提高效率、開放思維,從而為個人、企業(yè)及組織帶來更多的商業(yè)價值。
專屬1v1客服
為您提供最全面的咨詢服務(wù)
掃碼立即咨詢