全棧式創(chuàng)新——云計(jì)算平臺(tái)如何加速企業(yè)部署生成式AI
生成式AI將成為未來企業(yè)在競爭中優(yōu)勢的重要來源。企業(yè)現(xiàn)在面臨的關(guān)鍵問題已經(jīng)不是要不要上大模型,而是如何讓大模型落地,為企業(yè)創(chuàng)造真正的價(jià)值。作為大數(shù)據(jù)、大算力催生的產(chǎn)物,大模型“天生長在云上”,大模型落地更是要取決于云服務(wù)的質(zhì)量。
作為云計(jì)算和生成式AI的領(lǐng)軍企業(yè)之一,亞馬遜云科技在其 2023 re:Invent大會(huì)上公布了最新AI全棧式創(chuàng)新和配套工具包,目的是幫助更多企業(yè)利用生成式AI進(jìn)行創(chuàng)新,從這些最新的創(chuàng)新實(shí)踐中,我們也許能一窺生成式AI在企業(yè)應(yīng)用中的最新趨勢。
由于美國市場在生成式AI領(lǐng)域領(lǐng)先中國大概6-12個(gè)月,基礎(chǔ)大模型賽道的競爭格局已經(jīng)基本成型,更多的創(chuàng)新正在向應(yīng)用/AI原生應(yīng)用層匯聚,商業(yè)機(jī)構(gòu)對AI的認(rèn)知和接納程度也相應(yīng)更高。美國企業(yè)界,特別是管理層的基本共識(shí)是,生成式AI將在未來幾年對企業(yè)的競爭力產(chǎn)生顛覆性的影響。因此越來越多的企業(yè),特別是資金和技術(shù)實(shí)力比較雄厚的大企業(yè)/機(jī)構(gòu)開對生成式AI進(jìn)行落地的實(shí)驗(yàn)。
本次大會(huì)就透露了一些最新的信息,比如全球最大的另類資產(chǎn)投資和管理公司黑石(BlackStone)正在與亞馬遜云科技和向量數(shù)據(jù)庫提供商Pinecone合作,推出基于生成式人工智能的解決方案,以增強(qiáng)投資團(tuán)隊(duì)能力。
酒店集團(tuán)萬豪國際正在與亞馬遜云科技、咨詢公司德勤和軟件供應(yīng)商Palo Alto Networks合作,根據(jù)萬豪國際的首席信息安全官Arno Van Der Walt的說法:更安全地利用人工智能提供數(shù)字客房服務(wù)。
不過對于大多數(shù)企業(yè),向生成式AI轉(zhuǎn)型的過程可能涉及高昂的時(shí)間和技術(shù)成本,還可能面對安全和隱私方面的挑戰(zhàn)。為了幫助更多的客戶解決轉(zhuǎn)型挑戰(zhàn),盡量降低大模型的應(yīng)用成本,亞馬遜云科技在今年的re:Invent大會(huì)上也發(fā)布了其針對生成式AI的全棧式創(chuàng)新,涵蓋了底層負(fù)責(zé)訓(xùn)練和推理的基礎(chǔ)設(shè)施層、中間的模型工具服務(wù)層以及上層生成式AI應(yīng)用層,目的是在全棧各個(gè)層面幫助企業(yè)落地大模型。
基礎(chǔ)設(shè)施層:
聯(lián)合Nvidia打造H200超算
大模型訓(xùn)練和推理都需要巨大的算力支持,基礎(chǔ)算力層的能力也決定了大模型的能力,重要性不言而喻。
大會(huì)上的一大亮點(diǎn)就是亞馬遜云科技首席執(zhí)行官Adam Selipsky與Nvidia首席執(zhí)行官黃仁勛攜手登臺(tái)。兩人首先回顧了亞馬遜云科技和Nvidia的長期合作,13年前亞馬遜云科技是全球提一個(gè)提供GPU算力的云服務(wù)商,如今亞馬遜云科技已經(jīng)部署了超過200萬張Hopper架構(gòu)的GPU(H100),相當(dāng)于提供了3000臺(tái)超算的算力。兩家公司隨后宣布將擴(kuò)大合作,在亞馬遜云科技上部署最新的Crace Hopper——H200 芯片。
除了最先進(jìn)的GPU,還需要好的分布式計(jì)算架構(gòu)才能形成強(qiáng)大算力。亞馬遜云科技和Nvidia宣布將聯(lián)手打造全球首個(gè)基于H200的云上超級計(jì)算機(jī),在亞馬遜云科技 EC2 UltraCluster的幫助下,將集成最多16385張H200提供的算力。這將可以輕松滿足萬億參數(shù)級別大模型的預(yù)訓(xùn)練。
此外,亞馬遜云科技還發(fā)布了最新的機(jī)器學(xué)習(xí)芯片Trainuim2,據(jù)悉Trainium2芯片比第一代的訓(xùn)練速度提高了四倍。它能夠部署在最多100,000個(gè)芯片的EC2 UltraClusters中,從而可以在更短的時(shí)間內(nèi)訓(xùn)練大型語言模型和基礎(chǔ)模型,同時(shí)將能源效率提高近兩倍。大模型超高的能耗一直是尋求碳中和的企業(yè)必須面臨的問題,而Trainuim2將有效地幫助他們減少應(yīng)用大模型帶來碳足跡。
模型工具服務(wù)層:
宣布支持幾乎所有主流開源大模型
有了足夠的算力,還需要對模型進(jìn)行訓(xùn)練、微調(diào)和繼續(xù)訓(xùn)練。而亞馬遜云科技的生成式AI服務(wù)Bedrock也宣布推出新的功能。其中之一是為客戶提供更多的模型選擇,用于構(gòu)建和擴(kuò)展生成式AI應(yīng)用。這包括來自Anthropic、Cohere、Meta和Stability AI的新增模型。例如Anthropic的Claude 2.1提供了業(yè)界領(lǐng)先的 200K token上下文輸入創(chuàng)庫,同時(shí)還提高了推理準(zhǔn)確性。Anthropic CEO在re:Invent 2023上介紹,Claude 2.1將開放式對話中的幻覺減少了 50%,虛假陳述減少了2倍,而這兩種情況都是企業(yè)采用人工智能的核心障礙。亞馬遜云科技今年還與Anthropic達(dá)成戰(zhàn)略合作,Amazon Bedrock的客戶還將享有獨(dú)家早期使用權(quán),體驗(yàn)其他地方無法使用的Claude定制和微調(diào)模型功能。
很多企業(yè)面臨的一個(gè)問題是如何選擇自己的基礎(chǔ)模型,亞馬遜云科技還針對這一痛點(diǎn),“貼心地”推出了Bedrock模型評估服務(wù)。
模型評估包含自動(dòng)評估和人工評估兩類。在自動(dòng)評估中,開發(fā)人員可以使用Amazon Bedrock控制臺(tái),選擇他們想要評估的模型,例如Amazon Llama、Amazon Claude 2或Amazon Stable Diffusion等。Amazon Bedrock可以評估模型在摘要總結(jié)、文本分類、問答和文本生成等任務(wù)中的性能指標(biāo),如穩(wěn)健性、準(zhǔn)確性和安全性等。
在評估過程中,亞馬遜云科技提供測試數(shù)據(jù)集,但企業(yè)也可以將自有數(shù)據(jù)引入基準(zhǔn)測試平臺(tái),以更好地匹配自身業(yè)務(wù)場景,選擇最適合的模型。至于人工評估,客戶有選擇與亞馬遜云科技評估團(tuán)隊(duì)合作或與自己團(tuán)隊(duì)合作的權(quán)利,以確保對模型性能進(jìn)行全面審查和評估。
大會(huì)還介紹了亞馬遜云科技的Amazon Titan大模型系列,可以讓企業(yè)根據(jù)業(yè)務(wù)場景選擇合適的模型服務(wù)。以電商為例,客戶可以先用文本嵌入模型將服務(wù)用語和售后政策轉(zhuǎn)化為向量,方便客服人員進(jìn)行模糊搜索。
客戶還可以將產(chǎn)品比如皮鞋的細(xì)節(jié),包括材料和功能轉(zhuǎn)化為Prompt輸入到到Amazon Text Express模型中,以生成詳細(xì)的產(chǎn)品描述。模型還可以為我們生成多種多樣的試用場景,讓產(chǎn)品描述更貼近生活,客戶更容易產(chǎn)生共鳴。
營銷部門需要為這款鞋生成一系列的搜索關(guān)鍵字,到搜索引擎購買關(guān)鍵詞,給網(wǎng)站帶來更好的流量。這種簡單的任務(wù),顯然可以用Amazon Text Lite小模型即完成了任務(wù),對比調(diào)用較大型的模型,消耗更低的成本。
而有了Amazon Titan多模態(tài)嵌入模型,企業(yè)可以把這款新鞋子的圖片和文字描述一起轉(zhuǎn)成向量存起來到向量數(shù)據(jù)庫里。這樣假設(shè)有一個(gè)客戶在大街上看到了其他人穿這雙鞋子,他只需要拍下照片,不需要認(rèn)識(shí)品牌就可以檢索到這雙鞋子。
最后,網(wǎng)站設(shè)計(jì)師需要為這款鞋進(jìn)行營銷投放定制宣傳的圖片,把比如給產(chǎn)品增加一個(gè)背景。Amazon Titan Image Generator可以用自然語言生成這樣的圖像。
生成式AI應(yīng)用層:
智能助理Amazon Q問世
亞馬遜云科技首席執(zhí)行官Adam Selipsky的介紹,員工可以使用亞馬遜 Q 進(jìn)行對話、解決問題、生成內(nèi)容、獲取洞察,并通過無縫地利用企業(yè)信息庫、代碼、數(shù)據(jù)和企業(yè)系統(tǒng)來進(jìn)行決策。
Amazon Q 可以快速連接到企業(yè)業(yè)務(wù)數(shù)據(jù)、信息和系統(tǒng),這樣員工就可以進(jìn)行定制對話、解決問題、生成內(nèi)容并采取與您的業(yè)務(wù)相關(guān)的行動(dòng)。Amazon Q 根據(jù)提供的材料和知識(shí)生成答案和洞察,并附上源文檔的參考文獻(xiàn)和引文。
例如新入職的員工可以向Amazon Q提問:“在哪里可以找到最新的品牌logo使用指引?”,Amazon Q 無需在多個(gè)系統(tǒng)之間切換即可找到您需要的內(nèi)容。由于 Amazon Q 了解后續(xù)問題,因此您可以繼續(xù)尋求更多幫助,例如,“在哪里可以找到我們logo的不同顏色組合?”,Amazon Q 將理解前一個(gè)問題的背景,揭示相關(guān)信息的位置。
對企業(yè)來說,Amanzon Q對于管理和工作流重構(gòu)都意義非凡。許多企業(yè)都面臨著相似的挑戰(zhàn):盡管企業(yè)擁有大量散布在多個(gè)文檔、系統(tǒng)和應(yīng)用程序中的信息,但無論是財(cái)務(wù)、人力資源、營銷還是銷售,每個(gè)組織的員工都花費(fèi)大量時(shí)間在日常工作中搜尋內(nèi)部信息、整理數(shù)據(jù)、編寫報(bào)告和制作演示文稿,還需要根據(jù)不同受眾進(jìn)行內(nèi)容調(diào)整。
Amazon Q 目前提供 40 多個(gè)內(nèi)置連接器,可以連接到常用的企業(yè)應(yīng)用程序和文檔存儲(chǔ)庫,包括 Amazon Simple Storage Service(Amazon S3)、Salesforce、Google Drive、Microsoft 365、Gmail、Slack和 Zendesk等。
打造負(fù)責(zé)任的AI
對于企業(yè)級應(yīng)用,生成式AI的安全和隱私保護(hù)一直都是企業(yè)關(guān)注的重中之重,本次大會(huì)也宣布了亞馬遜云科技在這些領(lǐng)域的新舉措。
例如正在開發(fā)中的Amazon Bedrock Guardrail,可以讓企業(yè)定制人工智能使用安全策略,從而保障用戶與大模型應(yīng)用之間的安全互動(dòng)。
企業(yè)可以將防護(hù)措施應(yīng)用于Amazon Bedrock中的所有大型語言模型,包括經(jīng)過精調(diào)的模型和Agent,確保企業(yè)客戶能夠在安全的前提下進(jìn)行創(chuàng)新。
Amazon Guardrail服務(wù)包含幾個(gè)安全策略功能:
拒絕主題:企業(yè)可以使用簡短的自然語言描述來定義在AI應(yīng)用的上下文中不期望出現(xiàn)的一組主題。例如,銀行可以配置其大模型不向客戶供投資建議。
內(nèi)容過濾器:企業(yè)可以配置過濾器來屏蔽仇恨、侮辱、性和暴力等有害內(nèi)容。盡管許多大語言模型已經(jīng)提供內(nèi)置保護(hù)功能,以防止生成不期望和有害的回復(fù),但GuardRail為企業(yè)提供了額外的控制,根據(jù)企業(yè)使用案例和負(fù)責(zé)任的AI政策,將生成時(shí)AI和用戶的互動(dòng)過濾到所需程度。更高的過濾強(qiáng)度對應(yīng)著更嚴(yán)格的內(nèi)容控制。例如電子商務(wù)網(wǎng)站可以讓AI不使用仇恨言論或侮辱性語言。
個(gè)人信息屏蔽:企業(yè)可以選擇一組個(gè)人身份信息,如姓名、電子郵件地址和電話號(hào)碼,在生成的大型語言模型響應(yīng)中進(jìn)行屏蔽,或者當(dāng)用戶輸入包含個(gè)人身份信息,系統(tǒng)可以進(jìn)行阻止。例如公用服務(wù)公司可以從客戶呼叫記錄中隱去客戶的個(gè)人身份信息。
利用AI制作虛假信息也是企業(yè)關(guān)注的風(fēng)險(xiǎn)點(diǎn),Amazon Titan Image Generator產(chǎn)生的所有圖像將自動(dòng)包含隱形水印。亞馬遜云科技希望找到一種方式來標(biāo)記圖像是由AI創(chuàng)建的,特別是由自家大模型制作的,這種標(biāo)記不會(huì)影響視覺效果,沒有延遲,并且無法被裁剪或壓縮去除。添加隱形水印,可以幫助企業(yè)解決信息真實(shí)性和AI內(nèi)容溯源等相關(guān)風(fēng)險(xiǎn)問題。
從全棧式搭建生成式AI技術(shù),到負(fù)責(zé)任的使用人工智能,可以看到亞馬遜云科技正在開發(fā)一站式、端到端的生成式AI企業(yè)服務(wù),從而大幅降低AI落地門檻。
生成式AI的普惠時(shí)代已來。從對最新技術(shù)發(fā)展的梳理中,我們也可以總結(jié)出大模型落地需要關(guān)注的創(chuàng)新與應(yīng)用挑戰(zhàn)。對于那些志在利用AI提升競爭力的企業(yè),無論處于哪個(gè)行業(yè)、那個(gè)發(fā)展階段,這些要素都值得管理者關(guān)注。
安健丨文