AI基礎設施亮點:專為大模型設計的Ironwood處理器
新發(fā)布的谷歌第7代張量處理器(TPU)Ironwood。這款TPU專為大模型設計,比如大型語言模型(LLM)、混合專家(MoE)模型、推理模型,這類模型通常需要大量的并行處理和高性能的內(nèi)存訪問。
Ironwood的每個芯片峰值計算能力達到4614 TFLOPs,可應對AI工作負載,且Ironwood有兩種芯片配置(256個芯片和9216個芯片),當擴展到9216個芯片時,其運算能力可達42.5 exaFLOP,是全球最大超級電腦El Capitan的24倍+,適合用來運行復雜的AI模型。
谷歌還將Ironwood用來優(yōu)化AI超級計算機架構,提供更強大、高性能的計算資源給用戶。除此之外,AI超級計算機架構也有其他軟硬件更新,比如更好的集群管理、更好的GKE推理能力等,來供使用者訓練和運行模型。
AI基礎設施部分,谷歌云還推出一個網(wǎng)絡基礎設施新服務Cloud WAN,來提供高性能的網(wǎng)絡連接,供企業(yè)應對AI應用帶來的高度分散網(wǎng)絡需求。
AI智能體亮點:A2A協(xié)議、智能體管理、辦公流程自動化、威脅檢測
AI智能體是大會亮點之一。
首先,谷歌發(fā)布了一個Agent-to-Agent協(xié)議(簡稱A2A),讓開發(fā)者用來打造高互通性的智能體。也就是說,只要是按A2A協(xié)議開發(fā)的代理,就能跨平臺、跨服務彼此溝通。
這對使用者來說,可以選擇不同廠商的AI智能體組合使用,系統(tǒng)可以兼容這些不同來源的智能體。對企業(yè)來說,他們能在不同平臺或不同云服務間,統(tǒng)一管理各個智能體,減少技術負擔。這個A2A協(xié)議,目前已獲50多家企業(yè)支持。(如下圖)
不只如此,谷歌還在自家AI開發(fā)平臺Vertex AI中,新增很多AI智能體工具,比如智能體開發(fā)工具包Agent Development Kit(ADK),專門用來簡化AI智能體的構建、測試和部署執(zhí)行,據(jù)說不到100行代碼,就能完成智能體構建。而且,這款ADK還支持MCP協(xié)議。
在這個ADK中,還有2項用來開發(fā)和部署智能體的工具,分別是Agent Garden和Agent Engine。其中,前者包含可直接使用的智能體模板和工具,來協(xié)助開發(fā)者快速打造AI智能體,后者則讓用戶將AI智能體程序部署到正式環(huán)境時,不必重建整個智能體系統(tǒng),還能管理智能體程序的基礎設施、擴展性、評估、監(jiān)控和安全等。
不過,谷歌預計今年第三季度提供ADK公開預覽版。
另一項AI代理亮點是Google Agentspace新功能,包括企業(yè)用戶可直接從Chrome搜索框來使用Agentspace的搜索、分析和信息整合功能,也能通過Agent Gallery(代理庫)來快速導入各種智能體,或是部署谷歌自家智能體。這些Agentspace新功能,目前只開放白名單用戶使用。
此外,谷歌還打造AI Agent Marketplace市集,收錄第三方各種AI代理,來讓用戶即插即用。甚至,他們還推出一項實用的自動化流程工具Google Workspace Flows,用戶用自然語言描述想完成的流程,AI代理就會自動設計整個邏輯流程,不必寫程序就能完成跨應用的工作自動化。
就連這次新推的AI威脅檢測和反應服務Google Unified Security,都與AI智能體有關,借助新Gemini模型驅動的AI智能體來自動分析系統(tǒng)、檢測威脅并給予建議。