成本降低一倍,大模型訓(xùn)練性能提高兩倍!谷歌發(fā)布第五代TPU
2023-08-30 11:45:44 EETOP在29 日所舉行的Cloud Next 2023 大會上,Google Cloud 公開加速AI 運算的新款自研芯片Cloud TPU v5e,配備NVIDIA H100 GPU 的A3 VM 下個月上線,更宣布與AI 芯片龍頭NVIDIA 擴大合作伙伴關(guān)系。
NVIDIA CEO 黃仁勛出席Cloud Next 2023 大會力挺合作伙伴。
Cloud TPU v5e 專為精進大中型模型的訓(xùn)練、推理性能以及成本效益所設(shè)計。與上一代相比,Cloud TPU v5e 為大型語言模型提供的訓(xùn)練性能提高了2 倍、推理性能提高了2.5 倍。Cloud TPU v5e 成本不到上一代的一半,使企業(yè)能夠訓(xùn)練和部署更大、更復(fù)雜的AI 模型。
為了支持企業(yè)云端服務(wù),Google Cloud 整合加入20 個AI 模型,使總數(shù)達到100 個,透過其AI 基礎(chǔ)設(shè)施,可讓客戶使用包括Meta Llama 2 模型、Anthropic Claude 2 聊天機器人等,自由選擇最能滿足營運需求的AI 模型。
Google Cloud 也對既有AI 模型提高性能并添加功能,例如文字處理方面的PaLM 模型可支援用戶輸入更多文字量,以便處理篇幅較長的報導(dǎo)、書籍文章或者法院判決文件等。
這次Google Cloud 也推出企業(yè)級新工具,包括「SynthID」可為AI產(chǎn)生的圖片加上隱形浮水印,以人眼看不見的方式更改數(shù)位圖片檔,即使AI 圖片被編輯或篡改也能保有完整性。
Google Workspace 辦公套件將為用戶提供Duet AI 新產(chǎn)品,預(yù)計今年稍晚向所有用戶開放,可在Google 文件、試算表、簡報中運用AI 助手幫助更快完成工作。
EETOP 官方微信
創(chuàng)芯大講堂 在線教育
半導(dǎo)體創(chuàng)芯網(wǎng) 快訊
相關(guān)文章