構建開放的軟件生態以推動AI落地應用
2024-09-18 06:14:38 Nancy,EETOP隨著人工智能技術的快速發展,AI堆棧正逐漸成為開發和部署AI應用程序的核心技術。在AI時代,要想實現價值最大化,就需要把整個基礎架構和AI應用很好的適配在一起。所謂AI堆棧,其實就是包括算法、模型和數據處理工具等一系列用于構建和運行AI系統的技術、框架和工具的集合。在整個AI解決方案堆棧中有很多不同的工作負載,它同時也適合不同的解決方案。
事實上,從算力基礎到操作系統、數據庫、大數據,再到應用,整個堆棧非常復雜。要保證每一層在不同XPU上的效率最高,就需要解決靈活部署的問題。在英特爾近日舉辦的“企業AI開放軟件生態媒體分享會”上,英特爾中國軟件技術合作事業部唐炯表示:“第一件事情就是要解構。現在沒有一家公司能夠提供一個非常完整的AI解決方案,還需要應用廠商、數據庫廠商,才能把AI解決方案搭建起來。”
唐炯,英特爾中國軟件技術合作事業部
“解構”其實就是指在AI解決方案中,哪些模塊可以被解構出來,并且能夠在任何設備上靈活部署,能夠在不同的XPU上分配工作負載時盡量減少手動編碼的需求,并能夠做數據保護。AI的理念,幾十年前就有。隨著算力的發展,從機器學習到深度學習,再到生成式AI,它也隨之日新月異的被賦予了更多的可能。
唐炯分享說:“隨著大模型的推進,現在討論的更多的則是落地企業AI,即如何借助AI,真正幫助企業發展。”他認為,推進AI無處不在需要考慮三件事:
l 第一,加速創新,激勵更多開發者進行AI開發與創新。
l 第二,價值最大化。讓AI的發展對個人、對企業產生價值,并使得AI的價值最大化。
l 第三,靈活部署。讓不同的軟件模塊靈活部署,從而能夠真正為企業提供一個完整的解決方案的堆棧。
在加速創新方面,關鍵是“開放”,也就是說能夠給圍繞軟件、應用,以及面向個人、面向企業的開發者提供一個更加開放的資源平臺。兼容性變得非常重要。因為從原來的機器學習、深度學習、生成式AI到今天,AI的基礎架構是非常多樣化的,不是每一個開發者都會在不同的平臺上去開發不同版本,所以需要更好的兼容性來適應異構的底層平臺。同時,怎樣通過不同的軟件模塊提升整個解決方案的可靠性和推理準確度,也是在整個加速創新中需要去考慮的事情。
唐炯表示:“軟件極大程度上地加速并優化了芯片的設計。從大的生態層面來看,不同方案、功能提供商之間的兼容是加速創新的重要部分。”
查禮,東方國信副總裁兼CTO
東方國信副總裁兼CTO查禮表示:“到了人工智能大模型,AI PC的時代,實際上我們更多轉向了生態協同,原來是軟硬協同,現在是生態協同。”
近兩年來,AI技術迎來新一輪的高速發展,同時也為業界帶來很多變革和機遇。查禮分享了以下四方面的變革:
l 第一,硬件環境的變革。從原來主要集中在通算密集型應用的硬件環境,切換到了XPU密集型計算,也就是包含GPU、ASIC等的密集型計算。
l 第二,交互體驗的變革。從原來的圖形界面,點按鈕、點菜單,變成了自然語言NLP交互,包括語音、文字等,這是交互體驗的變革。
l 第三,開發模式的變革。原來開發的方式是程序員編寫代碼,而現在開發方式已經充分地利用了大模型的技術。開發人員可以寫提示詞,讓大模型幫忙生成代碼。
l 第四,應用構建的變革。原來的技術體系是LAMP(Linux、Apache、MySQL、PHP)和Web服務加微服務,現在則需要經過微調的行業模型、知識庫,并且還得有RAG和Agent這樣的工具鏈能力。
查禮表示:“構建一個由AI驅動并賦能的、重塑的企業IT系統,這是我們作為一個軟件開發商所看到的機遇。”
查禮以客服為例,介紹了東方國信如何利用AI技術與現有系統相適應。AI系統本質上是一個流程化的系統,因此在開發AI時,必須將其與流程化緊密結合。在傳統客服領域,服務通常是規則化的,采取的是一問一答的形式,缺乏上下文記憶功能,這是傳統客服模式的局限。客服工作本身有著明確的流程化要求,例如,客戶提出一個問題后,系統需要知道接下來應如何處理。那么在AI大模型的框架下,就需要將其與原有的客服流程相對應。東方國信并不是完全獨立地開發一套新的應用,而是要重新構建并優化現有的客服系統,旨在為傳統的大型IT系統提供賦能,通過AI技術提升其性能和效率。
孟凡軍,海鑫智圣的算法研究專家
海鑫智圣的算法研究專家孟凡軍分享說:“大模型確實給大數據帶來了改變。不過其實IT界是信息行業,即一直在和信息交互。盡管現在提高了效率,但還并不具備真正的智能,僅僅是將流程規范化并自動化執行。未來,如果能夠實現與系統的對等溝通而無需長時間闡述需求,那將標志著我們真正進入了智能時代。因此,大模型作為智能時代的先驅,其主要作用是提升人類處理非標準化數據的能力。”因此,當其它云廠商都在采用各種各樣高大上的GPU去解決問題的時候,海鑫智圣則是在英特爾新推出的CPU基礎上,用英特爾的OpenVINO和oneAPI軟件來提高CPU適用的寬度,并提高了AI推理性能。
孟凡軍表示:“我們認為,在新時代到來的時候,只有20%的典型場景是需要一些新的設備和加速的方式去解決,而傳統的80%的場景是通過新的軟件技術和CPU推出一些新的特性來橫向擴展,在原來的基礎把根本問題就解決掉。”
英特爾一直致力于構建開放的AI生態,與生態伙伴一起實現資源協同,并從客戶的實際需求出發,基于豐富的軟件堆棧來打造多樣化的解決方案,推動企業業務升級。據介紹,今年上半年,英特爾投入并聯合生態伙伴推出OPEA(Open Platform for Enterprise AI)開源項目。OPEA實際是一個跟AI相關的開源社區,需要企業AI落地相關的不同廠商都能夠參與,共享各方的代碼和模塊,最后成為一個完整的企業級AI應用。據介紹,該項目旨在提升整個企業AI方案各個模塊間的兼容性,從而讓特定的AI提供商,比如模型、算法等廠商可以方便地開放其能力,也能讓解決方案提供商可以快速地選擇適合的模塊構建出解決方案,加速創新。
唐炯以英特爾至強為例,介紹了英特爾OPEA的項目理念。去年12月,英特爾推出的第五代至強處理器,可與上一代產品的軟件和平臺完全兼容,使企業客戶能夠升級并大幅增加基礎設施的使用壽命。而最新推出的至強6能效核處理器(Sierra Forest)和即將發布的至強6性能核處理器(Granite Rapids)也具有共通性,兩者支持相同的軟件堆棧,并且是平臺兼容的,可以為每個客戶按需提供正確的產品組合。
據介紹,全球范圍內一些頭部ISV已經加入OPEA,也有一些國內廠商加入。唐炯表示,未來一定會有更多的異構計算、創新應用和數據管理與治理方案,通過一個開放、透明的平臺,通過開源社區的貢獻,使得大家能夠更便利地了解到自身所處的位置,能夠在整個解決方案當中所做的貢獻以及可優化之處,不至于因為某一個大模型選擇錯誤而將整個應用推倒重來、重新編碼,所以這也帶來一個更加靈活的配置方式。