<samp id="9uyrv"><em id="9uyrv"></em></samp><sup id="9uyrv"></sup>
<button id="9uyrv"></button>
<sup id="9uyrv"></sup>
<samp id="9uyrv"><em id="9uyrv"><blockquote id="9uyrv"></blockquote></em></samp>
<sup id="9uyrv"><div id="9uyrv"></div></sup><samp id="9uyrv"><em id="9uyrv"></em></samp><samp id="9uyrv"><legend id="9uyrv"><blockquote id="9uyrv"></blockquote></legend></samp>
<samp id="9uyrv"><legend id="9uyrv"><var id="9uyrv"></var></legend></samp>
浪潮信息彭震:加速智算系統創新,切實解決大模型算力難題
發布時間:2023-11-07  文章來源:中新網 點擊:623

  中新網北京11月7日電(邱牧子)2023年,生成式人工智能的爆發帶來了歷史性產業機遇,正在逐步改造重塑社會、經濟、文化等各個領域。

  浪潮信息董事長彭震近日在接受中新網采訪時稱,生成式AI蓬勃發展的背后,算力尤其是AI算力已經成為驅動大模型進化的核心引擎。但大模型時代的算力供給,與云計算時代的算力供給,存在很大的差異性。目前大模型研發已經進入萬卡時代,從事大模型研發的公司和團隊,普遍面臨“買不起、建不了、算不好”的困局。

  如何解決上述困境?彭震認為,需要以算力基建化改善算力供給,促進算力普惠,以算力工程化指導完善算力系統最佳實踐,提升算力效率,以模型訓練工具化手段,降低模型訓練門檻,推動全棧智算系統創新,通過“三化”融合互補,促進產業鏈條各環節協同配合,加速釋放大模型生產力,打造人工智能產業良好發展環境。

  一方面,要實現算力供給基建化,緩解“買不起”困境。彭震表示,大模型對海量算力資源的消耗,急劇抬高了準入門檻。除了通過政策引導、政策補貼等方式降低企業融資成本外,還應大力發展普適普惠的智算中心,通過算力基建化使得智算力成為城市的公共基礎資源,供用戶按需使用,發揮公共基礎設施的普惠價值。用戶可以選擇自建算力集群,或者是采用智算中心提供的算力服務來完成大模型的開發。

  在他看來,通過大力發展智算中心新基建,中國和美國大模型產業的發展已經呈現出完全不同的發展路徑。在美國,算力的私有化決定了大模型產業技術只能掌握在少數企業手中,而中國大力推動的算力供給基建化,為大模型創新發展提供了一片沃土,將使得整個產業呈現“百模爭秀”的全新格局。

  另一方面,追求算力效率工程化,化解大模型算力系統“建不了”難題。彭震直言,即使解決了算力供應的問題,通用大模型開發仍然是一項極其復雜的系統工程,如同F1賽車的調校一樣。F1賽車的性能非常高,但如何調校好這部賽車,讓它在比賽中不僅能跑出最快圈速,而且能確保完賽,對整個車隊的能力要求是非常高的。

  彭震認為,大模型不應是簡單粗暴的“暴力計算”,算力系統構建也不是算力的簡單堆積,而是一項復雜的系統工程,需要從多個方面進行系統化的設計架構。包括要解決如何實現算力的高效率、要解決算力系統如何保持線性可擴展以及算力系統長效穩定訓練問題等。

  “因此,化解大模型‘建不了’難題,根源在于提升算力效率。但目前業界開源項目主要集中在框架、數據、神經網絡乃至模型等軟件及算法層面,硬件優化的方法由于集群配置的差異,難以復用而普遍處于封閉狀態。這就需要具備大模型實踐的公司將集群優化經驗予以工程化,以硬件開源項目、技術服務等多種方式,幫助更多公司解決算力效率低下的難題?!迸碚鹫f。

  此外,還要通過模型訓練工具化,解決“算不好”難題。彭震表示,解決“算不好”難題,根本上要保障大模型訓練的長時、高效、穩定訓練的問題。例如,大模型訓練過程的失效故障,大模型訓練會因此中斷,不得不從最新的檢查點重新載入以繼續訓練,這個問題在當前是不可避免的。提高算力系統的可持續性,不僅需要更多機制上的設計,更依賴于大量自動化、智能化的模型工具支撐。

  由此,彭震進一步指出,模型訓練工具化保障手段,能夠有效降低斷點續訓過程中所耗費的資源,這意味著大大降低訓練成本并提升訓練任務的成功率,會讓更多公司和團隊參與到大模型創新之中。(完)

【編輯:付子豪】
另类乱子伦XXXX_五月天在线精品电影_中文有码国产精品欧美_思思热在精品视频观看