j9九游會登錄入口首頁“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因為預期缺少回報,市場對通用大模型的投資越來越謹慎,但同時越來越看好在具體領域的發(fā)展,因此j9九游會登錄入口首頁,所謂‘下半場’的重心應該在垂直大模型j9九游會登錄入口首頁,比如醫(yī)療、教育、交通或者某個制造業(yè)垂類?!?/p>
短短一年時間,國內(nèi)大模型從“百模大戰(zhàn)”,到如今被認為格局漸成。而“牌桌”上僅?!按竽P臀寤ⅰ焙突ヂ?lián)網(wǎng)大廠等少數(shù)“牌手”。越來越多的人開始發(fā)問,有關大模型競爭的“下半場”是否正在逼近?
在9月19日由成都市政府港澳辦主辦的“智匯天府AI啟航”蓉港澳三地交流活動上,電子科技大學(深圳)高等研究院執(zhí)行院長湯志偉在接受《每日經(jīng)濟新聞》記者采訪時,對此論斷的態(tài)度顯得較為謹慎。在他看來,從技術上講,現(xiàn)有大模型并不夠成熟、且仍在快速發(fā)展,相關技術還需要不斷創(chuàng)新,難論“下半場”的出現(xiàn)。
但反觀應用層面,一些改變確實正在發(fā)生。“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因為預期缺少回報,市場對通用大模型的投資越來越謹慎,但同時越來越看好在具體領域的發(fā)展,因此,所謂下半場的重心應該在垂直大模型,比如醫(yī)療、教育、交通或者某個制造業(yè)垂類。”而在他看來,這也將是我國在大模型領域能夠快速產(chǎn)生價值的重要方向。
自ChatGPT3.5問世以來,國產(chǎn)大模型層出不窮,有人統(tǒng)計,至少有300余個國產(chǎn)大模型已對外發(fā)布。但從話題度上看,似乎尚未出現(xiàn)絕對超越ChatGPT的國產(chǎn)大模型。
湯志偉指出,在通用大模型領域,美國優(yōu)勢較為明顯,我國還處于跟隨和學習階段。但在垂直大模型領域j9九游會登錄入口首頁,因為我國場景更加豐富,有助于對大模型進行垂直場景訓練,更好地促進大模型的性能評估和部署落地。
他格外強調(diào)“實體經(jīng)濟”的價值?!按竽P妥罱K目的是要為大家解決實際問題,它不僅要能推動經(jīng)濟轉型,還要能帶來收益。因此,應用場景對于大模型來說十分重要。因為我國非常強調(diào)實體經(jīng)濟和數(shù)字經(jīng)濟的深度融合發(fā)展,且實體經(jīng)濟是我國的強項,因此,在這一點上,我國擁有其他國家難以比擬的優(yōu)勢?!?/p>
湯志偉特別提到了去年國內(nèi)的“百模大戰(zhàn)”。在他看來,通用大模型領域,主要仍需靠世界級的頂尖龍頭企業(yè)進行突破,并向外開源共享。
而對于大部分面向行業(yè)細分應用場景的小型公司來說,無須重走高成本研發(fā)的道路,更多資源可以投向訓練垂直大模型,使其能符合企業(yè)獨特的發(fā)展需要。從這個意義上說,不同企業(yè)能開發(fā)出大量的行業(yè)垂直大模型。這一思路能降低企業(yè)使用大模型的成本,政府也應出臺相應政策鼓勵這類行業(yè)垂直大模型的開發(fā)。
垂直大模型的發(fā)展還將推動國內(nèi)大模型行業(yè)形成新的格局。在當天活動上,來自港澳的專家均提到對于推進與成都在人工智能領域的科研和產(chǎn)業(yè)合作的期望,大模型也是雙方關注的焦點。
如湯志偉所說,基于超算中心的平臺優(yōu)勢,成都算力水平在全國名列前茅,而成都萬億級電子信息產(chǎn)業(yè)中,不少環(huán)節(jié)與人工智能發(fā)展緊密相關,多所高校也為當?shù)胤e累了大量電子信息領域的人才。更重要的一點是,不同于港澳金融服務業(yè)的比較優(yōu)勢,成都在發(fā)展實體經(jīng)濟上明顯更勝一籌,雙方合作可以推動大模型的快速發(fā)展。
無論是通用大模型還是垂直大模型,都需要強大算力支撐。而湯志偉提到,尤其是我國芯片面臨“卡脖子”以后,算力資源的獲得難度進一步增大。目前,國內(nèi)已經(jīng)有公司進行科技攻關和市場轉化j9九游會登錄入口首頁,提升算力供給能力,但一來其與國外相比差距仍然不小,二來也需要進一步提升芯片性能、降低價格,讓更多實體經(jīng)濟企業(yè)“用得起、用得上”。
“計算芯片不是孤立的,與之相關的還有相應的軟硬件驅動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫、硬件環(huán)境等關鍵技術。”他指出,目前,我國對各環(huán)節(jié)的突破并不同步,部分器件不匹配當下所需,而各環(huán)節(jié)之間也存在不匹配的問題。因此,即便相關芯片單看性能或許已經(jīng)接近甚至達到國際一流水平,但生態(tài)缺失導致整體效應和系統(tǒng)效應不足,很多環(huán)節(jié)還是以進口為主。
這還可能造成一種“惡性循環(huán)”。如湯志偉分析,通過數(shù)十年的使用,這些主要依賴進口的環(huán)節(jié)得以創(chuàng)新迭代并實現(xiàn)發(fā)展,相比之下,國產(chǎn)化環(huán)節(jié)則剛起步,同樣需要經(jīng)歷創(chuàng)新迭代的過程。我們在環(huán)境“倒逼”下可能縮短周期,但無論如何要“先用起來”。
總而言之,軟硬件驅動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據(jù)庫和其他硬件環(huán)節(jié)的突破也應同步推進。而若放在信創(chuàng)產(chǎn)業(yè)下來講,同樣需要一種整體性的思路j9九游會登錄入口首頁,“現(xiàn)在是部分局部問題解決了,但只有整體問題解決了,才能算是真正解決問題?!?/p>
而當談及國產(chǎn)大模型的迭代時,湯志偉還提到數(shù)據(jù)方面的難點。他指出,大量高質量訓練數(shù)據(jù)是提升大模型準確性和廣泛適用性的關鍵因素。我們在準備高質量數(shù)據(jù)的時候,既要保證數(shù)據(jù)本身的準確性,還要考慮數(shù)據(jù)的多樣性和代表性。這樣才能更好地消除大模型普遍存在的偏見問題。
在國家“數(shù)據(jù)二十條”基礎上,2024年1月,國家數(shù)據(jù)局出臺的《“數(shù)據(jù)要素×”三年行動計劃(20242026年)》明確提出了數(shù)據(jù)要素的放大、疊加、倍增作用,以及帶動數(shù)據(jù)要素高質量供給、合規(guī)高效流通,這為各行各業(yè)的發(fā)展提供了堅實的數(shù)據(jù)政策支持。湯志偉認為,這對于我國數(shù)據(jù)規(guī)模和質量的提升均將起到重要作用,也將是推動大模型快速發(fā)展的又一關鍵利好。
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
第二屆數(shù)字公共治理論壇暨中國地方政府數(shù)字化服務能力發(fā)展報告(2023)發(fā)布會在電子科技大學舉行
川企大調(diào)研·尋找新質生產(chǎn)力丨“百模大戰(zhàn)”風起云涌,四川如何破局行業(yè)大模型 “墻內(nèi)開花墻外香”?
電子科技大學(深圳)高等研究院執(zhí)行院長湯志偉:面向行業(yè)的垂直大模型將是我國實體經(jīng)濟和數(shù)字經(jīng)濟深度融合發(fā)展的重點
昨夜,全球大漲!道指、標普500指數(shù)創(chuàng)歷史新高,中國資產(chǎn)大爆發(fā),特斯拉市值一夜大增3774億元