意見領袖 | 馬天平
2022年底,OpenAI的ChatGPT橫空出世,掀起了人工智能語言大模型(LLM,Large Language Model)新浪潮,在全球經濟活動中,大模型也正扮演著愈發重要的作用。
生成式人工智能DeepSeek作為2025年中國發布的參數量約為OpenAI一半多的大模型,并沒有走向上萬億個參數的“參數越多越好”的模式。但卻在性能上超越了現有的很多開源模型,還在一些評測中不輸于世界頂尖的閉源模型,這成為中國發展人工智能大模型的一個標志性事件。
這一科技創新事件,激發了中國市場的經濟信心。因中國以更低能耗實現同等效果的輕量模型方式,在人工智能領域實現了創新。這讓上下看到經濟轉型的成效與更進一步高科技、高質量發展的可能性。深度求索DeepSeek-R1作為全球開源中的一例,“綠色、低碳、高效、前沿”、“高質量、高科技、低成本、小規模、小能耗”、更強的“泛化性、涌現性、推理性”一系列標簽,給“經濟新舊模式和新舊動能轉換”的追求打了一針強心劑。
01
為什么會出現“中國式”大模型?
近年來,尤其是2024年9月以來,政府盡力避免出臺收縮性負面政策,產業政策體現出呵護和休生養息的態勢。產業政策的變暖,疊加中國幾十年已經積累形成的技術進步,形成了厚積薄發。人工智能在助推中國經濟結構轉型上,開始逐步結出各種果實。
DeepSeek并沒有走20年前依賴數據標記的監督型機器學習之路,也沒有走MLP(多層感知器)、CNN(卷積)等神經網絡算法架構的“燒錢”之道,而是直接在Transformer算法框架基礎實施算法創新。拋棄常用的監督微調(SFT,Supervised Fine-Tuning)和強化學習PPO(Proximal Policy Optimization)架構,首先在預訓練的基礎模型上提升算法效率和芯片溝通效率:選擇MLA(Multi-head Latent Attention,多頭潛在注意力機制)結合非追求最高精度的混合精度訓練方式,以及MoE(Mixture-of-Experts,混合專家)實現參數協同,疊加PTX(Parallel Thread Execution,并行線程執行)語言調整芯片之間的通信互聯;其次是后訓練的推理模型上放棄初始人工標注、放棄有監督學習,讓大模型自身生成思維鏈并自動迭代后再人工標注;最后是不區分推理和基礎大模型,讓推理模型反向改進去融合基礎大模型,實現閉環迭代。
這反映出中國在全球化的基礎上實現“人有我優”,走的是開放式創新之路,既遵循 GPT式的預訓練路線,又遵循GPT以強化學習為核心的后訓練路線,而不是封閉式的自造之路。
關鍵是,杭州深度求索公司作為一家民營的、主營業務為非實體的、非人工智能的中小企業,并沒有耗用政府舉國之力的公共財政資金,卻做出了不亞于國有企業的創新成果,這也充分反映了中國民營企業的活力、中國民間創新的潛力,證明了中國市場經濟的強大韌性。
02
人工智能大模型如何助力中國經濟?
企業處于被政府管理和監督之中,也處于行業競爭之中。如果從企業的“政府方、行業方、自身方”三方來看,在經濟活動決策中,企業可以在各類人工智能模型基礎上結合語言大模型的方式,形成各種“新質生產力”。
首先,從政府看,企業可以利用人工智能分析全球不同政府制定不同政策情景下的經濟和環境影響,為科學決策提供數據支撐。尤其是中國政府作為強大的政府,高密度的中央部門文件與各個地方部門政策形成的文字、圖片、數據,可以成為企業的模型資料庫,有助于企業對政府政策方向明晰界定,從而決定自身的戰略方向。當政府出現政策逆轉的邊際變化時,計算模型通過添加“約束”性數學條件來改變企業目標,例如政府對房地產企業“三條紅線”的實施,使得房地產企業在制定新的計劃時,將受到強制性參數的約束,該約束條件將提示,禁止子企業向任意地區買地,確保政府監管成本最小化,企業違法違紀成本最小化。而且,經過調整的新數學模型輸出的結果,會通過LLM轉化為易于理解的政府語言答案,幫助政府決策者了解企業在被管理和被調控中的具體影響。這種方式不僅提高了政府監督企業產出過程中的透明度,還使得非技術背景的政府權力方能夠及時、提前或同步了解技術性企業是否被有效監管,而不是事后檢查與事后罰款。
其次,從行業看,企業從全球行業以及中國本土供應鏈上下游信息中,獲得海量詳盡數據。通過對行業信息建模,實現對行業中競爭對手的評估把握,從而進行差異化但又千變萬化的產品設計、材料選擇。對行業的歷史變動進行針對性搜索,對行業歷史科學文獻深度挖掘,從而預測未來的行業趨勢,幫助企業提前規劃在行業中的競爭策略。不僅如此,可以與行業中的供應商、客戶、投資者分別建立基于LLM的溝通交互平臺,共享數據。在交互中,大模型利用對方的人工查詢和交互提問,轉換為新的學習資料,對自身的原始模型進行優化,從而更好地適應對方供應商、客戶、投資人的具體需求。LLM也可以更有效地與公眾溝通,確定新聞媒體對企業產品及盈利水平變化的立場,形成敘事技巧,完成諸如社會責任、公眾輿論、社交媒體帖子、科普文章、互動體驗問答等。
第三,從內部看,企業可以利用自身的細節內部數據優化運營。企業內部的細節數據包括能源使用量、新增軟件代碼量、會議次數、生產數據新增量、企業內部前臺與后臺的供應鏈數據等,通過人工智能模型進行能耗測算、知識產權生產評估、員工工作情緒狀態捕捉、生產流程對接,從而確定供應鏈前后臺的松弛狀態,測算潛在的優化空間,提高自然資源和人力資源利用率,降低運營成本。尤其對于有成千上萬種細分品類和幾萬道工序的制造型企業,利用人工智能模型優化調度,減少制造足跡,將生產時間縮短或原料耗材縮減。在物流網絡規劃、設備運行運維、客戶服務等方面,精準定位,自動監控設備狀況并預測故障,自動生成精確的設備“體檢報告”,從而最大限度地減少設備停機時間,確保持續生產。在生產鏈條上,自動讀取實時和歷史數據,綜合分析并給出評估報告及建議。同時,利用LLM智能交互和推理決策能力,快速生成滿足高實時性和強可解釋性需求的內部文檔。對產品生產線進行極短時間和高準確度的評估,實時識別質量缺陷,立即糾正、減少浪費,實現迅速又精確的質量控制效果。
總之從宏觀經濟運行的細胞看,企業可以充分利用各種計算模型,融合LLM能力,不僅能實現自動化數據處理,還能通過情境學習和生成式輸出,助推企業實現經濟效益。多模態模型,能夠整合政府、行業、員工等多源數據,構建更精準的管理體系與風險預警體系,提高應對不利變化的能力。同時利用靈活的深度學習模型,來填補傳統建模中的空白,從而在多種異構數據集上使用,大大簡化計算成本,但卻能保持泛化能力。既不用像過去要投入過于昂貴的計算成本,又能讓準確性達到前所未有的新水平。企業在各種模型下得到大發展,則中國經濟將更能實現高質量發展。
03
是否需要防范過熱的“中國式大模型經濟”?
過去的經驗看,中國很多企業喜歡一哄而上,然后一地雞毛。每個企業是否需要上線語言大模型,需要客觀評估。如果政府強推、宣傳、倡導、補貼企業強上大模型,或者國有企業和地方官員為了迎合熱點新潮,為了讓自己的工作看起來屬于創新,可能陷入尬上大模型的形式主義做法,實際將對經濟造成虛假繁榮和實質傷害。
例如,當企業的生產模式較為簡單時,通過Excel表格測算即可,最多在EXCEL表格里調用幾個諸如VLOOKUP函數即可完成,那么沒有必要引入復雜的AI系統。而且,對于一些個體戶或小中型企業來說,投資于先進的AI解決方案,實際上并不符合投入產出原則,尤其是在沒有做好成本與收益測算的前提下。
而且,大模型本質上仍是一種概率模型,基于不同數據、報表、場景、模板和計算流程,會得出不同的概率結果,并不是剛性的100%一致和不變,無法提供絕對的確定性。即使不計成本地上線了大模型,但公司的數據量不足,數據不符合大模型訓練的基礎條件,也會導致大模型運行的結果并不有效。
就以杭州深度求索公司主營業務為例,其是證券類投資交易公司,公司主要通過發行私募產品,利用定量方法做好資產管理策略,為投資人提供波動性回報。但從其過往產品業績表現看,遇到不少的挑戰。
試想,如果人工智能大模型能像提款機一樣去市場交易提款,賺得盆滿缽滿,那么一個私募公司沒有必要去做非主營業務的人工智能大模型。或者說,正是因為投資業績遇到一定的挑戰,為了更好提高產品收益率,才通過開發大模型優化策略。從這個角度上說,大模型策略不是在金融市場投資交易的“提款神器”。
因此,我們沒有必要夸大大模型的邊界,至少在高度隨機性的證券投資交易市場,大模型仍是無力無能的禁區。
除了高度隨機性的金融市場,在中國大多數實體經濟微觀活動中,企業團隊應明白大模型的根本算法原理和能力邊界,其實際上的“生成”仍只是高概率下的一種信息結果,不應對其產生迷信和幻覺。如果默認“生成即合理”,不加推演,惰性地使用,只會讓團隊的實際處理問題能力變差。
如果因為使用人工智能模型過度控制員工,讓員工不再承擔責任,或者出現了錯誤和事故,將責任推給算法模型,認為自己的處理權限完全被算法模型剝奪,則會導致公司員工激勵機制出現問題。沒有激勵動力,就沒有人會事先明確指出企業的風險和不確定性,甘愿變為機器人和工具人,不對企業最終盈利和風險負責。因此,企業管理層應公開公司AI系統的運作原理,適度在混合專家(MoE)架構上增加提煉,形成反饋,以便員工了解背后的邏輯,參與公司內部的模型訓練,將AI作為輔助自己的工具而不是控制自己的工具,實現崗位價值的最大化。
人工智能模型,只有創新了活力,激發了信心,才能助推中國經濟走向更繁榮。
來源:中國社會科學網
(本文作者介紹:全球宏觀投資交易熱愛者,大學老師,央行博士后,清華五道口金融學院兼職研究員。)
責任編輯:曹睿潼
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。