位置:
首頁
理論
王祿生 | 論法律領域對法律大模型的能動塑造

王祿生 | 論法律領域對法律大模型的能動塑造

來源:中國法學 發(fā)布時間: 2025-06-23 瀏覽:2192 次

法律領域對法律大模型的能動塑造 王祿生 東南大學法學院教授、未來法治與數(shù)智技術創(chuàng)新實驗室研究員

 本文發(fā)表于《中國法學》2025年第3期,因篇幅限制,注釋省略。作者身份信息為發(fā)文時信息。      

內容提要

 法律大模型是兼具技術屬性與社會屬性的大型技術系統(tǒng)。法律領域通過對價值追求、知識基礎、組織偏好、制度準備、認知結構的多重引導,調控法律領域數(shù)據(jù)、知識、組織、制度、符號等資源的生產、供給與配置,從而能動塑造法律大模型的功能表征、應用場景與擴散路徑。中國法律領域的資源稟賦與資源困境在技術動力與技術約束兩個層面塑造中國法律大模型的技術風格。因此,不應將法律領域單純視作法律大模型的應用場景和改造對象,而應賦予其破除法律領域資源困境的能動地位。這就要求以推動中國法律大模型自主創(chuàng)新為總體目標,協(xié)同領域內多層次意圖形成一致性能動塑造行動。在此基礎上,以組織資源為中心化約各資源之間的復雜互動關系,構建法律領域資源的優(yōu)化方案,打造符合中國式法治現(xiàn)代化核心要求的法律大模型技術風格。    

關鍵詞

法律領域 法律大模型 生成式人工智能 系統(tǒng)理論 能動塑造

目  次

 一、引言

二、法律領域能動塑造法律大模型的理論基礎

三、中國法律大模型的法律領域資源稟賦與資源困境 四、面向能動塑造中國法律大模型的法律領域資源優(yōu)化 五、結語    

一、引   言

2022年末以來,大語言模型加速迭代并日益在通用任務上表現(xiàn)出良好的泛化能力與涌現(xiàn)特征。然而,通用大模型廣而不專、全而不精的特點勢必催生其深度適配法律、醫(yī)療等垂直領域的時代需求。一般認為,非人智能體使法律人感到生存危機需要具備三個前提:不亞于法律人的專業(yè)技能;自主生長性,甚至產生意識;法律人與AI產生非常廣泛且日?;纳媛?lián)結。從長遠看,法律大模型可能改變法律知識的生產方式,并在諸多法律業(yè)務中展示出值得期待的潛力;同時,法律大模型在大參數(shù)訓練基礎上表現(xiàn)出來針對法律任務的涌現(xiàn)與泛化能力已經具備最初級層次的“自生長性”;更進一步,法律大模型的推廣可能建立人機協(xié)作的法律業(yè)務模式,從而形成與法律人日常業(yè)務的泛在聯(lián)結。盡管諸多對未來的暢想暗含AI取代法律人的隱喻,但該危機此前一直并不緊迫。法律大模型的出現(xiàn),則可能意味著法律人主體性自我消解的序曲已經奏響。

總體而言,學界當前圍繞法律大模型的專題研究相對有限,且聚焦硬幣的一面,即法律大模型對法律實踐、法律組織和法律職業(yè)的塑造作用。關于硬幣的另一面——“法律領域影響法律大模型”的研究則更為缺乏。從已有研究看,法律組織與法律職業(yè)者對法律大模型的影響是消極乃至消隱的:其要么被視作法律大模型的應用者,并可能因為技術素養(yǎng)不足導致技術推廣不力;要么被視作受技術“改造”的對象,因為擔心被取代而消極對待。在此敘事框架中,法律領域行動者被動卷入科技規(guī)訓大潮,“順從”地成為法律科技塑造法律現(xiàn)代性的自然延伸。上述視角過于簡化了法律大模型的研發(fā)與應用邏輯。事實上,法律大模型并非獨立于法律領域的“自主存在”,而是深深嵌入法律領域的數(shù)據(jù)、知識、組織、制度與符號資源之中,法律大模型的研發(fā)與應用結果由技術領域與法律領域共同塑造。這也是為何盡管具有相似的技術屬性,但法律大模型在不同國家的推廣差異顯著,有的方興未艾,有的淺嘗輒止;不同主體可能基于不同目的使用同一法律大模型技術,但其應用樣態(tài)可能相去甚遠。

本文嘗試探討法律領域對法律大模型的能動塑造作用。具體而言,首先在理論基礎層面揭示法律大模型兼具技術性與社會性的“大型技術系統(tǒng)”本質,以及法律領域如何對其能動塑造的深層機理;其次,分析中國法律領域的資源稟賦如何塑造中國法律大模型的技術風格,并在此基礎上梳理中國法律領域的資源困境給中國法律大模型帶來的系統(tǒng)性約束;最后,基于能動塑造理論,面向中國法律大模型的自主創(chuàng)新,提出破解法律領域資源困境的系統(tǒng)性方案。

二、法律領域能動塑造法律大模型的理論基礎

法律領域能動塑造法律大模型的理論將法律大模型視作大型技術系統(tǒng),認為法律領域的數(shù)據(jù)、知識、組織、制度、符號等資源通過相互作用,共同塑造該技術在法律領域的功能表征與最終形態(tài)。在該理論框架下,法律大模型既非本質主義的自主力量,亦非工具主義脫離領域目標的中立對象。技術先進性只是法律大模型研發(fā)、應用與擴散的必要非充分條件,法律領域可以通過對價值追求、知識基礎、組織偏好、制度準備、認知結構等進行目的性調控與引導,影響法律領域資源的生產、供給與配置,最終完成對法律大模型的能動塑造。

(一)作為大型技術系統(tǒng)的法律大模型

大型技術系統(tǒng)(large technological system)由技術史與科技社會學學者托馬斯·休斯提出,意指那些規(guī)模龐大、復雜性高,涉及眾多技術組件(如物理設備)與社會要素(如組織架構、技術標準、法律法規(guī))的系統(tǒng),比如電力、鐵路、電信等。相較于一般技術系統(tǒng)而言,大型技術系統(tǒng)的“技術動量”(technological momentum)使其在發(fā)展過程中不斷累積技術慣性,并在系統(tǒng)擴展和成熟后因失去可塑性和靈活性而愈發(fā)難以改變或停止。

法律(垂域)大模型是專門設計用于法律領域,旨在滿足法律場景對準確性、公正性的嚴格要求,具有極強法律語言理解、專業(yè)任務泛化和可信知識生成能力的一種基于大語言模型的生成式人工智能系統(tǒng)。它在本質上是由大語言模型的硬件組件(如算力、能源基礎設施)與作為社會要素的法律領域共同組成的大型技術系統(tǒng),兼具技術屬性與社會屬性。首先,法律大模型作為法律領域新型基礎設施,包含與用戶互動的前端系統(tǒng)應用,訓練與運行需要依托的服務器、云存儲等計算基礎設施,以及支撐訓練與推理的能源基礎設施。其次,在法律大模型研發(fā)與應用過程中,技術組件與社會要素密不可分,它既受制于人工智能技術的創(chuàng)新發(fā)展,又受制于法律領域圍繞技術創(chuàng)新與應用的價值追求、組織偏好、制度準備、認知結構的交織影響??梢?,實現(xiàn)特定目的的硬件設備、特定的技能和知識、龐大的物理架構以及組織的科層體制等都是法律大模型發(fā)展的動力之源,決定著法律大模型增長的持續(xù)性與演變的傾向性?!凹夹g發(fā)展的不順利,問題常常主要地不在技術本身,甚至也不在單一的社會原因,而在復雜的社會條件?!碑敿夹g創(chuàng)新無法與法律領域相容時,法律大模型的發(fā)展方向與速度均會受到實質制約。最后,在法律大模型的發(fā)展初期,由于“技術動量”不足,技術具有高度的靈活性和適應性,因此更可能受到法律領域的能動塑造。隨著法律大模型的技術擴散與深度應用,其“技術動量”日益積累并形成對法律領域不可逆的影響。

(二)作為行動領域與資源系統(tǒng)的法律領域

法律領域可以被理解為具有獨特價值目標、動態(tài)權力結構、系統(tǒng)規(guī)范體系和明確行為準則的功能性行動領域與復雜性資源系統(tǒng)。對外而言,法律領域是現(xiàn)代社會功能分化出的不可互相替代的社會子系統(tǒng),通過參照其與社會整體、相鄰子系統(tǒng)以及自身的關系而維持自主運行;在此過程中,法律領域通過創(chuàng)造和維護與環(huán)境的差異來建構自我,并利用系統(tǒng)邊界來調節(jié)這種差異,從而實現(xiàn)“自我指涉”的功能運作。對內而言,法律領域則是一個由特定規(guī)則、邏輯和權力關系構成的自主行動領域,行動者按照法律領域自身的符碼、綱要與程序邏輯生成意義并構建資源要素的再生產結構。法律領域通過數(shù)據(jù)、知識、組織、制度、符號等資源的生產、供給與配置,不斷調整領域的結構與功能,塑造自身的復雜性、多樣性與動態(tài)性。更進一步,根據(jù)社會系統(tǒng)“運作封閉”但“認知開放”的特性,法律領域在確保自身獨立性的前提下仍需與其他領域形成資源交換,從而維持自身的生產與供給??梢?,法律領域存在功能性或結構性的“能動性”,這種能動性在維持自我指涉中得以體現(xiàn),也即通過內部溝通和結構耦合對外部環(huán)境擾動作出響應。與法律大模型的“硬”組件相比,法律領域從技術基礎、理論積累、協(xié)作機制、規(guī)范保障、文化認同等“軟”維度為法律大模型研發(fā)與應用全鏈條提供不可替代的資源支撐。

法律領域數(shù)據(jù)資源是指用以支持法律大模型預訓練、優(yōu)化與運行的,以法律文書(包括裁判文書、合同文本等)、法律法規(guī)、法學論文等為代表的數(shù)據(jù)資源。法律領域數(shù)據(jù)資源由法律組織與法律職業(yè)群體在法律實踐過程中不斷產生,其生成過程嵌入了法律職業(yè)群體的價值追求、專業(yè)知識、實踐經驗,是法律領域共識的直接體現(xiàn)。相較于一般的數(shù)據(jù)資源而言,法律領域數(shù)據(jù)資源具有高度的專業(yè)性、權威性和規(guī)范性。

法律領域知識資源特指法律大模型研發(fā)過程中數(shù)據(jù)標注、價值對齊、指令微調等技術知識,以及法律大模型運用過程中法律提示、信息辨識、風險規(guī)避等技術素養(yǎng)。波蘭尼的知識論包含顯性知識與默會知識的二元區(qū)分。其中,顯性知識主要以書面文字、圖表和數(shù)學公式表達;默會知識則主要是指難以表達的、具有個體特質與情境依賴的實踐性知識。就法律大模型而言,以法律科技界的技術積累為核心的顯性知識與以法律理論界、實務界的技術素養(yǎng)為核心的默會知識,共同構成了法律領域知識資源。兩者的形成均源于法律習慣、價值、文化的共同塑造,在技術知識方面體現(xiàn)為嵌入法律專業(yè)知識和法律場景需求的客觀知識體系,在技術素養(yǎng)方面則表現(xiàn)為具體法律情境中使用技術的實踐經驗凝結。

法律領域組織資源是指支撐法律大模型研發(fā)、應用與擴散的,以組織偏好、組織結構與組織能力為核心內涵的資源網(wǎng)絡。組織理論框架下對于技術的研究,經歷了從強調決定論意義上技術對組織的影響到強調技術與組織互動的范式變遷。在上述轉變過程中,組織對技術的塑造作用日益受到關注,并逐步成為影響技術演化的關鍵資源。法律領域組織資源具有鮮明的領域特征。一方面,法律領域內各類組織的偏好深受法律職業(yè)者在個體與群體兩個層面的塑造。具體而言,個體法律職業(yè)者的行為偏好通過法律實踐的日常積累產生對法律組織偏好的微觀影響。在此基礎上,異質性的個體偏好依托組織環(huán)境實現(xiàn)協(xié)調與整合,逐步匯聚形成法律組織的整體偏好。另一方面,在結構功能主義框架下,法律領域各類組織的結構彈性又受到組織功能定位的深度影響。

法律領域制度資源是支持和規(guī)范法律大模型開發(fā)與應用的各類正式與非正式的政策指引、行業(yè)標準、倫理規(guī)范等。制度資源通過正式規(guī)則、非正式規(guī)范、物質手段和話語框架的有機組合,對法律領域的科技創(chuàng)新與應用施加各層面的激勵與約束。值得注意的是,法律領域制度資源并非所有社會現(xiàn)象的制度資源,而是特指由法律領域組織在個體與整體層面生產的,針對法律科技研發(fā)與應用的各類制度規(guī)范的總稱。 法律領域符號資源是指法律領域職業(yè)群體與接受法律服務的社會公眾對法律大模型的認可和接受度。

法律領域符號資源受法律領域思維模式、知識框架、決策邏輯等認知機制塑造。布迪厄認為符號資本是個體或群體在特定社會環(huán)境中獲得的尊重、榮譽、聲望和認可等以符號方式存在的資本,其本質是以認可和聲望為基礎的資源,具有無形性、象征性和稀缺性。我們可以將與榮譽、聲望相關的資本視作法律大模型的符號資源,即由于法律組織與法律職業(yè)群體認可以及信任等非物質因素構成的一種法律領域總體層面的信任和預期。

(三)法律領域對法律大模型的能動塑造機理

法律領域的整體能動性并非指向“意識主體”,而是指其作為一個行動領域與資源系統(tǒng),通過集體行為、文化規(guī)范、制度安排等方式,調控各類領域資源生產與供給,進而塑造法律大模型的功能表征、應用規(guī)范與社會接受度。法律大模型并非獨立于社會時空的“自主存在”,而是深深嵌入法律領域之中的大型技術系統(tǒng)。

1. 法律領域數(shù)據(jù)資源對法律大模型的能動塑造機理

法律領域數(shù)據(jù)資源的可及性和可用性直接影響法律大模型生成內容的全面性、實用性、時效性與準確性,進而深度塑造其法律語言理解、法律任務泛化和可信知識生成能力。其中,對法律法規(guī)數(shù)據(jù)的預訓練有助于強化大語言模型對法律條文體系結構、邏輯關聯(lián)和規(guī)范內容的“理解”,增進其運用法律規(guī)則解決法律問題的能力。同時,對法律文書的預訓練有助于大語言模型加強對法律表達的理解與應用,強化對法律案例的分析,并優(yōu)化在法律咨詢和法律論證等場景的表現(xiàn)。此外,若能充分利用電子合同等巨量法律文書資源,將有利于加強法律大模型在合同生成、解釋、分析等任務中的表現(xiàn)。更進一步,對法學論文的預訓練能夠幫助法律大模型加深對法學理論的掌握,提升其在法學認識論和方法論層面的能力,優(yōu)化其在法律思維和法律邏輯推理方面的表現(xiàn)。

2. 法律領域知識資源對法律大模型的能動塑造機理

法律大模型開發(fā)與應用的法律領域顯性知識主要包括:針對法律場景特定任務而設計和訓練的各類算法;數(shù)據(jù)采集、清洗、標注、管理的技術規(guī)范;開發(fā)和部署法律人工智能系統(tǒng)的行業(yè)標準與工程方案等。法律領域顯性知識為法律大模型的研發(fā)和應用提供了可復制、可操作、可驗證、可傳播的知識基礎與實踐框架,有利于技術開發(fā)與應用的標準化和一致性。與之對應,法律領域默會知識主要包括經驗與技巧層面的法律人使用法律大模型的技術素養(yǎng)。其中,技術認知素養(yǎng)決定了法律領域行動主體對法律大模型的感知和理解,并深刻塑造該技術被實際使用的方式;提示素養(yǎng)決定法律領域用戶能否高效、準確與法律大模型進行交互,并影響生成內容的準確性與可用性;信息辨識素養(yǎng)決定了法律領域用戶能否區(qū)分法律大模型生成內容的準確性與可靠性,從而有效避免知識幻覺,并確保人在回路的決策方式。在技術效能相同或相近的情況下,法律職業(yè)群體的技術素養(yǎng)(知識資源)將會在根本上影響其對法律大模型的理解與使用。

3. 法律領域組織資源對法律大模型的能動塑造機理

法律組織通過技術偏好、結構彈性、實踐場景限制和引導法律大模型的采用與實施。首先,組織技術偏好(文化)影響對技術比較優(yōu)勢、兼容性、復雜性的判斷,決定了組織對技術創(chuàng)新的采納。當法律大模型能夠契合法律組織業(yè)務需求時,該技術更可能被廣泛使用并加速擴散。其次,法律組織的結構特點,及其內部外部、橫向縱向之間所表現(xiàn)出來的組織彈性,決定了法律組織在面對法律大模型所帶來的機會與挑戰(zhàn)時,對其進行因應、吸收并轉化為實際效能的可能性。最后,法律大模型通過同形壓力和同儕競爭得以在組織間擴散。當法律大模型的研發(fā)應用成為一種行業(yè)普遍的潮流趨向,并演化為一種法律組織的壓力與目標時,法律組織為了增加自身的制度合法性,會在競爭性自我調適中相互模仿,并最終在推動法律大模型創(chuàng)新與運用方面趨于“同形”。隨著法律大模型在法律組織間擴散,法律組織本身成為其擴散的支持資源。

4. 法律領域制度資源對法律大模型的能動塑造機理

不同層次和不同屬性的法律領域制度資源通過激勵或約束的方式影響法律大模型的研發(fā)與應用。其中,政策指引是指各層級政法機關出臺的引導與規(guī)范法律科技研發(fā)與應用的各類指導性文件的總稱。政策指引能夠在不同顆粒度上引導法律科技的發(fā)展方向、優(yōu)化法律領域資金和資源配置,并有效管控法律科技風險。行業(yè)標準通過標準化流程和技術指標的設定塑造法律大模型的技術有效性、正當性與合法性框架。倫理規(guī)范為法律大模型的開發(fā)與使用提供倫理約束和底線標準,保障法律大模型在高速發(fā)展的同時兼顧對倫理正當性的關注。

5. 法律領域符號資源對法律大模型的能動塑造機理

法律領域符號資源供給的實質是法律大模型潛在用戶的態(tài)度、價值觀和信念趨同的過程。該資源通過影響法律領域行動主體的主觀認知而塑造法律大模型的研發(fā)、采用與擴散。這也是為何有學者認為,在決定采用技術時,圍繞技術感知形成的社會力量比技術的物理屬性更加重要。當法律領域對法律大模型高度信任時,意味著該技術符合領域的價值觀與符號體系,領域內行動主體將會對其產生更多期待,進而鼓勵相關主體投入更多資源支撐該技術的研發(fā)。因此,符號資源在很大程度上決定了技術最初被采用。更進一步,在法律大模型發(fā)展過程中,法律領域內行動主體的共同認可及專業(yè)信任會進一步降低推廣阻力、提升擴散速度。值得注意的是,技術的準確度并非主體對模型信任的充分必要條件,社會群體對法律大模型的信任度還與法律大模型背后算法的可解釋性與透明度相關。

三、中國法律大模型的法律領域資源稟賦與資源困境 法律大模型并非單純給法律領域施加影響的“技術物”,而是深受法律領域資源影響的“社會—技術物”。正因如此,中國法律大模型研發(fā)與應用在遵循技術邏輯的同時,還需要充分關注中國法律領域的資源稟賦與資源困境在技術動力與技術約束兩個層面的綜合影響。

(一)中國法律大模型的法律領域資源稟賦

中國法律領域的數(shù)據(jù)資源、知識資源、組織資源、制度資源和符號資源的充分積累所形成的資源稟賦塑造了中國法律大模型的技術選擇、路徑依賴與發(fā)展模式,形成具有鮮明政策導向與應用驅動的技術風格。

1. 法律領域數(shù)據(jù)資源稟賦

中國法律領域的全方位數(shù)字化轉型為法律大模型的訓練積累了存量豐富的領域數(shù)據(jù)資源。該數(shù)據(jù)資源決定了中國法律大模型本土化深耕和中文定制化的總體技術風格,以及適應中國語境的法律語義理解、法律推理和法律決策的目標定位。在法律法規(guī)方面,各種大型法律法規(guī)數(shù)據(jù)庫的建設為法律大模型的開發(fā)提供了天然的訓練數(shù)據(jù)集。例如,國家法律法規(guī)數(shù)據(jù)庫作為由國家立法機關建設的官方數(shù)據(jù)庫,收錄了包括憲法、現(xiàn)行有效法律、法律解釋、地方性法規(guī)等法律文本近2.65萬件,涵蓋了中國特色社會主義法律體系最主要的內容。在法律文書方面,國家與社會層面電子化法律文書的海量積累能夠為法律大模型提供充分支持。雖然在線公開的裁判文書為各法律人工智能研發(fā)主體提供了重要的支撐,但已公開部分僅是全社會法律文書數(shù)據(jù)資源池中非常有限的部分,比如僅2023年中國電子合同的簽約數(shù)量就達1337.1億份。在法學論文方面,存量巨大、增量可觀的電子化法學論文文獻也是中國法律大模型的重要數(shù)字資源基礎,僅最高人民法院數(shù)字圖書館就聚集了達1.929萬億字的1.505億篇文獻。

2. 法律領域知識資源稟賦

在科技創(chuàng)新領域新型舉國體制逐步健全的背景下,依托科技部國家重點研發(fā)計劃在公共安全、智慧司法等領域的項目布局,我國圍繞法律大數(shù)據(jù)、法律人工智能領域產出了一批關鍵的算法與模型,形成中國法律大模型研發(fā)的重要顯性知識基礎。有數(shù)據(jù)顯示,早在2018年,全球申請的法律科技專利中就有超過一半(51%)來自中國;次年,中國法律科技專利的占比更是上升到了61.9%。近年來,清華大學、北京大學、浙江大學、復旦大學、山東大學、東南大學等高校先后發(fā)布了PowerLawGLM、ChatLaw、智?!や泦?、DISC-LawLLM、夫子·明察、法衡等法律大模型。各科技公司也積極開發(fā)智慧法律系統(tǒng)、法律智能助手等面向法律行業(yè)的大模型產品與應用??梢姡斍案黝I域圍繞法律人工智能的深入探索為法律大模型的研發(fā)提供了較多的顯性知識資源。

在默會知識方面,中國數(shù)字法治實踐中“百花齊放”與“全體總動員式”的繁榮面貌助推了法律領域圍繞法律科技的知識啟蒙。正如技術社會塑造主義者認為的那樣,行動者傾向于通過熟悉的模式或者框架來理解新技術。一方面,法律領域的組織與個體在數(shù)字化、網(wǎng)絡化、智能化的不同階段圍繞前沿技術的部署應用、邏輯機理、風險問題等形成了豐富的默會知識;另一方面,社會公眾在數(shù)字法治轉型中也整體性、普遍性地提升了參與數(shù)字化司法活動的技術素養(yǎng)與實踐知識,在與法律人工智能的互動中生成了關于其基本概念、應用方式等方面的認知。這些都為法律大模型的研發(fā)與應用提供了充分的實踐經驗支持。

3. 法律領域組織資源稟賦

法律領域內各類組織的組織需求與偏好、較強的組織結構彈性與可塑性、圍繞技術應用的組織間壓力和競爭共同形成了中國法律大模型的領域組織資源稟賦。這一資源稟賦決定了中國法律大模型的研發(fā)與應用具有面向國家需求的全局動員特征,也決定了中國法律大模型仍然在一定程度上延續(xù)地方試點主義和同儕競爭相結合的技術擴散風格。

其一,在組織需求與偏好方面,法律大模型在法律領域具有廣泛的應用場景。智能技術應用一直以來都承載了正向、積極且熱切的期望,并被視為中國式法治現(xiàn)代化的新道路、新動能。政法機關不僅在應對“訴訟爆炸”、強化配合制約、優(yōu)化職權配置、提升法律服務等方面對法律大模型具有現(xiàn)實的組織需求,其作為國家層面的政治法律組織共同體,還通過國家推進主義與整體主義的組織行動路徑,銜接法律大模型創(chuàng)新的舉國體制與領域實踐,實現(xiàn)組織偏好的有效對齊。

其二,在組織結構與彈性方面,政法機關通過內部結構的專門調整,為法律大模型的引入提供了有力的組織支持。從自適應結構化理論來看,法律組織既為法律大模型提供應用場景,也通過自身內部結構的自我調適實現(xiàn)對法律大模型的自適應使用。在國家層面,最高人民法院、最高人民檢察院先后成立了人民法院信息技術服務中心、數(shù)字檢察工作領導小組等內設機構或協(xié)調機構,有效提升了應對智能化建設任務復雜性的組織結構彈性。在地方層面,各級政法機關也根據(jù)地方實際優(yōu)化組織內部的機構設置與職權配置,組建技術處、信息處等專門管理應用法律科技的內設部門來統(tǒng)籌信息化智能化建設??偟膩碚f,這些專門機構一方面具有規(guī)模上的彈性,在平常狀態(tài)下,負責組織內部技術應用的評估、保障等日常性工作,在涉及法律科技應用的重大專項時也能夠迅速組織大量人力物力資源;另一方面具有權責上的彈性,所負責的內容以技術為核心,能夠覆蓋組織內的各個業(yè)務領域,并有效服務于管理法律大模型的復雜性需求。

其三,在組織壓力與競爭方面,中國法律大模型有望在技術與組織的密切互動中獲得多維、多層的組織資源支持。作為“任務”的法律智能化改革催生了政法機關間的“同形”,即組織基于服從由權威產生的正式或者非正式壓力而導致的組織趨同。無論是數(shù)字法院建設還是數(shù)字檢察改革,乃至整個政法領域智能化改革,前沿技術的應用普遍遵循國家推動、頂層設計、官方主導的總體布局,并依托科層制下的“命令—服從”“目標—考核”機制自上而下地分解為工作任務得以實現(xiàn)。這種壓力使得法律組織迅速適應前沿技術的變革,通過大量“一線”探索創(chuàng)新來回應社會對組織正當性的需求。隨著法律大模型被納入頂層推動下的數(shù)字法治建設任務序列,組織間基于對技術應用本身以及完成技術應用任務的共同需求,形成一種“強制同形”壓力。與此同時,由于頂層支持的風向標與指揮棒效應,不同地域、層級、類型的法律組織圍繞前沿人工智能技術的應用展開激烈的同儕競爭。法律大模型作為最前沿的法律人工智能技術之一,對其的研發(fā)應用符合智能化建設推陳出新的總體要求。受此影響,不同組織就會逐步在結構和實踐上進行轉變,并最終在“模仿同形”的組織行動中擴散對于法律大模型的組織偏好。

4. 法律領域制度資源稟賦

作為中國式法治現(xiàn)代化的重要名片,數(shù)字法治的理論與實踐在近年來取得飛速發(fā)展。良好的制度準備被視作中國數(shù)字法治建設的重要優(yōu)勢?!蛾P于充分運用智能化手段推進政法系統(tǒng)頑瘴痼疾常治長效的指導意見》、《最高人民法院關于加快建設智慧法院的意見》(法發(fā)〔2017〕12號)、《人民法院信息化建設五年發(fā)展規(guī)劃(2019—2023)》(法〔2019〕79號)、《檢察大數(shù)據(jù)行動指南(2017—2020年)》、《司法部關于進一步加強司法行政信息化建設的意見》等規(guī)范性文件中明確了全面推進法律領域圍繞大數(shù)據(jù)與人工智能技術進行科技創(chuàng)新的重要政策導向。2024年12月26日,最高人民法院發(fā)布的《人民法院第六個五年改革綱要(2024—2028年)》(以下簡稱《六五綱要》)明確提出,強化大語言模型技術應用。以一系列“中華人民共和國法院行業(yè)標準”為代表的領域行業(yè)標準為法律大數(shù)據(jù)與人工智能的研發(fā)提供了全面的指引。政法機關還探索了法律大模型應用的倫理規(guī)范,如《最高人民法院關于規(guī)范和加強人工智能司法應用的意見》(法發(fā)〔2022〕33號)就關注了法律人工智能可能產生的倫理道德風險。不容忽視的還包括各類行業(yè)自律規(guī)范,如智慧司法技術總師系統(tǒng)、浙江大學、上海交通大學、阿里云計算有限公司、科大訊飛研究院聯(lián)合發(fā)布的《法律大模型評估指標和測評方法(征求意見稿)》也在產學研用共同體層面塑造法律大模型的研發(fā)與應用。

5. 法律領域符號資源稟賦

受數(shù)字法治建設的知識啟蒙,中國社會對于以大數(shù)據(jù)與人工智能為代表的法律科技保有較高的知悉度和認可度,認為其對于司法公正、司法權威、司法效率與司法便民均有顯著的正面效應。有調查顯示,近90%的中國公眾表示有興趣使用機器預測他們法律糾紛的結果,87.7%的受訪者認為引入大數(shù)據(jù)和機器學習將提高法律結果的確定性。從深層邏輯來看,法律領域作為社會治理的重要實踐面向,受到實用主義的影響,對技術適用秉持開放態(tài)度,這極大拓展了人工智能在法律領域適用的深度與廣度,為法律大模型的創(chuàng)新與發(fā)展創(chuàng)設了更為寬松的認知環(huán)境。同時,在法律領域積極運用法律大模型往往是特定機關積極跟進時代、推動改革的重要表征,能夠為政法機關獲得足夠的符號資源。與中國官方積極助推的態(tài)度不同,域外對法律大模型的態(tài)度較為保守。以美國為例,只有9%的受訪者認為應該在法庭環(huán)境中使用生成式人工智能;有93%的受訪者表示其目前并未使用并且在可預見的階段也不會安裝人工智能技術系統(tǒng)。

(二)中國法律大模型的法律領域資源困境

中國法律領域資源稟賦盡管為中國法律大模型的研發(fā)與應用提供了技術動力,但需正視的是,法律領域在數(shù)據(jù)準備、知識儲備、組織基礎、政策環(huán)境、認知傳統(tǒng)等方向面臨的多維資源困境,正對法律大模型的領域塑造形成系統(tǒng)性的制約與挑戰(zhàn)。

1. 法律領域數(shù)據(jù)資源困境

雖然當前中國有著巨量數(shù)據(jù)資源,但法律語料的總體比重極低,高質量法律語料更加有限。法律大模型所需要的法律領域數(shù)據(jù)資源存在可獲性和可用性雙重困境。

法律大模型數(shù)據(jù)資源的可獲性是指獲取法律文本數(shù)據(jù)的機會和可能性,主要涉及能否通過公開的數(shù)據(jù)庫或者渠道獲取法律大模型訓練所需的法律文本數(shù)據(jù)。雖然中國通過數(shù)字法治建設乃至整個數(shù)字中國建設實現(xiàn)了海量法律文本的數(shù)字化,但是法律大模型仍面臨著多種數(shù)據(jù)資源可獲性困境。

在法律法規(guī)方面,當前我國高質量法律法規(guī)數(shù)據(jù)庫主要由若干大型法律類商業(yè)平臺控制,免費開放型法律法規(guī)庫的數(shù)量、規(guī)模與法律大模型的開發(fā)要求不完全匹配。在法律文書方面,掌握大量法律文書材料的政法機關之間存在不同程度的數(shù)據(jù)壁壘,數(shù)據(jù)孤島情況嚴重;部分地區(qū)政法機關尤其是部分基層政法機關的卷宗電子化歸檔、數(shù)字化流轉等基礎的信息化任務還未完成;此外,存量豐富的電子合同因涉及大量的個人隱私與商業(yè)秘密,難以大規(guī)模地開放使用。在法學學術文獻方面,海量論文主要被收錄于商業(yè)數(shù)據(jù)庫,難以開放獲取。 法律大模型數(shù)據(jù)資源的可用性指法律文本數(shù)據(jù)能否被有效應用于法律大模型的預訓練,主要涉及數(shù)據(jù)的質量、格式、結構化程度等。法律行業(yè)作為一個具有濃厚職業(yè)化、專業(yè)化色彩的行業(yè),領域數(shù)據(jù)對于來源、識別、表達、傳播的規(guī)范性要求較高。實踐中,部分法律領域語料,如網(wǎng)絡問答等公開語料雖然具有較強的通用性與較大的數(shù)據(jù)體量,但是數(shù)據(jù)質量難以保證,隱含較大的偏差甚至錯誤風險。此外,雖然當前大語言模型基座訓練時愈發(fā)強調無監(jiān)督或者自監(jiān)督學習,但在開發(fā)法律大模型時仍需要基于海量法律領域數(shù)據(jù)對通用大模型基座進行微調以提升法律領域任務的表現(xiàn)。“微調”在中文語境具有一定誤導性?!拔ⅰ蓖ǔ1徽J為與較低工作量對應。實際上,微調分為局部微調和全局微調??紤]到法律大模型與通用大模型在源數(shù)據(jù)和目標任務上有較大差異,需要進行大比例甚至是全局意義上的“微調”,包括對模型的所有參數(shù)進行重新訓練和優(yōu)化,從而適應法律領域的需求。在此過程中,涉及大量精標的法律領域數(shù)據(jù),比如標注法律因果關系鏈、責任歸屬推導邏輯鏈、案件爭議焦點與法律依據(jù)等,這對法律職業(yè)群體的有效參與和知識嵌入提出了較高要求。因為法律文本中法律術語的復雜性、法律規(guī)范的變動性、法律淵源的多樣性、法律知識的地方性、法律認知的具身性、法律表述的差異性等,法律語料的標注需要具有專門法律知識的法律從業(yè)者花費大量的時間進行。這便制約了法律文本數(shù)據(jù)的高質量結構化處理,產生了法律大模型訓練中法律語料的可用性困境。

2. 法律領域知識資源困境

法律大模型作為垂域大模型,不僅依賴與通用大模型共通的基礎算法等知識底座,更需要場景化研發(fā)、工程化落地的法律領域技術知識。截至2025年4月,國家互聯(lián)網(wǎng)信息辦公室公布的已備案的340余項生成式人工智能服務中僅有寥寥數(shù)項法律大模型。這凸顯了現(xiàn)有基于通用模型領域微調的法律大模型技術范式在應對法律領域高精度需求、細粒度理解、復雜邏輯推理、長法律文本處理等專有需求方面的顯性知識困境。首先是模型訓練環(huán)節(jié)的困境。中國的法律規(guī)范體系具有高度復雜性,轉致規(guī)定、特別規(guī)定、例外規(guī)定乃至法條競合、法律沖突不同程度存在,因此,盡管法律大模型以大量法律法規(guī)文本作為基礎訓練語料,但作為基于模式識別的人工智能,還無法完全理解法律體系的層次結構、競合關系和規(guī)范沖突。同時,由于包括法律法規(guī)在內的法律文本以大量專業(yè)化、特定化的法律術語、法律概念為基礎,盡管法律大模型通過法律文本訓練能夠在一定程度上捕捉到法言法語與日常用語的差別,也能在一定程度上識別法言法語背后的語言模型,但仍然無法完全理解不同法律用語在不同法律文本中的細微區(qū)別。其次是結果輸出環(huán)節(jié)的困境。為避免知識幻覺出現(xiàn),法律領域要求法律大模型提供的信息是可驗證的,具有權威來源的支持。常見的技術框架有大小模型協(xié)同、知識增強、檢索增強等。以檢索增強(RAG)為例,該技術旨在確保法律大模型不僅可以提供答案,還可以指向答案來源的超鏈接。在RAG框架下,模型在回答問題或生成文本時能夠從廣闊的專門數(shù)據(jù)庫中尋找相關信息,從而提高回答的準確度。但RAG技術在信息檢索時,向量表示可能無法識別復雜法律用語之間的細微差別,進而造成概念混淆、答非所問??傊?,法律大模型的知識滯后以及知識幻覺等問題雖然可以通過采用RAG技術提供外接知識庫的方法在一定程度上得到緩解,但現(xiàn)有技術仍無法從根本上解決這一問題。

此外,雖然近年來中國的數(shù)字法治建設在整個社會形成了法律業(yè)務數(shù)字化轉型的積極氛圍,但法律職業(yè)群體在關于法律大模型的諸多默會知識方面仍有所欠缺,主要體現(xiàn)在:一是技術認知素養(yǎng)不足。中國通用大語言模型的商業(yè)化部署處于起步期,相當部分法律大模型也處于開發(fā)試驗階段。因此,目前中國社會對于法律大模型的技術機理及其在法律領域的典型應用場景等基本問題的認知仍較為不足。二是法律提示素養(yǎng)不足。精準的提示可以引導法律大模型更加接近提問者的詢問意圖,并生成更符合期待的內容。目前部分法律人在綜合運用法律指令提示、法律角色提示、法律案例提示、法律條文提示等默會知識方面的經驗不足,導致法律提示的準確性、層次性、有效性與完備性仍有較大提升空間。三是信息辨識素養(yǎng)不足。法律大模型的技術邏輯決定了其不可避免地出現(xiàn)知識幻覺,因此需要法律職業(yè)群體準確辨識生成內容的準確性并避免被錯誤信息誤導或操縱。上述信息辨識素養(yǎng)的獲得和提升,仍需要長期應用的經驗積累。四是風險規(guī)避素養(yǎng)不足。在法律大模型的自我學習進化機制下,應用者在利用其進行法律問答、案例分析的過程中可能產生個人隱私、商業(yè)秘密、國家機密的泄露風險。面對上述風險所應具備的風險規(guī)避素養(yǎng),也有賴于關于法律大模型技術認知、應用方法、信息分辨等默會知識的整體積淀。

3. 法律領域組織資源困境

在智能化建設的“同形”壓力下,法律組織圍繞法律科技進行攀比式競爭,法律領域部分智能技術的研發(fā)、部署與應用呈現(xiàn)出內卷化的態(tài)勢,甚至出現(xiàn)了以人工智能為噱頭而實際上只是經過包裝的傳統(tǒng)技術的偽智能。由此也就導致了“實踐中真正有用并投入常態(tài)化運營的法律人工智能系統(tǒng)并不普遍”。這種實效性不足在一定程度上影響了以政法機關為代表的法律組織對于法律大模型的熱情,使其在面對法律大模型時更加審慎。《六五綱要》明確提及的“加強對人工智能司法應用的審查監(jiān)管和風險評估”就體現(xiàn)出了最高人民法院對于前沿法律人工智能技術的研發(fā)部署應用將采取更慎重、更穩(wěn)健的態(tài)度。此外,由于在組織屬性、利益關切、財力物力等方面存在差別,不同政法機關推進法律大模型研發(fā)應用過程中的自發(fā)性、自覺性以及最終的建設成果存在顯著差異。中國人口龐大、地域遼闊、國情復雜的特征也決定了在同一政法機關系統(tǒng)內部,不同層級特別是不同區(qū)域的數(shù)字化、網(wǎng)絡化與智能化水平也存在很大差異。政法機關智能化水平的不均衡影響了法律大模型在法律組織間的技術擴散。不容忽視的還在于,作為法律共同體的律師事務所相對游離于法律人工智能的應用之外,可能整體上對法律大模型的應用需求與部署意愿不夠強烈。因為律師事務所具有社會性、市場化法律組織的原子化屬性,單個律師事務所通常無法負擔法律大模型開發(fā)應用的高昂成本,相對松散的組織間關系也難以通過組織整合與組織動員凝聚合力共同展開法律大模型的部署應用。

4. 法律領域制度資源困境

現(xiàn)有法律制度尚未有針對性地就生成式人工智能在法律領域的應用進行全方位的規(guī)劃與指引,整體呈現(xiàn)出激勵不足、約束缺位的雙重制度性困境。這導致法律大模型研發(fā)缺乏專項的政策扶持與財政保障,降低了市場主體的政策預期,并削弱了其投入研發(fā)的意愿。同時,法律大模型在性能指標、測試方案、部署標準等方面缺乏統(tǒng)一標準,致使市場主體因為信息壁壘、資源錯配及協(xié)同機制缺失等市場失靈現(xiàn)象而陷入不公平、不充分與不透明的競爭格局。例如,差異化的組織需求和監(jiān)管標準可能增加“一院一策”的負擔,顯著抬升市場主體的交易成本。此外,我國法律領域尚未針對生成式人工智能的應用出臺專門的倫理準則與安全規(guī)范,不僅導致無法對法律大模型的多重數(shù)據(jù)安全、倫理、隱私風險進行有效識別與防控,還使得對如何把握法律大模型的應用邊界缺乏可操作性的行為指引。

5. 法律領域符號資源困境

法律大模型面臨的多種知識幻覺影響了法律職業(yè)群體和社會公眾對法律大模型的信任度。通過加強專業(yè)性與準確性消除知識幻覺固然重要,但就文化認知層面的符號資源而言,準確度與信任度之間并非充分必要關系。對于法律領域而言,法律職業(yè)群體、社會公眾對于法律大模型的信任還可能和算法的可解釋性與透明度相關聯(lián)。算法可解釋性強調算法能夠“以人類可理解的語言向人類展示算法系統(tǒng)為何作出特定預測或決策的方法”。盡管在法律大模型的訓練過程中增加了與法律人的價值對齊,但其底層邏輯仍然呈現(xiàn)非線性學習特性(如數(shù)據(jù)驅動的增量效應),這就導致法律大模型算法決策路徑仍然難以追溯。此外,普通用戶缺乏分析和評估機器學習算法執(zhí)行的復雜操作結果的專業(yè)知識,認知上的局限可能導致即使技術上有所突破也難以實現(xiàn)有效解釋。盡管現(xiàn)有法律大模型可以在有效互動中為用戶提供分析過程的形式解釋,但此種形式可解釋性背后仍然是基于統(tǒng)計上的相關性而非真正的因果關系,本質是以復雜的方式按照算法和概率將輸入映射到輸出、剪切和粘貼文本。簡言之,法律大模型可能導致的知識幻覺與實質性解釋能力缺失的風險在一定程度上阻礙了以用戶認可與信任為基礎的符號資源的充分獲取。

四、面向能動塑造中國法律大模型的法律領域資源優(yōu)化

在推動中國法律大模型創(chuàng)新與應用時,不應單純圍繞技術談技術,而應將法律領域放置到能動塑造的關鍵位置,從協(xié)同和簡化兩個維度構建破解法律領域資源困境的改革方案。一方面,需要明確法律領域能動塑造中國法律大模型的總體目標,協(xié)同領域內多層次意圖,形成目的性干預、反思性調控、策略性選擇的一致性集體行動;另一方面,需要簡化法律領域內各資源之間的復雜互動關系,形成具有可操作性的數(shù)據(jù)、知識、組織、制度和符號資源的有效供給機制。

(一)以推動中國法律大模型自主創(chuàng)新為總體目標

在中國式法治現(xiàn)代化建設的背景下,應將推動中國法律大模型自主創(chuàng)新作為法律領域資源系統(tǒng)優(yōu)化的總體目標,自上而下統(tǒng)合法律領域各類資源的生產與供給,從而形成具有縱向對齊性與橫向一致性的系統(tǒng)性資源供給。要通過“集聚法律界和科技界力量進行原創(chuàng)性引領性科技攻關,突破法治領域科技發(fā)展的各種卡脖子難題,確立起中國在世界法治科技發(fā)展上的領跑地位”。這不僅要求在每類資源的生產與供給過程中主動創(chuàng)造條件與中國法律大模型創(chuàng)新的目標對齊,還要求法律領域的多元資源形成合力,共同向支撐中國法律大模型自主創(chuàng)新的目標聚集。

習近平總書記指出,要全面推進人工智能科技創(chuàng)新、產業(yè)發(fā)展和賦能應用,完善人工智能監(jiān)管體制機制,牢牢掌握人工智能發(fā)展和治理主動權。在此背景下,中國法律大模型的自主創(chuàng)新需要圍繞關鍵技術、應用場景、標準規(guī)范、行業(yè)生態(tài)、安全保障等方面的自主與可控展開。具體而言,關鍵技術自主可控要求中國法律大模型的數(shù)據(jù)處理、價值對齊、領域微調、算力支持等關鍵技術獨立發(fā)展,保障算法與模型架構自主、數(shù)據(jù)資源可獲可控;應用場景自主拓展強調面向中國法律領域的真實需求,在無需依賴外部技術的基礎上,持續(xù)探索法律大模型的場景化應用,是領域需求與技術能力深度耦合的產物;規(guī)范標準自主制定是指中國法律大模型的規(guī)范標準應以本土需求為關照,聚焦發(fā)展的主動權和國際話語權;行業(yè)生態(tài)自主建構的目標在于推動中國法律大模型從技術到應用、從硬件到軟件、從研發(fā)到商業(yè)化全鏈路生態(tài)的自主建構;安全自主保障關注中國法律大模型研發(fā)、部署和應用全生命周期安全保障技術與制度的自主化。

以中國法律大模型的領域能動塑造理論為關照,中國法律大模型的自主創(chuàng)新意味著依靠我國的科技力量全面掌握與法律大模型相關的數(shù)據(jù)資源、知識資源、組織資源、制度資源與符號資源,從而自主推進法律大模型技術的突破性進展,有效支撐中國式法治現(xiàn)代化建設。其中,數(shù)據(jù)資源和知識資源在很大程度上決定了中國法律大模型能否實現(xiàn)關鍵技術的自主可控;組織資源是中國法律大模型應用場景自主拓展的關鍵所在;制度資源是標準規(guī)范自主制定、安全自主保障的基礎和前提;數(shù)據(jù)資源、知識資源、組織資源、制度資源和符號資源共同支撐了中國法律大模型行業(yè)生態(tài)的自主構建。

(二)法律領域復雜資源系統(tǒng)的簡化機制

法律領域是一個典型的復雜資源系統(tǒng),其構成要素以非簡單方式進行直接或間接的相互作用。其中,符號資源與制度資源既受其他資源影響,又決定了其他資源的生產、供給與配置。比如,對法律大模型的高度認可意味著更多的組織支持和場景應用,制度資源則可以決定數(shù)據(jù)資源的獲取和使用方式。組織資源既在符號資源與制度資源的框架下運作,又通過組織運作實踐與反饋而調整制度資源與符號資源。數(shù)據(jù)資源、知識資源的稟賦深受制度資源的影響,其面臨的困境亦可以直接或間接推動制度資源的優(yōu)化。數(shù)據(jù)資源與知識資源之間也存在復雜的互動關系。比如,法律從業(yè)人員的技術素養(yǎng)影響對數(shù)據(jù)資源的生產和運用;法律從業(yè)人員參與數(shù)據(jù)資源的生產不僅影響模型的開發(fā),還通過反饋作用于知識資源,推動法律從業(yè)人員的技術素養(yǎng)提升。

若在法律領域資源系統(tǒng)優(yōu)化的過程中充分考慮各資源之間的互動關系,將使得資源供給策略變得過于復雜而失去可操作性。此時,需要在層次系統(tǒng)理論的指導下實現(xiàn)對領域資源系統(tǒng)復雜動態(tài)交互的有效簡化。層次系統(tǒng)理論認為,大規(guī)模系統(tǒng)通常面臨復雜性的問題,而將系統(tǒng)分解為層次化的子系統(tǒng)是復雜性系統(tǒng)最為核心的簡化機制;在復雜系統(tǒng)的層次架構中,高層次單元定義任務并協(xié)調較低級別的單元;各層次單元通過協(xié)調機制保證局部目標與全局目標的一致性。受制于社會系統(tǒng)之間弱耦合形成的“近似可分解性”(near-decomposability),各子系統(tǒng)在專注實現(xiàn)自身最優(yōu)狀態(tài)的基礎上,主要與關系最為密切的直接上層或者下層子系統(tǒng)進行交互與反饋。那種強調“萬物皆相互聯(lián)系”的全局交互理念在處理復雜問題時并無幫助,甚至可能會產生誤導。

在層次系統(tǒng)理論的框架下,可以基于功能層次將法律領域各類資源區(qū)分為宏觀、中觀與微觀三個層面。其中,宏觀層面主要包括作為整體意義上的符號資源與具有廣泛影響和基礎性作用制度資源。中觀層面是在認知和宏觀制度基礎上相對更為具象的概念,主要包括組織資源以及部分延伸至中觀層面的制度資源。微觀層面與法律大模型的技術直接相關,主要包括數(shù)據(jù)資源與知識資源。由此,法律領域復雜資源系統(tǒng)的優(yōu)化問題就可以被簡化為:宏觀層面的符號、制度資源確定領域資源系統(tǒng)的戰(zhàn)略性、全局性、認知性、制度性框架,并影響中觀層面和微觀層面領域資源的生產與供給。盡管宏觀與微觀資源之間存在直接交互可能,但為了避免各層次資源全面交互帶來的高度復雜性,在化約整體方案時,宏觀、中觀、微觀三個層面的領域資源主要與關系最為密切的上層或者下層領域資源互動。在此過程中,應以中觀層面的組織資源為中心,其通過銜接微觀層面與宏觀層面實現(xiàn)資源之間的流動與交換,確保整個領域資源系統(tǒng)圍繞推動中國法律大模型自主創(chuàng)新的總體目標展開。

選擇以組織資源為中心系出于理論、歷史與現(xiàn)實三方面的原因。其一,從理論上看,復雜系統(tǒng)需要一個控制中心或協(xié)調節(jié)點,以確保各子系統(tǒng)高效運行。在法律領域的復雜資源系統(tǒng)中,組織往往是資源整合的關鍵節(jié)點。它是直接作用于其他資源的調度器,通過規(guī)劃和整合能力對數(shù)據(jù)、知識、制度和符號資源進行有效配置和優(yōu)化。一方面,組織資源協(xié)調微觀層面數(shù)據(jù)資源與知識資源的生產,參與宏觀層面制度資源與符號資源的建構,并承接制度資源與符號資源的宏觀目標指引。另一方面,組織資源作為居中的節(jié)點還承擔反饋與調控的功能,可以匯聚數(shù)據(jù)與知識資源的反饋(如強化數(shù)據(jù)資源供給的建議)作為調整制度資源的依據(jù),以及以制度和符號資源設定的目標為指引調節(jié)數(shù)據(jù)和知識資源的具體生產。以組織為中心的資源供給機制既避免了脫離總體目標的碎片化、多方向的領域資源供給格局,又將領域資源系統(tǒng)復雜的資源互動與耦合關系簡化為可操作的管理機制。其二,從歷史維度看,自工業(yè)革命以降,組織始終既是技術研發(fā)和應用的重要場景,又是技術創(chuàng)新的關鍵推動者。技術創(chuàng)新往往通過“系統(tǒng)組裝”實現(xiàn),而系統(tǒng)組裝的關鍵在于組織資源的整合能力。其三,立基于中國法律大模型發(fā)展的現(xiàn)實背景,我國法律科技的改革長期以來奉行地方試點主義與同儕競爭相結合的路徑,這使得組織層面的政法機關一直是我國法律科技研發(fā)與應用最為核心的推動力量。

(三)法律領域資源供給的優(yōu)化方案 在優(yōu)化數(shù)據(jù)資源供給層面,以政法機關為代表的法律組織需要通過法律數(shù)據(jù)的開放與共享以及法律數(shù)據(jù)的標準化等舉措有效回應數(shù)據(jù)可獲性與可用性的困境,從而形成高質量、廣泛覆蓋的自主法律數(shù)據(jù)生態(tài)系統(tǒng)。2023年新一輪機構改革中正式組建的國家數(shù)據(jù)局為法律大模型數(shù)據(jù)資源的優(yōu)化供給提供了組織基礎。當務之急,是由國家數(shù)據(jù)局牽頭、各政法機關數(shù)據(jù)管理部門配合,形成“合作型數(shù)據(jù)治理格局”,共同推動構建法律數(shù)據(jù)的分級標準,將政法機關數(shù)據(jù)劃分公開數(shù)據(jù)、受限數(shù)據(jù)、敏感數(shù)據(jù)、涉密數(shù)據(jù)四大類。其中,公開數(shù)據(jù)為可向社會公眾完全開放的政法數(shù)據(jù),如已公開判決書、法律法規(guī)等;受限數(shù)據(jù)為不涉密但需控制知悉范圍的政法數(shù)據(jù),如案件流程數(shù)據(jù);敏感數(shù)據(jù)包括當事人身份信息等政法數(shù)據(jù);涉密數(shù)據(jù)則為涉及國家安全、重大公共利益的政法數(shù)據(jù)。在此基礎上,應明確全生命周期的法律數(shù)據(jù)分級管控措施:對于公開數(shù)據(jù),可以開放下載或對聯(lián)合開發(fā)的授權主體提供API接口;對于受限數(shù)據(jù),應允許在簽訂保密協(xié)議的基礎上,在內網(wǎng)環(huán)境部署數(shù)據(jù)沙箱進行法律大模型訓練,但原始受限數(shù)據(jù)全程不能離開政法機關服務器;對于敏感數(shù)據(jù),除了遵循受限數(shù)據(jù)相同的方案外,還需要在訓練前進行強脫敏處理,并且所有輸出結果均須經過差分隱私審核,確保無法反推個體信息;對于涉密數(shù)據(jù),則禁止任何意義上的對外共享。此外,可在“數(shù)據(jù)二十條”推動行業(yè)性數(shù)據(jù)流通使用的要求下,探索法律行業(yè)數(shù)據(jù)交易平臺與國家級數(shù)據(jù)交易場所的互聯(lián)互通,提供法律領域數(shù)據(jù)資源交易的良性環(huán)境。對于法律領域數(shù)據(jù)資源的可用性困境,法律組織可以搭建法律大模型研發(fā)的分布式參與機制,將法律大模型研發(fā)的任務分解為可以順便完成的小任務,嵌入到法律職業(yè)群體的日常業(yè)務流程,并允許法律職業(yè)群體在碎片化時間內以靈活的方式生產結構化領域數(shù)據(jù)資源,如在使用智能法律輔助系統(tǒng)時,允許法律職業(yè)群體隨手對生成內容進行“點贊”或“糾錯”。在此基礎上,可在國家級法律數(shù)據(jù)資源庫的建設過程中階段性地推進法律領域結構化數(shù)據(jù)的供給,保障社會公開或市場可交易的法律數(shù)據(jù)資源的模型訓練可用性。

在優(yōu)化知識資源供給層面,法律組織應在法律大模型研發(fā)應用的顯性知識與默會知識構建過程中強化法律職業(yè)群體與法律科技群體之間的互動,形成國家層面自主的法律大模型核心技術優(yōu)勢。一方面,相較于通用大模型而言,法律大模型具有極高的專業(yè)性、準確性與價值性需求,因此法律大模型訓練研發(fā)的具體流程應面向法律職業(yè)群體開放,引導法律人提煉有關法律領域價值的專家原則,協(xié)助構建法律領域指令數(shù)據(jù)的微調標準和法律輸出的驗證標準,通過引入法律職業(yè)群體的專業(yè)能力來彌補法律技術群體對法律規(guī)范體系和具體法律判斷的顯性知識缺陷。例如,用于實現(xiàn)法律大模型檢索增強的法律知識庫必然包括大量高質量法律知識及其來源,需要法律職業(yè)群體的合力建構。考慮到當前法律職業(yè)群體以顯性知識對法律大模型研發(fā)的參與度有限,法律組織應優(yōu)化體制機制為法律職業(yè)群體參與法律大模型的價值對齊、指令微調、輸出驗證提供正向激勵和流程便利,從而為領域顯性技術知識的優(yōu)化提供專業(yè)支撐。另一方面,法律組織應在培訓機制中充分發(fā)揮法律科技群體對于法律職業(yè)群體技術素養(yǎng)提升中的作用,針對技術認知素養(yǎng)、法律提示素養(yǎng)、信息辨識素養(yǎng)、風險規(guī)避素養(yǎng)等默會知識展開有針對性的、成體系的查漏補缺。

在優(yōu)化組織資源供給層面,以政法機關為代表的法律組織也應作為系統(tǒng)內部層次不斷地自我優(yōu)化,在強化與其他領域資源層次溝通的同時克服自身內部的資源困境。其一,政法機關應調適組織偏好,以更加務實和審慎的態(tài)度參與構建并應用真正實用的法律大模型系統(tǒng),尤其要避免以大模型為噱頭造勢而忽視其實效的應用。當然,審慎與務實絕非意味著對法律前沿科技的態(tài)度由“來者不拒”到“因噎廢食”。這就要求調整組織結構,建立一套以實用性和適配性為核心的法律大模型的事前評估機制,重點關注技術能否真實解決法律場景的業(yè)務痛點。政法機關不應過多沖到推動法律大模型在內的法律前沿科技突破性創(chuàng)新的“第一線”,而更應該為具有一定成熟度的法律大模型提供應用場景。在事前評估中,尤其要利用法律職業(yè)群體熟悉的案件場景(如民事糾紛或刑事審判)構建模擬場景,從而更加準確地測試法律大模型的具體應用效果。與此同時,法律組織還應當建立法律大模型適用后的動態(tài)評估與持續(xù)跟蹤機制,并基于法律職業(yè)群體的有效反饋而推動法律大模型的迭代優(yōu)化。其二,以律師事務所為代表的法律服務機構應逐漸成為法律大模型推廣與應用的關鍵主體。實際上,隨著技術的加速演進,法律大模型可以與法律人形成良好的人機協(xié)同關系,為全面提升法律服務的數(shù)量、質量與可及性帶來可能。因此,處于市場商業(yè)競爭環(huán)境中的律師事務所等更應充分發(fā)揮法律大模型的賦能作用,以人機協(xié)同的高質量法律服務在市場競爭中取得優(yōu)勢;組織規(guī)模更大的法律服務機構(如大型律所)可與科技公司合作,積極參與法律大模型的訓練研發(fā)。從結果上看,法律組織資源的自我優(yōu)化最終應實現(xiàn)法律大模型應用場景的自主擴展。

在優(yōu)化制度資源供給層面,法律組織也是形成法律大模型政策指引、行業(yè)標準、安全規(guī)范與倫理規(guī)范等的核心力量,這些制度資源的生產和供給應從激勵和約束兩個維度聚焦組織、制度與市場的有機協(xié)同,強化法律大模型的市場創(chuàng)新,并保障法律大模型的安全應用。最高人民法院、最高人民檢察院、司法部等可以發(fā)布法律大模型的政策指引,通過設置領域需求來引導市場主體積極投入法律大模型研發(fā);加快編制法律大模型(可信可溯源)的行業(yè)標準,明確性能指標、測試方案、安全需求、接口標準、部署方案等核心內容,為市場主體提供公平透明的競爭環(huán)境,避免過分強化組織資源而造成的權力尋租與市場扭曲的風險;及時出臺法律大模型的倫理規(guī)范,構建法律大模型的負面應用清單,提示法律大模型使用過程中的潛在風險,如國家機密、商業(yè)秘密與個人隱私的泄露等;指導法律職業(yè)群體識別可能由大模型生成的材料,并在法律組織內部構建法律職業(yè)群體負責任地使用法律大模型的正當程序。

在優(yōu)化符號資源供給方面,法律組織應積極構建第三方算法測評與算法審計相結合的可信法律大模型雙重保障體系。其中,算法測評關注法律大模型的準確性、穩(wěn)定性等技術指標,旨在量化評估法律大模型的“性能”與“效率”,是“技術導向”下消除法律知識幻覺的優(yōu)化工具;算法審計則重點圍繞“監(jiān)管”和“問責”展開,聚焦法律大模型的合法性、合倫理性、正當性、透明性與可問責性,通過倫理測試、數(shù)據(jù)溯源、多方驗證等方式確保法律大模型的“可信”與“可控”,是“治理導向”下提升可解釋性與透明度的優(yōu)化工具。算法測評與算法審計賦予法律組織有力的技術與治理工具,共同支撐了可信法律大模型的建設,有利于提升社會公眾與法律職業(yè)群體對法律大模型的信任度,實現(xiàn)法律領域符號資源的高效生產。在此基礎上,法律組織在確保法律大模型核心參數(shù)、訓練數(shù)據(jù)及其關鍵優(yōu)化細節(jié)安全的同時,可探索推動模型基本架構、算法原理、模塊劃分、推理代碼、評估數(shù)據(jù)集、測試用例等內容的有限開源,允許獨立第三方對法律大模型進行架構復現(xiàn)并展開驗證,但不能直接使用完整的法律大模型。更進一步,法律組織應積極搭建“開放性參與”的機制,吸收法律職業(yè)群體與社會公眾的有效參與,打造可公開、可解釋、可救濟的法律大模型。同時,針對不同受眾采取個性化的解釋方式,從而最大化提升公眾對法律大模型的信任度。

五、結   語

隨著法律大模型的加速迭代,其掀起的智能浪潮可能對法律領域帶來重塑性影響。因此,法律大模型的發(fā)展絕非單純意義的技術工具,而是關乎中國式法治現(xiàn)代化未來演進方向的重要命題。在此浪潮中,法律領域行動者不能止步于做法律大模型的技術應用者——擁抱技術固然重要,但這仍是技術決定論意義上的被動回應與消極防御。相反,法律領域行動者應以價值守門人、知識生產者、制度供給者等多重身份,能動介入法律大語言模型的進化與演進,塑造符合中國式法治現(xiàn)代化需求的法律大模型技術風格。這勢必是一個長期、漸進的,需要大家共同參與、體驗和創(chuàng)造的時代進程。盡管本文以法律大模型為關注點,但領域塑造理論的本質是研究法律領域的復雜資源網(wǎng)絡如何影響法律科技,因此同樣適用于其他技術與法律領域的互動分析。從更廣的維度看,強調法律領域對法律大模型的塑造作用,意味著技術發(fā)展并非基于純粹的技術邏輯,還可以從優(yōu)化中國法律領域的資源條件入手,為形成我國法律科技的自主創(chuàng)新優(yōu)勢提供理論資源,并與“高水平科技自立自強”的國家戰(zhàn)略形成對話。