隨著DeepSeek、ChatGPT、Sora等人工智能大語言模型技術的迅速發展,學校緊跟新時代技術變革的趨勢,積極部署數字化賦能教育強國建設,深入推進中華民族共同體學交叉學科建設,推動知識大模型工作不斷取得進展。
近日,學校“民族文化智能計算與安全治理”科研團隊創新性地將人工智能技術與民族事務治理深度融合,成功上線“鑄牢中華民族共同體意識知識大模型”,探索出一條服務國家戰略需求、有效鑄牢中華民族共同體意識的新路徑。
該科研團隊由計算機科學學院張瀟副教授負責,團隊構建了民族工作領域首個大模型訓練自有語料庫。該語料庫以黨的民族理論政策、《中華民族共同體概論》教材、三交史等為養料(1324.4萬字),輔以涉民族領域法規數據庫、相關學術論文(4411.1萬字)。此外,從各級網站獲取約4000萬字語料以及1萬道問答對。形成了民族工作領域大模型建設的正能量內容供給,從底層邏輯上有效解決了大模型價值觀引導等問題。依托該自有語料庫,通過對基于Transformer架構的千億級別基礎模型Qwen2—7B—base進行增量預訓練、指令微調和檢索增強生成,打造面向中華民族共同體意識理解與價值觀對齊的大語言知識模型,并基于強大的自然語言生成能力,實現對中華民族共同體學領域知識體系的精準理解。

“鑄牢中華民族共同體意識知識大模型”登錄界面
目前,該模型已具備以下功能:一是支持互動式問答,可幫助用戶深入了解中華民族多元一體的歷史事件、文化習俗、傳統藝術等知識;二是快速定位中華民族共同體學領域的研究成果,支持知識圖譜構建;三是為《中華民族共同體概論》等相關課程提供教學資源動態更新,以及民族學文獻、口述史、非遺影像等資源的智能化采集與增量式擴充等多項支持;四是幫助用戶解析國家民族政策,分析全國民族團結進步典型案例,提煉可推廣的經驗模式。
該模型上線后,張瀟副教授團隊將繼續整合相關領域研究優勢資源,分階段推進“鑄牢”大模型系統完善。