![]()
论文成果
语料库增强的RAG大模型在中医汉语教学资源生成中的应用研究
- 发表刊物:
- 国际汉语教学学报,2026, 7(3): 168-181.
- 摘要:
- 研究背景
中医汉语教学具有语言要求高、知识专业性强的特点,教师难以精准贴合学生需求,多数教学实践仍依赖教师基于有限经验或通用教材进行内容调整,导致教学材料难以对接学习者的专业背景与实际语言需求。通用大语言模型直接应用于中医汉语教学面临严峻挑战,如中医语言保留大量古代汉语词汇与句法结构,存在古今异义现象,且核心概念具有高度文化负载性,通用模型易产生事实错误和语义误读。
研究亮点构建了融合自建专业语料库与RAG技术的动态生成框架,专门针对中医汉语教学资源生成。采用级联检索机制,先检索核心概念再调用解释性资源,提升生成质量和响应速率。通过结构化提示工程实现可控输出,内置教学计划、知识总结、问答和文化分析四类预设模板,动态调整语言复杂度。引入教学适切性规则和难度适配机制,确保生成内容符合学习者水平。
研究方法系统采用语料库 + 大语言模型 + RAG的三级工作框架。用户输入经预处理模块解析和关键词提取,触发级联检索机制:先在一级语料(高优先级事实锚点)中执行稠密检索,再根据用户输入和检索内容在二级语料(教学指导和文化拓展)中进行宽泛语义匹配,并结合教学适切性规则精选上下文片段作为RAG输入。生成阶段使用DeepSeek模型,通过结构化提示模板(如教学计划、知识总结等)生成Markdown格式内容,确保输出结构化和教学可用。
实验结果
实验通过双盲打分评估生成资源质量,邀请5位一线汉语教师对60份资源进行百分制评分。语料库驱动组在语言准确性(平均分88.60 vs. 83.41)、文化适切性(86.90 vs. 66.46)和跨文化解释力(85.38 vs. 71.75)均显著优于无语料库驱动组(p < 0.001)。教师访谈(10名教师试用7天)显示,系统显著提升备课效率,减轻跨学科知识整合负担,生成资源在术语规范性、难度控制和跨文化解释方面更具优势,但存在教学活动模式创造性不足和细分领域语料覆盖有限的问题。
研究结论语料库驱动的RAG框架有效克服了通用大语言模型在专业领域的知识幻觉和语域偏差问题,提升了中医汉语教学资源的生成质量和教学适切性。该系统减轻了教师备课负荷,推动教学内容从经验依赖走向规范化,具有重要的实践价值和战略意义。未来需扩展语料库覆盖范围(如针灸、中药配伍等细分领域),发展多模态方法和自适应生成机制,并增强创造性教学活动生成能力,以更好地满足多元教学需求。
引用此文: 周万勤、朱宇(2026)语料库增强的 RAG 大模型在中医汉语教学资源生成中的应用研究, 《国际汉语教学学报》, 7 (3): 168-181. DOI: https://doi.org/10.46451/ijclt.260413
- 是否译文:
- 否