2025年大模型技术高级研修班回顾
培训概况
2025年11月6日至10日,华科智研(北京)科技有限公司在北京中关村举办了”2025年大模型技术高级研修班”。本期研修班定位为高阶技术培训,面向具有一定编程基础和机器学习背景的科研人员和技术骨干,共有来自全国26所高校和科研机构的40名学员参加。课程内容涵盖大模型微调、RAG(检索增强生成)架构设计、智能体(Agent)开发和多模态大模型应用四大核心模块,由中国科学院计算技术研究所和清华大学自然语言处理实验室的专家联合授课。
大模型微调技术
研修班前两天集中讲解了大模型微调的理论基础与实战技巧。授课专家从预训练语言模型的基本原理出发,详细介绍了全量微调、LoRA、QLoRA等主流微调方法的技术细节与适用场景。在实操环节,学员们使用华科智研提供的GPU云平台,以ChatGLM3和Llama2为基座模型,分别完成了学术领域问答系统和科研文献摘要生成两个微调项目。来自中国科学技术大学的一位副研究员表示:“亲手完成一次完整的LoRA微调流程后,我对大模型定制化开发有了全新的理解,回去之后计划将微调技术应用到我们实验室的蛋白质结构预测项目中。“
RAG架构与智能体开发
第三天和第四天的课程聚焦RAG架构设计和智能体开发两大热点方向。RAG模块中,讲师系统讲解了向量数据库选型(Milvus、Chroma、FAISS)、文档分块策略、Embedding模型选择、检索排序优化等关键技术环节,并带领学员搭建了一套面向科研文献检索的完整RAG系统。智能体开发模块则以LangChain和AutoGen框架为核心,指导学员实现了具备自主规划、工具调用和多轮推理能力的科研辅助智能体。多个小组在实训中开发出了令人印象深刻的原型系统,包括自动化文献调研助手、实验方案生成器和科研项目管理Agent等。
多模态应用与结业展示
最后一天的课程介绍了多模态大模型的最新进展与科研应用前景,包括GPT-4V的图像理解能力、科研图表自动分析、多模态数据融合等内容。结业展示环节,8个项目小组分别汇报了五天来的学习成果与实战项目。评审专家一致认为,本期学员的技术水平和项目完成度均达到了较高标准。来自哈尔滨工业大学的团队凭借”基于RAG的跨语言科研文献智能问答系统”项目获得了本期最佳项目奖。华科智研(北京)科技有限公司宣布,将在2026年上半年推出”大模型技术精英班”系列课程,进一步深入探索大模型在垂直科研领域的创新应用。