首页

2026 暑期训练营

更新-260702 | 发布-260702

欢迎访问 2026 暑期训练营 主页。

此处主要补充 【1班】学科竞赛项目班 的项目相关信息。更多信息,请参考学院官微推文。

咨询支持

如需咨询训练营内容和获得技术支持,可联系以下接口人:

班级选择和人数限制

✳️ 参加训练营的同学,可最多选 2 个班。

✳️ 每个班,最多 30 人。超过 30 人时,按加入 QQ 群时间依次递补。

项目简介

本章节仅适用于 【1班】学科竞赛项目班。报名组队完成后,学院将通过云盘提供更多项目参考资料(如数据集、参考代码片段等),助力大家顺利开展项目。

❇️‼️ 以下项目简介供同学们在项目选题与开发时参考,非结营验收标准,欢迎在简介基础上拓展更丰富的实用特性。实现方式可参考简介中的技术思路,更鼓励大家采用创新的方案进行探索。‼️❇️

1-基于开源AI大模型的教学实训智能体软件

国家大力推进教育数字化战略,但传统实训教学中教师备课出题耗时费力、批改效率低下,学生缺乏个性化实时指导,规模化与个性化难以兼得。本项目要求开发一个基于开源大模型的教学实训智能体软件,实现教师智能备课设计、智能考核、学情数据分析与可视化,以及学生实时学习问答、资源推荐、练习纠错等核心功能,推动实训教学向智能化、自适应化转型。

同学们需基于开源大模型(如Qwen、DeepSeek等),采用LangChain等框架搭建本地知识库RAG系统(课程资料≤100M),分别构建教师端与学生端智能体。教师端可实现自动生成备课方案与多题型考核题目,并利用自动化评估技术对学生答案进行智能批改,输出学情数据可视化大屏(如知识点薄弱项、学习效果趋势);学生端支持7×24小时实时问答、个性化资源推荐及练习提交后的智能纠错与解析。最终系统需在典型课程场景下验证教师备课效率提升30%以上,学生答题反馈延迟≤2秒,并提供完整的Web交互界面与演示视频,鼓励进一步实现自适应学习路径规划或多智能体协同演练,为教育数字化提供可落地的智能化解决方案。

更多信息请参考:链接↗︎

2-基于FaceNet的多人身份识别考勤签到系统

传统考勤方式依赖人工点名、纸质签到或刷卡,存在效率低、易代签作弊、数据统计困难等痛点。本项目要求开发一套基于FaceNet的多人考勤签到系统,能够实时检测并识别教室内的多个学生人脸,自动统计出勤人数与缺席人员名单,打破现有考勤系统“只能统计人数、不知谁没来”的局限,实现高效精准的课堂考勤管理。

同学们需基于昇腾或鲲鹏开发板,结合摄像头,采用YOLOv5‑face进行多人人脸检测,利用FaceNet模型进行人脸特征提取与比对,构建B/S架构的Web考勤系统。前端实现通过摄像头拍摄或上传照片进行学生注册(学号与姓名绑定,学号唯一),并支持单张照片中多个学生的同时识别;后端开发板运行Web服务,完成特征比对与考勤数据存储;系统需分别统计上午、下午两堂课的出勤与缺席学生并计算出勤率。最终系统在典型课堂场景下对注册学生的人脸识别准确率不低于90%,单帧多脸处理延迟控制在1秒以内,并提供完整的Web交互界面与开发板部署演示,鼓励进一步实现考勤日志导出与可视化统计分析,为智能教室管理提供可落地的技术方案。

3-鸟鸣识别系统——服务于生态研究与污染指标监测的声学分析平台

传统生态调查依赖人工监听与目视观测,效率低、主观性强,难以长期持续监测鸟类种群动态及其对环境变化的响应。同时,鸟鸣多样性可作为生物指示指标间接反映污染程度与生态健康。本项目要求开发一套智能声学分析平台,能够自动识别多种鸟类的鸣叫声,并基于声景特征评估区域生态质量,为生态研究与污染监测提供数据支撑。

同学们需采用深度学习音频分类模型(如ResNet、EfficientNet结合梅尔频谱图),构建包含至少20种常见鸟类叫声的数据集,完成模型训练与轻量化部署。系统前端支持上传野外录音或实时麦克风采集,输出鸟类种类、置信度及时间分布;后端可进一步计算声学多样性指数(如生物声学指数、声学熵值),并建立与空气/水体污染指标的相关性分析模型。最终平台需在测试音频集上达到85%以上的平均识别准确率,单条音频处理时间小于2秒,并提供可视化看板展示物种识别结果、声学指数趋势及生态预警提示。鼓励进一步集成GPS定位生成鸟类分布热力图,或联动环境传感器数据展示污染-声景关联曲线,为生态保护与环境监测提供智能化分析工具。

4-基于机器视觉的纸筒外观瑕疵智能检测系统

纸筒是纺织、造纸、包装等行业的核心管状基材,其表面划痕、污渍、破损、压痕等外观瑕疵直接影响产品品质,甚至导致整卷纸张报废。传统人工目检存在速度慢、标准不统一、易疲劳误判等问题,难以满足现代产线对高速高精度的质检需求。本项目要求同学们设计并实现一套完整的纸筒外观瑕疵自动检测系统,覆盖硬件选型搭建、传统算法开发、深度学习模型训练部署及系统集成测试的全流程工程实践。

同学们需按六项任务逐步推进:首先调研至少4类常见瑕疵的视觉特征与检测难点,明确精度(≤0.5mm)、速度(≥30件/分钟)、漏检率(≤3%)等核心指标;根据纸筒尺寸(直径100mm、长度300mm)完成相机分辨率、镜头焦距的光学计算与海康产品选型,实物搭建并采集标准样本图像库。在海康VM平台上配置图像采集与预处理流程,实现Blob分析(污渍/破损)和边缘检测(划痕/压痕)两种传统算法;同时标注瑕疵数据(每类≥20张),训练YOLO模型并导出ONNX格式部署推理。将传统与深度学习策略融合判定,配置Modbus TCP与PLC通信,完成50只样本连续测试,统计分析漏检率、误检率及检测耗时。系统需输出带瑕疵标注的检测图像、统计报表及合格/不合格信号,提交完整实践报告与答辩PPT,鼓励实现360°旋转成像与拼接等创新功能。

5-楼道阻塞物智能检测与预警系统

当前居民楼道杂物堆积、电动车违规停放等阻塞现象普遍,严重威胁消防疏散通道安全,而人工巡检存在滞后性和盲区。传统巡检方式依赖人力,难以做到全天候覆盖,且在火灾等紧急情况下无法实时感知阻塞状态。本项目要求同学们开发一套基于计算机视觉的自动化检测系统,能够实时识别楼道中的阻塞物并触发预警,提升消防管理智能化水平。

同学们将采用深度学习目标检测算法(如YOLOv8),自行采集/标注楼道场景图像数据集(包括杂物、电动车、自行车、灭火器遮挡等阻塞物类别),完成模型训练与优化,并部署到边缘设备(如开发板等)或Web端实现实时视频流检测。系统需支持多路摄像头轮巡或单路实时分析,检测到阻塞物后自动截取带位置框的告警图片,记录时间、地点及阻塞物类型,并通过微信/钉钉/短信或本地声光设备发出预警。最终系统在典型楼道环境下需达到85%以上的检测准确率,单帧处理时间小于0.1秒,生成结构化日志供消防巡查人员追溯。鼓励进一步实现阻塞物滞留时长统计、夜间/弱光环境增强检测、可视化仪表盘展示阻塞高发区域及趋势分析,为社区消防安全管理提供完整的数据支撑和智能决策辅助。

6-基于改进YOLOv8的轻量化道路目标检测系统

在智能交通与自动驾驶场景中,道路目标检测需同时兼顾精度与实时性,但现有高精度模型体量大、计算复杂,难以部署于资源受限的边缘设备。本项目要求开发一个轻量化、高能效的道路目标检测系统,能够在普通GPU或嵌入式平台上实时识别车辆、行人、骑行者、卡车等目标,解决实际部署中的算力瓶颈问题。

同学们以YOLOv8n为基线,创新性地融合双层LWTA(局部赢家通吃)竞争注意力模块与TransformerBlock全局建模模块:在Neck特征融合路径中嵌入LWTA,通过分组竞争筛选关键特征,降低计算开销;在Backbone最深特征层添加TransformerBlock,捕获全局依赖关系,提升小目标(行人、骑行者)识别能力。使用BDD100K与KITTI混合数据集(约10000张)进行训练,改进后的模型在验证集上mAP50达到88.9%,较原始YOLOv8n略有提升,且行人、骑行者检测精度显著改善。进一步基于NiceGUI框架实现前后端分离的可视化系统,支持图像上传、预处理(亮度/对比度/降噪)、区域裁剪、实时检测、类别筛选与结果导出。在RTX 3050 Laptop GPU上单张图像检测延迟满足实时性要求,系统运行稳定,为交通监控与辅助驾驶提供了高性价比的轻量化解决方案。

7-面向客服与管理者的自然语言交互式数据分析平台

企业客服需快速从后台数据库(如MySQL)中获取用户保单、缴费记录等信息以应答客户咨询,管理者则需定期查看财务报表、业务趋势等数据辅助决策。传统方式依赖技术人员编写SQL或手动导出报表,响应周期长、人力成本高,且普通业务人员难以灵活查询。本项目要求开发一个自然语言智能查询系统,能够同时服务客服与领导两类角色,理解其用自然语言提出的查询需求,自动从多个数据源中抽取、分析数据,并以自然语言、图表、图片等形式直观反馈结果。

同学们需基于大模型(如Qwen、DeepSeek等)构建NL2SQL引擎,结合数据库Schema与少量示例,将用户自然语言转化为精准的SQL查询并执行;同时集成数据可视化组件(如ECharts)和自然语言摘要生成模块。系统需支持多轮对话与上下文理解,实现两类典型场景:客服端(如“查询张三的万能险账户余额及最近三期缴费记录”)和管理端(如“对比今年前两个季度各险种保费收入及同比变化”)。最终系统需在模拟企业数据库环境下,对常见查询的SQL正确率达到85%以上,单次查询响应不超过3秒,并提供Web交互界面,支持角色切换、查询结果自动生成图表与文字解读。鼓励进一步实现数据权限隔离、异常查询提醒及多轮追问分析功能,为提升企业内外部信息获取效率提供零门槛、智能化的解决方案。

8-浓烟环境下基于混合模态的人体目标判别系统

火灾救援中,浓烟会严重遮挡可见光,导致消防员无法快速定位被困人员,同时高温和有害气体进一步增加救援难度。传统视觉手段失效,而现有红外/热成像技术在浓烟环境下仍存在信号衰减、温度场干扰等挑战。本项目要求开发一套基于混合模态传感器数据(红外图像、热成像等)的智能识别算法,能够在浓烟中准确判别并定位人体目标,提升救援机器人的环境感知能力。

参赛团队需利用提供的多模态数据集(包含红外、热成像及模拟烟雾条件下的标注数据),设计并实现融合型深度学习模型(如双流网络、注意力机制或多模态特征对齐),有效应对烟雾衰减、局部高温干扰及遮挡等问题。算法需在嵌入式或边缘计算平台上达到实时推理要求(≥10 FPS),并在测试集上实现人体检测的平均精度(mAP)不低于85%,误报率低于10%。最终输出带置信度与位置框的检测结果,可进一步集成至消防机器人演示系统,为消防员提供清晰的人员定位提示,显著缩短浓烟环境下的搜救响应时间。

更多信息请参考:链接↗︎ 之【A25】浓烟环境人体目标判别

THE END