将录播课视频与 PPT 讲义转化为考试导向复习大纲,自动生成模拟试题
基于 faster-whisper,完全本地运行,高精度且免费,保护隐私安全。
自动提取 PDF/PPT 文本,整合课件、视频逻辑与往年真题。
提取高频考点(带时间戳),自动对比往年真题对应关系。
一键生成 40+ 道选择题和填空题,附带详细知识点分析。
兼容阿里百炼(DashScope)与 Groq API,适配各种预算需求。
每个考点都标注视频时间戳,方便快速定位复习。
最标准的用法,将视频与对应 PPT 传入,生成带时间戳的学习指南。
python main.py "lecture1.mp4" --ppt "slides.pdf" --exams "past_exams.pdf"
输出:包含必学考点、可跳过内容、真题关联的学习指南 Markdown
针对紧急考试设计。无需视频,直接扫描 PDF 讲义,一键生成深度考点及模拟题。
python process_cv_exam.py
输出:全章节考点图谱 + 40 道选择题 + 6 道填空题 + 详细解析
不知道哪节课对应哪个 PPT?让 AI 自动帮你匹配。
python auto_match.py
输出:自动生成可执行的批处理脚本
在 Transformer 中,Self-Attention 的计算公式是?
A. softmax(QK)V
B. softmax(QK^T/√d)V
C. QKV^T
D. softmax(Q+K+V)
# 使用 Conda 创建环境
conda create -n coursedigest python=3.11 -y
conda activate coursedigest
# 安装依赖
pip install -r requirements.txt
在项目根目录的 config.yaml 中填入 API 密钥:
# config.yaml
api:
provider: "dashscope" # 或 "groq"
api_key: "sk-your-key-here"
model: "qwen-max"
支持:阿里百炼、Groq (Llama 3) 等
# 完整模式(推荐)
python main.py lecture1.mp4 --ppt slides.pdf --exams past_exams.pdf
# 批量处理
python main.py lecture1.mp4 lecture2.mp4 lecture3.mp4 --syllabus syllabus.pdf
# 考前突击模式
python process_cv_exam.py
基于 Python 3.10+ 开发,模块化设计,易于扩展和维护。
使用 CTranslate2 优化的 Whisper 实现,转录速度快 4 倍。
强大的 PDF 文本提取库,支持复杂表格和布局。
精心设计的提示词模板,确保输出结构化和高质量。