2025-12-11 23:28:07 +08:00

5.3 KiB

Raw Blame History

DeepSeek-R1 32B 配置完成 ✅

📋 当前配置

API地址: http://127.0.0.1:11434/v1/chat/completions
模型: deepseek-r1:32b
温度: 0.2 (更精确)
最大Token: 800 (详细反馈)
Top-P: 0.9 (高质量输出)

🎯 32B模型优势

相比7B模型：

✅ 更强的语义理解能力
✅ 更准确的评分
✅ 更详细的反馈建议
✅ 更好的中文处理

🚀 快速测试（3步）

步骤1：验证DeepSeek服务

# 测试模型是否可用
curl http://127.0.0.1:11434/api/tags

# 应该看到：
{
  "models": [
    {
      "name": "deepseek-r1:32b",
      ...
    }
  ]
}

步骤2：启动Whisper服务

cd Test/python
python whisper_server.py

# 看到：
🎤 本地Whisper语音识别服务
📌 API接口：
  http://localhost:5001/health
  http://localhost:5001/evaluate

步骤3：重新编译并启动后端

cd Study-Vue-redis
mvn clean package -DskipTests

# 重启后端
# Windows: 双击ry-study-admin.jar
# Linux: java -jar ry-study-admin/target/ry-study-admin.jar

📊 预期日志

启动时：

DeepSeek本地大模型 (URL: http://127.0.0.1:11434/v1/chat/completions, 
                    Model: deepseek-r1:32b, 
                    状态: 运行中✅)

评测时：

🎤 Whisper识别结果: 你好世界
🧠 使用DeepSeek智能评分（语义理解）
调用DeepSeek: 你是一位专业的语音评测专家。请对以下语音...
✅ DeepSeek响应成功
✅ DeepSeek智能评测完成: 得分=95, 反馈=发音清晰准确，语言表达流畅自然，完全符合标准要求。建议：保持当前发音水平。

🎯 32B模型特别优势

1. 更智能的同义词识别

输入：

标准："你好"
识别："您好"

7B模型： 可能扣分 32B模型： ✅ 完全识别为正确（理解礼貌用语）

2. 更详细的反馈

7B模型反馈：

"发音清晰"

32B模型反馈：

"发音清晰准确，语调自然流畅。'您好'作为礼貌用语使用恰当，
体现了良好的语言素养。建议：可以尝试增加语速变化，使表达
更加生动。"

3. 语法纠错能力

能识别并指出：

语序错误
用词不当
语法问题
逻辑不通

🔧 性能优化建议

32B模型资源需求：

配置	最低要求	推荐配置
内存	16GB	32GB
显存	12GB	24GB
推理速度(CPU)	~8秒	~5秒
推理速度(GPU)	~1秒	~0.5秒

如果速度慢，可以：

启用GPU加速（如果有NVIDIA显卡）

# Ollama自动使用GPU，无需配置
# 确认GPU使用：
nvidia-smi

使用量化模型（速度提升2-3倍）

# 下载4-bit量化版本
ollama pull deepseek-r1:32b-q4

# 修改配置
private static final String MODEL_NAME = "deepseek-r1:32b-q4";

降级到7B模型（如果资源不足）

ollama pull deepseek-r1:7b

# 修改配置
private static final String MODEL_NAME = "deepseek-r1:7b";

📝 测试用例

测试1：基本评测

录音内容： "你好世界" 标准文本： "你好世界"

预期结果：

{
  "score": 98,
  "accuracy": 100,
  "fluency": 98,
  "completeness": 100,
  "pronunciation": 96,
  "feedback": "发音准确，表达流畅"
}

测试2：同义词识别

录音内容： "您好，今天天气非常不错" 标准文本： "你好，今天天气很好"

预期结果：

{
  "score": 95,
  "accuracy": 98,
  "feedback": "语义完全正确。'您好'='你好'（礼貌用语），'非常不错'='很好'（程度副词）"
}

测试3：语法检查

录音内容： "我昨天去了公园玩" 标准文本： "我昨天去公园玩了"

预期结果：

{
  "score": 92,
  "accuracy": 95,
  "feedback": "语义正确，但语序略有不同。建议：'去公园玩了'更符合中文表达习惯"
}

🎯 评分标准（32B模型优化）

准确度 (Accuracy)

100%: 完全一致或同义词
90-99%: 语义正确，表达略有差异
80-89%: 主要内容正确，细节有误
<80%: 内容有明显错误

流利度 (Fluency)

100%: 表达自然流畅
90-99%: 基本流畅，略有停顿
80-89%: 有明显停顿但可理解
<80%: 不流畅，影响理解

完整度 (Completeness)

100%: 完整表达所有内容
90-99%: 内容基本完整
80-89%: 遗漏部分内容
<80%: 内容严重不完整

发音 (Pronunciation)

100%: 发音标准清晰
90-99%: 发音清楚，略有口音
80-89%: 发音可辨，但不够清晰
<80%: 发音模糊，难以辨认

✅ 配置检查清单

DeepSeek API地址：http://127.0.0.1:11434
模型名称：deepseek-r1:32b
温度参数：0.2（精确）
最大Token：800（详细反馈）
Whisper服务已启动（5001端口）
后端已重新编译
后端服务已重启

🎉 下一步

✅ 启动Whisper服务
✅ 重新编译后端
✅ 在APP中测试录音
✅ 查看后端日志
✅ 验证智能评分效果

32B模型将提供最智能、最准确的语音评测！ 🧠✨

5.3 KiB Raw Blame History Unescape Escape

DeepSeek-R1 32B 配置完成 ✅

📋 当前配置

🎯 32B模型优势

🚀 快速测试（3步）

步骤1：验证DeepSeek服务

步骤2：启动Whisper服务

步骤3：重新编译并启动后端

📊 预期日志

启动时：

评测时：

🎯 32B模型特别优势

1. 更智能的同义词识别

2. 更详细的反馈

3. 语法纠错能力

🔧 性能优化建议

32B模型资源需求：

如果速度慢，可以：

📝 测试用例

测试1：基本评测

测试2：同义词识别

测试3：语法检查

🎯 评分标准（32B模型优化）

准确度 (Accuracy)

流利度 (Fluency)

完整度 (Completeness)

发音 (Pronunciation)

✅ 配置检查清单

🎉 下一步

5.3 KiB

Raw Blame History