guoyu/log/DeepSeek配置完成-快速测试.md
2025-12-11 23:28:07 +08:00

5.3 KiB
Raw Blame History

DeepSeek-R1 32B 配置完成

📋 当前配置

API地址: http://127.0.0.1:11434/v1/chat/completions
模型: deepseek-r1:32b
温度: 0.2 (更精确)
最大Token: 800 (详细反馈)
Top-P: 0.9 (高质量输出)

🎯 32B模型优势

相比7B模型

  • 更强的语义理解能力
  • 更准确的评分
  • 更详细的反馈建议
  • 更好的中文处理

🚀 快速测试3步

步骤1验证DeepSeek服务

# 测试模型是否可用
curl http://127.0.0.1:11434/api/tags

# 应该看到:
{
  "models": [
    {
      "name": "deepseek-r1:32b",
      ...
    }
  ]
}

步骤2启动Whisper服务

cd Test/python
python whisper_server.py

# 看到:
🎤 本地Whisper语音识别服务
📌 API接口
  http://localhost:5001/health
  http://localhost:5001/evaluate

步骤3重新编译并启动后端

cd Study-Vue-redis
mvn clean package -DskipTests

# 重启后端
# Windows: 双击ry-study-admin.jar
# Linux: java -jar ry-study-admin/target/ry-study-admin.jar

📊 预期日志

启动时:

DeepSeek本地大模型 (URL: http://127.0.0.1:11434/v1/chat/completions, 
                    Model: deepseek-r1:32b, 
                    状态: 运行中✅)

评测时:

🎤 Whisper识别结果: 你好世界
🧠 使用DeepSeek智能评分语义理解
调用DeepSeek: 你是一位专业的语音评测专家。请对以下语音...
✅ DeepSeek响应成功
✅ DeepSeek智能评测完成: 得分=95, 反馈=发音清晰准确,语言表达流畅自然,完全符合标准要求。建议:保持当前发音水平。

🎯 32B模型特别优势

1. 更智能的同义词识别

输入:

  • 标准:"你好"
  • 识别:"您好"

7B模型 可能扣分 32B模型 完全识别为正确(理解礼貌用语)

2. 更详细的反馈

7B模型反馈

"发音清晰"

32B模型反馈

"发音清晰准确,语调自然流畅。'您好'作为礼貌用语使用恰当,
体现了良好的语言素养。建议:可以尝试增加语速变化,使表达
更加生动。"

3. 语法纠错能力

能识别并指出:

  • 语序错误
  • 用词不当
  • 语法问题
  • 逻辑不通

🔧 性能优化建议

32B模型资源需求

配置 最低要求 推荐配置
内存 16GB 32GB
显存 12GB 24GB
推理速度(CPU) ~8秒 ~5秒
推理速度(GPU) ~1秒 ~0.5秒

如果速度慢,可以:

  1. 启用GPU加速如果有NVIDIA显卡

    # Ollama自动使用GPU无需配置
    # 确认GPU使用
    nvidia-smi
    
  2. 使用量化模型速度提升2-3倍

    # 下载4-bit量化版本
    ollama pull deepseek-r1:32b-q4
    
    # 修改配置
    private static final String MODEL_NAME = "deepseek-r1:32b-q4";
    
  3. 降级到7B模型(如果资源不足)

    ollama pull deepseek-r1:7b
    
    # 修改配置
    private static final String MODEL_NAME = "deepseek-r1:7b";
    

📝 测试用例

测试1基本评测

录音内容: "你好世界" 标准文本: "你好世界"

预期结果:

{
  "score": 98,
  "accuracy": 100,
  "fluency": 98,
  "completeness": 100,
  "pronunciation": 96,
  "feedback": "发音准确,表达流畅"
}

测试2同义词识别

录音内容: "您好,今天天气非常不错" 标准文本: "你好,今天天气很好"

预期结果:

{
  "score": 95,
  "accuracy": 98,
  "feedback": "语义完全正确。'您好'='你好'(礼貌用语),'非常不错'='很好'(程度副词)"
}

测试3语法检查

录音内容: "我昨天去了公园玩" 标准文本: "我昨天去公园玩了"

预期结果:

{
  "score": 92,
  "accuracy": 95,
  "feedback": "语义正确,但语序略有不同。建议:'去公园玩了'更符合中文表达习惯"
}

🎯 评分标准32B模型优化

准确度 (Accuracy)

  • 100%: 完全一致或同义词
  • 90-99%: 语义正确,表达略有差异
  • 80-89%: 主要内容正确,细节有误
  • <80%: 内容有明显错误

流利度 (Fluency)

  • 100%: 表达自然流畅
  • 90-99%: 基本流畅,略有停顿
  • 80-89%: 有明显停顿但可理解
  • <80%: 不流畅,影响理解

完整度 (Completeness)

  • 100%: 完整表达所有内容
  • 90-99%: 内容基本完整
  • 80-89%: 遗漏部分内容
  • <80%: 内容严重不完整

发音 (Pronunciation)

  • 100%: 发音标准清晰
  • 90-99%: 发音清楚,略有口音
  • 80-89%: 发音可辨,但不够清晰
  • <80%: 发音模糊,难以辨认

配置检查清单

  • DeepSeek API地址http://127.0.0.1:11434
  • 模型名称deepseek-r1:32b
  • 温度参数0.2(精确)
  • 最大Token800详细反馈
  • Whisper服务已启动5001端口
  • 后端已重新编译
  • 后端服务已重启

🎉 下一步

  1. 启动Whisper服务
  2. 重新编译后端
  3. 在APP中测试录音
  4. 查看后端日志
  5. 验证智能评分效果

32B模型将提供最智能、最准确的语音评测 🧠