guoyu/log/DeepSeek配置完成-快速测试.md
2025-12-11 23:28:07 +08:00

262 lines
5.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# DeepSeek-R1 32B 配置完成 ✅
## 📋 当前配置
```java
API地址: http://127.0.0.1:11434/v1/chat/completions
模型: deepseek-r1:32b
温度: 0.2 (更精确)
最大Token: 800 (详细反馈)
Top-P: 0.9 (高质量输出)
```
---
## 🎯 32B模型优势
相比7B模型
-**更强的语义理解能力**
-**更准确的评分**
-**更详细的反馈建议**
-**更好的中文处理**
---
## 🚀 快速测试3步
### **步骤1验证DeepSeek服务**
```bash
# 测试模型是否可用
curl http://127.0.0.1:11434/api/tags
# 应该看到:
{
"models": [
{
"name": "deepseek-r1:32b",
...
}
]
}
```
### **步骤2启动Whisper服务**
```bash
cd Test/python
python whisper_server.py
# 看到:
🎤 本地Whisper语音识别服务
📌 API接口
http://localhost:5001/health
http://localhost:5001/evaluate
```
### **步骤3重新编译并启动后端**
```bash
cd Study-Vue-redis
mvn clean package -DskipTests
# 重启后端
# Windows: 双击ry-study-admin.jar
# Linux: java -jar ry-study-admin/target/ry-study-admin.jar
```
---
## 📊 预期日志
### **启动时:**
```
DeepSeek本地大模型 (URL: http://127.0.0.1:11434/v1/chat/completions,
Model: deepseek-r1:32b,
状态: 运行中✅)
```
### **评测时:**
```
🎤 Whisper识别结果: 你好世界
🧠 使用DeepSeek智能评分语义理解
调用DeepSeek: 你是一位专业的语音评测专家。请对以下语音...
✅ DeepSeek响应成功
✅ DeepSeek智能评测完成: 得分=95, 反馈=发音清晰准确,语言表达流畅自然,完全符合标准要求。建议:保持当前发音水平。
```
---
## 🎯 32B模型特别优势
### **1. 更智能的同义词识别**
**输入:**
- 标准:"你好"
- 识别:"您好"
**7B模型** 可能扣分
**32B模型** ✅ 完全识别为正确(理解礼貌用语)
### **2. 更详细的反馈**
**7B模型反馈**
```
"发音清晰"
```
**32B模型反馈**
```
"发音清晰准确,语调自然流畅。'您好'作为礼貌用语使用恰当,
体现了良好的语言素养。建议:可以尝试增加语速变化,使表达
更加生动。"
```
### **3. 语法纠错能力**
能识别并指出:
- 语序错误
- 用词不当
- 语法问题
- 逻辑不通
---
## 🔧 性能优化建议
### **32B模型资源需求**
| 配置 | 最低要求 | 推荐配置 |
|------|---------|----------|
| **内存** | 16GB | 32GB |
| **显存** | 12GB | 24GB |
| **推理速度(CPU)** | ~8秒 | ~5秒 |
| **推理速度(GPU)** | ~1秒 | ~0.5秒 |
### **如果速度慢,可以:**
1. **启用GPU加速**如果有NVIDIA显卡
```bash
# Ollama自动使用GPU无需配置
# 确认GPU使用
nvidia-smi
```
2. **使用量化模型**速度提升2-3倍
```bash
# 下载4-bit量化版本
ollama pull deepseek-r1:32b-q4
# 修改配置
private static final String MODEL_NAME = "deepseek-r1:32b-q4";
```
3. **降级到7B模型**(如果资源不足)
```bash
ollama pull deepseek-r1:7b
# 修改配置
private static final String MODEL_NAME = "deepseek-r1:7b";
```
---
## 📝 测试用例
### **测试1基本评测**
**录音内容:** "你好世界"
**标准文本:** "你好世界"
**预期结果:**
```json
{
"score": 98,
"accuracy": 100,
"fluency": 98,
"completeness": 100,
"pronunciation": 96,
"feedback": "发音准确,表达流畅"
}
```
### **测试2同义词识别**
**录音内容:** "您好,今天天气非常不错"
**标准文本:** "你好,今天天气很好"
**预期结果:**
```json
{
"score": 95,
"accuracy": 98,
"feedback": "语义完全正确。'您好'='你好'(礼貌用语),'非常不错'='很好'(程度副词)"
}
```
### **测试3语法检查**
**录音内容:** "我昨天去了公园玩"
**标准文本:** "我昨天去公园玩了"
**预期结果:**
```json
{
"score": 92,
"accuracy": 95,
"feedback": "语义正确,但语序略有不同。建议:'去公园玩了'更符合中文表达习惯"
}
```
---
## 🎯 评分标准32B模型优化
### **准确度 (Accuracy)**
- 100%: 完全一致或同义词
- 90-99%: 语义正确,表达略有差异
- 80-89%: 主要内容正确,细节有误
- <80%: 内容有明显错误
### **流利度 (Fluency)**
- 100%: 表达自然流畅
- 90-99%: 基本流畅略有停顿
- 80-89%: 有明显停顿但可理解
- <80%: 不流畅影响理解
### **完整度 (Completeness)**
- 100%: 完整表达所有内容
- 90-99%: 内容基本完整
- 80-89%: 遗漏部分内容
- <80%: 内容严重不完整
### **发音 (Pronunciation)**
- 100%: 发音标准清晰
- 90-99%: 发音清楚略有口音
- 80-89%: 发音可辨但不够清晰
- <80%: 发音模糊难以辨认
---
## ✅ 配置检查清单
- [x] DeepSeek API地址http://127.0.0.1:11434
- [x] 模型名称deepseek-r1:32b
- [x] 温度参数0.2精确
- [x] 最大Token800详细反馈
- [ ] Whisper服务已启动5001端口
- [ ] 后端已重新编译
- [ ] 后端服务已重启
---
## 🎉 下一步
1. **启动Whisper服务**
2. **重新编译后端**
3. **在APP中测试录音**
4. **查看后端日志**
5. **验证智能评分效果**
**32B模型将提供最智能、最准确的语音评测** 🧠✨