guoyu/log/Whisper语音测试工具使用说明.txt

185 lines
4.9 KiB
Plaintext
Raw Normal View History

2025-12-11 23:28:07 +08:00
====================================
Whisper 语音测试工具使用说明
====================================
【文件说明】
1. MP3转换测试.html - 原版只支持百度API
2. MP3转换测试-Whisper版.html - 新版支持Whisper + 百度API + 自动选择)
【新版功能】
✅ 支持 Whisper 本地识别(免费、离线)
✅ 支持百度 API 识别(在线)
✅ 自动选择模式(优先 Whisper
✅ 服务状态实时检测
✅ 完整的语音评测流程
====================================
使用步骤
====================================
【步骤1】配置服务地址
---------------------------------------
打开 MP3转换测试-Whisper版.html
在"服务配置"区域填写:
1. Java后端地址: http://192.168.1.164:30091
你的Java应用地址
2. Whisper服务地址: http://192.168.1.100:5001
远程Whisper服务器地址
【步骤2】检测服务状态
---------------------------------------
点击"🔍 检测服务状态"按钮
查看状态指示灯:
- 🟢 绿色:服务在线可用
- 🔴 红色:服务离线不可用
- 🟡 黄色:正在检测中
【步骤3】选择识别服务
---------------------------------------
三种模式可选:
1. 🤖 Whisper (本地)
- 完全免费
- 离线运行
- 识别准确
2. ☁️ 百度API
- 在线服务
- 需要密钥
- 稳定可靠
3. 🔄 自动选择(推荐)
- 优先使用 Whisper
- Whisper不可用时降级使用百度API
- 智能切换
【步骤4】上传测试
---------------------------------------
1. 点击上传区域或拖拽文件
2. 选择 MP3/M4A/AAC 格式音频
3. 输入评测文本(与录音内容一致)
4. 点击"开始测试转换及评测"
5. 查看测试结果
====================================
后端配置(重要)
====================================
【修改 Java 配置使用远程 Whisper】
---------------------------------------
文件: LocalWhisperService.java
位置: ry-study-system/src/main/java/.../service/voice/
修改第36行
private static final String WHISPER_URL = "http://localhost:5001";
改为远程地址:
private static final String WHISPER_URL = "http://192.168.1.100:5001";
【重新编译】
---------------------------------------
cd Study-Vue-redis
mvn clean package -DskipTests
【重启应用】
---------------------------------------
java -jar ry-study-admin/target/ry-study-admin.jar
====================================
测试结果说明
====================================
【成功结果】
---------------------------------------
✅ 测试完成
📁 源文件: 显示上传的文件名
🎤 识别文本: Whisper/百度API识别的文本
📊 评测结果:
- 🎯 综合得分
- ✅ 准确度
- 🗣️ 流利度
- 📋 完整度
【失败原因】
---------------------------------------
1. 服务不可用
- 检查 Whisper 服务是否启动
- 检查 Java 应用是否运行
- 检查网络连接
2. 上传失败
- 检查文件格式(只支持 MP3/M4A/AAC
- 检查文件大小(建议 < 10MB
3. 识别失败
- 检查音频质量
- 检查录音时长(建议 2-10秒
- 查看详细日志
====================================
测试检查清单
====================================
□ Whisper 服务已启动
□ Java 应用已启动
□ 服务地址配置正确
□ 服务状态检测通过(绿灯)
□ 音频文件格式正确
□ 评测文本已填写
□ 网络连接正常
====================================
常见问题
====================================
Q1: Whisper 状态显示离线怎么办?
A1:
1. 确认 Whisper 服务器地址正确
2. 在服务器上运行: curl http://localhost:5001/health
3. 检查服务器防火墙是否开放 5001 端口
4. 确认 Whisper 服务监听地址为 0.0.0.0
Q2: 百度API 状态显示离线怎么办?
A2:
1. 确认 Java 应用已启动
2. 访问: http://192.168.1.164:30091/study/voiceEvaluation/checkService
3. 检查百度 API 密钥配置
Q3: 上传后没有反应?
A3:
1. 按 F12 打开浏览器开发者工具
2. 查看 Console 标签页的错误信息
3. 检查 Network 标签页的请求状态
4. 确认跨域问题CORS
Q4: 识别结果不准确?
A4:
1. 确保录音内容与评测文本一致
2. 使用清晰的录音环境
3. 控制录音时长2-10秒最佳
4. 尝试多次测试
Q5: 如何验证完整流程?
A5:
1. 使用手机录制一段 "你好世界" 的语音
2. 导出为 MP3 格式
3. 在工具中上传并设置评测文本为 "你好世界"
4. 选择 Whisper 模式进行测试
5. 查看识别结果是否准确
====================================
技术支持
====================================
如遇问题,请提供:
1. 浏览器控制台截图F12 → Console
2. 测试日志内容
3. 服务器 Whisper 启动日志
4. Java 应用日志(包含 Whisper 相关)
5. 使用的音频文件(用于复现问题)
====================================