guoyu/log/Whisper语音测试工具使用说明.txt
2025-12-11 23:28:07 +08:00

185 lines
4.9 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

====================================
Whisper 语音测试工具使用说明
====================================
【文件说明】
1. MP3转换测试.html - 原版只支持百度API
2. MP3转换测试-Whisper版.html - 新版支持Whisper + 百度API + 自动选择)
【新版功能】
✅ 支持 Whisper 本地识别(免费、离线)
✅ 支持百度 API 识别(在线)
✅ 自动选择模式(优先 Whisper
✅ 服务状态实时检测
✅ 完整的语音评测流程
====================================
使用步骤
====================================
【步骤1】配置服务地址
---------------------------------------
打开 MP3转换测试-Whisper版.html
在"服务配置"区域填写:
1. Java后端地址: http://192.168.1.164:30091
你的Java应用地址
2. Whisper服务地址: http://192.168.1.100:5001
远程Whisper服务器地址
【步骤2】检测服务状态
---------------------------------------
点击"🔍 检测服务状态"按钮
查看状态指示灯:
- 🟢 绿色:服务在线可用
- 🔴 红色:服务离线不可用
- 🟡 黄色:正在检测中
【步骤3】选择识别服务
---------------------------------------
三种模式可选:
1. 🤖 Whisper (本地)
- 完全免费
- 离线运行
- 识别准确
2. ☁️ 百度API
- 在线服务
- 需要密钥
- 稳定可靠
3. 🔄 自动选择(推荐)
- 优先使用 Whisper
- Whisper不可用时降级使用百度API
- 智能切换
【步骤4】上传测试
---------------------------------------
1. 点击上传区域或拖拽文件
2. 选择 MP3/M4A/AAC 格式音频
3. 输入评测文本(与录音内容一致)
4. 点击"开始测试转换及评测"
5. 查看测试结果
====================================
后端配置(重要)
====================================
【修改 Java 配置使用远程 Whisper】
---------------------------------------
文件: LocalWhisperService.java
位置: ry-study-system/src/main/java/.../service/voice/
修改第36行
private static final String WHISPER_URL = "http://localhost:5001";
改为远程地址:
private static final String WHISPER_URL = "http://192.168.1.100:5001";
【重新编译】
---------------------------------------
cd Study-Vue-redis
mvn clean package -DskipTests
【重启应用】
---------------------------------------
java -jar ry-study-admin/target/ry-study-admin.jar
====================================
测试结果说明
====================================
【成功结果】
---------------------------------------
✅ 测试完成
📁 源文件: 显示上传的文件名
🎤 识别文本: Whisper/百度API识别的文本
📊 评测结果:
- 🎯 综合得分
- ✅ 准确度
- 🗣️ 流利度
- 📋 完整度
【失败原因】
---------------------------------------
1. 服务不可用
- 检查 Whisper 服务是否启动
- 检查 Java 应用是否运行
- 检查网络连接
2. 上传失败
- 检查文件格式(只支持 MP3/M4A/AAC
- 检查文件大小(建议 < 10MB
3. 识别失败
- 检查音频质量
- 检查录音时长(建议 2-10秒
- 查看详细日志
====================================
测试检查清单
====================================
□ Whisper 服务已启动
□ Java 应用已启动
□ 服务地址配置正确
□ 服务状态检测通过(绿灯)
□ 音频文件格式正确
□ 评测文本已填写
□ 网络连接正常
====================================
常见问题
====================================
Q1: Whisper 状态显示离线怎么办?
A1:
1. 确认 Whisper 服务器地址正确
2. 在服务器上运行: curl http://localhost:5001/health
3. 检查服务器防火墙是否开放 5001 端口
4. 确认 Whisper 服务监听地址为 0.0.0.0
Q2: 百度API 状态显示离线怎么办?
A2:
1. 确认 Java 应用已启动
2. 访问: http://192.168.1.164:30091/study/voiceEvaluation/checkService
3. 检查百度 API 密钥配置
Q3: 上传后没有反应?
A3:
1. 按 F12 打开浏览器开发者工具
2. 查看 Console 标签页的错误信息
3. 检查 Network 标签页的请求状态
4. 确认跨域问题CORS
Q4: 识别结果不准确?
A4:
1. 确保录音内容与评测文本一致
2. 使用清晰的录音环境
3. 控制录音时长2-10秒最佳
4. 尝试多次测试
Q5: 如何验证完整流程?
A5:
1. 使用手机录制一段 "你好世界" 的语音
2. 导出为 MP3 格式
3. 在工具中上传并设置评测文本为 "你好世界"
4. 选择 Whisper 模式进行测试
5. 查看识别结果是否准确
====================================
技术支持
====================================
如遇问题,请提供:
1. 浏览器控制台截图F12 → Console
2. 测试日志内容
3. 服务器 Whisper 启动日志
4. Java 应用日志(包含 Whisper 相关)
5. 使用的音频文件(用于复现问题)
====================================