Files
petshy/user_guide.md
2025-10-08 20:39:09 +08:00

173 lines
4.4 KiB
Markdown

# 猫咪翻译器 V2 用户指南
## 简介
猫咪翻译器 V2 是一个基于 YAMNet 深度学习模型的猫叫声分析系统,能够识别猫咪的情感状态和意图。系统采用双层架构,先检测猫叫声,再分析其意图,大幅提高了识别准确率。同时,系统支持用户自定义训练,可以根据特定猫咪的叫声特点进行个性化调整。
## 安装
### 系统要求
- Python 3.8 或更高版本
- 至少 4GB 内存
- 支持 Windows、macOS 和 Linux
### 依赖项安装
```bash
# 创建虚拟环境(推荐)
python -m venv venv
source venv/bin/activate # Linux/macOS
# 或
venv\Scripts\activate # Windows
# 安装依赖
pip install tensorflow tensorflow-hub librosa numpy pyaudio soundfile
```
## 使用方法
猫咪翻译器 V2 提供了命令行界面,支持多种操作模式。
### 分析音频文件
```bash
python main.py analyze path/to/audio.wav [--cat 猫咪名称]
```
分析指定的音频文件,检测是否包含猫叫声,并识别其情感和意图。如果指定了猫咪名称,将使用该猫咪的个性化模型(如果存在)。
### 实时麦克风分析
```bash
python main.py live [--cat 猫咪名称]
```
启动实时麦克风分析模式,持续监听并分析环境声音,检测猫叫声并识别其意图。按 Ctrl+C 停止。
### 添加训练样本
```bash
python main.py add-sample path/to/audio.wav 标签名称 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]
```
添加一个训练样本,用于后续模型训练。
- `--type`: 标签类型,可以是 `emotion`(情感)或 `phrase`(短语),默认为 `emotion`
- `--cat`: 猫咪名称,用于个性化模型
- `--custom-phrase`: 自定义短语,仅当标签为 `custom` 且类型为 `phrase` 时使用
### 训练模型
```bash
python main.py train [--type emotion|phrase|both] [--cat 猫咪名称]
```
使用已添加的训练样本训练模型。
- `--type`: 模型类型,可以是 `emotion`(情感)、`phrase`(短语)或 `both`(两者),默认为 `both`
- `--cat`: 猫咪名称,用于训练特定猫咪的个性化模型
### 处理用户反馈
```bash
python main.py feedback path/to/audio.wav 预测标签 正确标签 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]
```
处理用户反馈,用于改进模型。系统会记录反馈,并在累积足够的反馈后自动触发增量训练。
### 导出用户数据
```bash
python main.py export path/to/export.zip
```
将用户数据(包括训练样本、模型和配置)导出到指定文件,便于备份或迁移。
### 导入用户数据
```bash
python main.py import path/to/export.zip [--overwrite]
```
从指定文件导入用户数据。
- `--overwrite`: 是否覆盖现有数据,默认为 False
## 情感类别
系统默认支持以下情感类别:
1. 快乐/满足
2. 颐音
3. 愤怒
4. 打架
5. 叫妈妈
6. 交配鸣叫
7. 痛苦
8. 休息
9. 狩猎
10. 警告
11. 关注我
## 短语类别
系统默认支持以下短语类别:
1. 喂我
2. 我想出去
3. 我想玩
4. 我很无聊
5. 我很饿
6. 我渴了
7. 我累了
8. 我不舒服
用户可以通过添加自定义短语来扩展短语类别。
## 个性化训练
为了获得最佳效果,建议为每只猫咪创建个性化模型:
1. 使用 `add-sample` 命令添加特定猫咪的叫声样本
2. 使用 `train` 命令训练该猫咪的个性化模型
3. 使用 `--cat` 参数指定猫咪名称进行分析
## 持续学习
系统支持持续学习,通过以下方式不断改进:
1. 使用 `feedback` 命令提供反馈
2. 系统会记录反馈,并在累积足够的反馈后自动触发增量训练
3. 也可以手动使用 `train` 命令触发训练
## 故障排除
### 麦克风不工作
确保已安装 PyAudio 并且麦克风设备正常工作。在某些系统上,可能需要安装额外的依赖:
```bash
# Ubuntu/Debian
sudo apt-get install portaudio19-dev
pip install pyaudio
# macOS
brew install portaudio
pip install pyaudio
```
### 模型训练失败
确保有足够的训练样本(至少 5 个)和至少 2 个不同的类别。
### 识别准确率低
1. 添加更多特定猫咪的训练样本
2. 使用高质量的录音,减少背景噪音
3. 确保录音中包含完整的猫叫声
## 数据隐私
所有数据和模型都存储在本地,不会上传到任何服务器。您可以使用 `export``import` 命令备份和恢复数据。