petshy/user_guide.md

# 猫咪翻译器 V2 用户指南

## 简介

猫咪翻译器 V2 是一个基于 YAMNet 深度学习模型的猫叫声分析系统，能够识别猫咪的情感状态和意图。系统采用双层架构，先检测猫叫声，再分析其意图，大幅提高了识别准确率。同时，系统支持用户自定义训练，可以根据特定猫咪的叫声特点进行个性化调整。

## 安装

### 系统要求

- Python 3.8 或更高版本
- 至少 4GB 内存
- 支持 Windows、macOS 和 Linux

### 依赖项安装

```bash
# 创建虚拟环境（推荐）
python -m venv venv
source venv/bin/activate  # Linux/macOS
# 或
venv\Scripts\activate  # Windows

# 安装依赖
pip install tensorflow tensorflow-hub librosa numpy pyaudio soundfile
```

## 使用方法

猫咪翻译器 V2 提供了命令行界面，支持多种操作模式。

### 分析音频文件

```bash
python main.py analyze path/to/audio.wav [--cat 猫咪名称]
```

分析指定的音频文件，检测是否包含猫叫声，并识别其情感和意图。如果指定了猫咪名称，将使用该猫咪的个性化模型（如果存在）。

### 实时麦克风分析

```bash
python main.py live [--cat 猫咪名称]
```

启动实时麦克风分析模式，持续监听并分析环境声音，检测猫叫声并识别其意图。按 Ctrl+C 停止。

### 添加训练样本

```bash
python main.py add-sample path/to/audio.wav 标签名称 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]
```

添加一个训练样本，用于后续模型训练。

- `--type`: 标签类型，可以是 `emotion`（情感）或 `phrase`（短语），默认为 `emotion`
- `--cat`: 猫咪名称，用于个性化模型
- `--custom-phrase`: 自定义短语，仅当标签为 `custom` 且类型为 `phrase` 时使用

### 训练模型

```bash
python main.py train [--type emotion|phrase|both] [--cat 猫咪名称]
```

使用已添加的训练样本训练模型。

- `--type`: 模型类型，可以是 `emotion`（情感）、`phrase`（短语）或 `both`（两者），默认为 `both`
- `--cat`: 猫咪名称，用于训练特定猫咪的个性化模型

### 处理用户反馈

```bash
python main.py feedback path/to/audio.wav 预测标签 正确标签 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]
```

处理用户反馈，用于改进模型。系统会记录反馈，并在累积足够的反馈后自动触发增量训练。

### 导出用户数据

```bash
python main.py export path/to/export.zip
```

将用户数据（包括训练样本、模型和配置）导出到指定文件，便于备份或迁移。

### 导入用户数据

```bash
python main.py import path/to/export.zip [--overwrite]
```

从指定文件导入用户数据。

- `--overwrite`: 是否覆盖现有数据，默认为 False

## 情感类别

系统默认支持以下情感类别：

1. 快乐/满足
2. 颐音
3. 愤怒
4. 打架
5. 叫妈妈
6. 交配鸣叫
7. 痛苦
8. 休息
9. 狩猎
10. 警告
11. 关注我

## 短语类别

系统默认支持以下短语类别：

1. 喂我
2. 我想出去
3. 我想玩
4. 我很无聊
5. 我很饿
6. 我渴了
7. 我累了
8. 我不舒服

用户可以通过添加自定义短语来扩展短语类别。

## 个性化训练

为了获得最佳效果，建议为每只猫咪创建个性化模型：

1. 使用 `add-sample` 命令添加特定猫咪的叫声样本
2. 使用 `train` 命令训练该猫咪的个性化模型
3. 使用 `--cat` 参数指定猫咪名称进行分析

## 持续学习

系统支持持续学习，通过以下方式不断改进：

1. 使用 `feedback` 命令提供反馈
2. 系统会记录反馈，并在累积足够的反馈后自动触发增量训练
3. 也可以手动使用 `train` 命令触发训练

## 故障排除

### 麦克风不工作

确保已安装 PyAudio 并且麦克风设备正常工作。在某些系统上，可能需要安装额外的依赖：

```bash
# Ubuntu/Debian
sudo apt-get install portaudio19-dev
pip install pyaudio

# macOS
brew install portaudio
pip install pyaudio
```

### 模型训练失败

确保有足够的训练样本（至少 5 个）和至少 2 个不同的类别。

### 识别准确率低

1. 添加更多特定猫咪的训练样本
2. 使用高质量的录音，减少背景噪音
3. 确保录音中包含完整的猫叫声

## 数据隐私

所有数据和模型都存储在本地，不会上传到任何服务器。您可以使用 `export` 和 `import` 命令备份和恢复数据。