Files

linhong 80f0e7f8d7 feat: first commit

2025-10-08 20:39:09 +08:00

4.4 KiB

Raw Blame History

猫咪翻译器 V2 用户指南

简介

猫咪翻译器 V2 是一个基于 YAMNet 深度学习模型的猫叫声分析系统，能够识别猫咪的情感状态和意图。系统采用双层架构，先检测猫叫声，再分析其意图，大幅提高了识别准确率。同时，系统支持用户自定义训练，可以根据特定猫咪的叫声特点进行个性化调整。

安装

系统要求

Python 3.8 或更高版本
至少 4GB 内存
支持 Windows、macOS 和 Linux

依赖项安装

# 创建虚拟环境（推荐）
python -m venv venv
source venv/bin/activate  # Linux/macOS
# 或
venv\Scripts\activate  # Windows

# 安装依赖
pip install tensorflow tensorflow-hub librosa numpy pyaudio soundfile

使用方法

猫咪翻译器 V2 提供了命令行界面，支持多种操作模式。

分析音频文件

python main.py analyze path/to/audio.wav [--cat 猫咪名称]

分析指定的音频文件，检测是否包含猫叫声，并识别其情感和意图。如果指定了猫咪名称，将使用该猫咪的个性化模型（如果存在）。

实时麦克风分析

python main.py live [--cat 猫咪名称]

启动实时麦克风分析模式，持续监听并分析环境声音，检测猫叫声并识别其意图。按 Ctrl+C 停止。

添加训练样本

python main.py add-sample path/to/audio.wav 标签名称 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]

添加一个训练样本，用于后续模型训练。

--type: 标签类型，可以是 emotion（情感）或 phrase（短语），默认为 emotion
--cat: 猫咪名称，用于个性化模型
--custom-phrase: 自定义短语，仅当标签为 custom 且类型为 phrase 时使用

训练模型

python main.py train [--type emotion|phrase|both] [--cat 猫咪名称]

使用已添加的训练样本训练模型。

--type: 模型类型，可以是 emotion（情感）、phrase（短语）或 both（两者），默认为 both
--cat: 猫咪名称，用于训练特定猫咪的个性化模型

处理用户反馈

python main.py feedback path/to/audio.wav 预测标签 正确标签 [--type emotion|phrase] [--cat 猫咪名称] [--custom-phrase 自定义短语]

处理用户反馈，用于改进模型。系统会记录反馈，并在累积足够的反馈后自动触发增量训练。

导出用户数据

python main.py export path/to/export.zip

将用户数据（包括训练样本、模型和配置）导出到指定文件，便于备份或迁移。

导入用户数据

python main.py import path/to/export.zip [--overwrite]

从指定文件导入用户数据。

--overwrite: 是否覆盖现有数据，默认为 False

情感类别

系统默认支持以下情感类别：

快乐/满足
颐音
愤怒
打架
叫妈妈
交配鸣叫
痛苦
休息
狩猎
警告
关注我

短语类别

系统默认支持以下短语类别：

喂我
我想出去
我想玩
我很无聊
我很饿
我渴了
我累了
我不舒服

用户可以通过添加自定义短语来扩展短语类别。

个性化训练

为了获得最佳效果，建议为每只猫咪创建个性化模型：

使用 add-sample 命令添加特定猫咪的叫声样本
使用 train 命令训练该猫咪的个性化模型
使用 --cat 参数指定猫咪名称进行分析

持续学习

系统支持持续学习，通过以下方式不断改进：

使用 feedback 命令提供反馈
系统会记录反馈，并在累积足够的反馈后自动触发增量训练
也可以手动使用 train 命令触发训练

故障排除

麦克风不工作

确保已安装 PyAudio 并且麦克风设备正常工作。在某些系统上，可能需要安装额外的依赖：

# Ubuntu/Debian
sudo apt-get install portaudio19-dev
pip install pyaudio

# macOS
brew install portaudio
pip install pyaudio

模型训练失败

确保有足够的训练样本（至少 5 个）和至少 2 个不同的类别。

识别准确率低

添加更多特定猫咪的训练样本
使用高质量的录音，减少背景噪音
确保录音中包含完整的猫叫声

数据隐私

所有数据和模型都存储在本地，不会上传到任何服务器。您可以使用 export 和 import 命令备份和恢复数据。

4.4 KiB Raw Blame History