架构设计

VideoCaptioner 的系统架构设计。

技术栈

语音识别模块，支持多种 ASR 引擎。

字幕分割和优化模块，使用 LLM 进行智能处理。

字幕翻译模块，支持多种翻译服务。

PyQt5 用户界面模块。

视频/音频 → ASR → ASRData → 分割 → 优化 → 翻译 → 字幕文件 → 视频合成

详细架构说明请参考 CLAUDE.md 文件。