Whisper-TPU
Whisper-TPU 是一款使用 OpenAI 开源的 Whisper 模型使用 Sophon SDK 将其移植到 SG2300X 芯片系列产品上,实现使用本地 TPU 进行硬件加速推理,此应用可用于对语音进行快速转文字(STT), 并在未来接入 ChatGLM2 对语音内容进行理解和翻译。 此应用使用 Gradio 实现友好用户交互界面
-
克隆仓库,并转到 release 分支
git clone https://github.com/zifeng-radxa/whisper-TPU_py -b release
-
下载 whisper bmodel
cd whisper-TPU_py
wget https://github.com/radxa-edge/TPU-Edge-AI/releases/download/Whisper/tar_downloader.sh
bash tar_downloader.sh
tar -xvf Whisper_bmodel.tar.gz -
将下载的 whisper bmodel 放入 whisper-TPU_py/bmodel 中
mv Whisper_bmodel/bmodel/ .
-
在 whisper-TPU_py 同级目录下载 chatglm2
根据需求可选 chatglm2-int4-512, chatglm2-int8-1024, chatglm2-int8-2048, 三种量化模型,请参考此页
cd ..
# ChatGLM2-int8-1024
wget https://github.com/radxa-edge/TPU-Edge-AI/releases/download/chatglm-int8-1024/tar_downloader.sh
bash tar_downloader.sh
tar chatglm-int8-1024.tar.gz
# ChatGLM2-int4-512
wget https://github.com/radxa-edge/TPU-Edge-AI/releases/download/chatglm-int4-512/tar_downloader.sh
bash tar_downloader.sh
tar chatglm-int4-512.tar.gz
# ChatGLM2-int8-2048
wget https://github.com/radxa-edge/TPU-Edge-AI/releases/download/chatglm-int8-2048/tar_downloader.sh
bash tar_downloader.sh
tar chatglm-int8-2048.tar.gz得到文件树架构如下
├── chatglm-int8-1024
└── whisper-TPU_py
├── Whisper_bmodel
├── bmodel
├── bmwhisper
│ ├── assets
│ ├── normalizers
│ └── third_party
│ └── untpu
│ └── lib
└── test