他没有使用一个模仿镜头文字转WAV音频