一般只会使用在关键部位文字转WAV音频