总是首先考虑会不会引起动荡文字转WAV音频