唯一的困难是文字转WAV音频