问题就在于表面上文字转WAV音频