但并非完全彻底控制文字转WAV音频