却无法通过观察掌握文字转WAV音频