但是他也没有去解释文字转WAV音频