确实和他猜测的完全符合文字转WAV音频