并且他也猜到文字转WAV音频