如果他的推测准确文字转WAV音频