因为他识得那个声音文字转WAV音频