不过是听声音辨识的文字转WAV音频