而且从这次听到的声音来分辨文字转WAV音频