就是找出那声音到底是从何而来的文字转WAV音频