但却始终无法准确的捕捉到文字转WAV音频