恐怕还是要考虑周全文字转WAV音频