又要维持一个最低程度的规模文字转WAV音频