他会耗费巨大的时间和精力……还大概率没办法推进文字转WAV音频