我们需要投入更多的资源才能把工作继续下去……所以文字转WAV音频