我觉得这需要一个在各方面都具有足够协调和处置能力的多面手来应对文字转WAV音频