最大的目标是摆脱凡俗文字转WAV音频