他们无非是在想文字转WAV音频