实际上人类也有类似的进阶文字转WAV音频