从他的论文中可以看出文字转WAV音频