的确有很多地方利用到了这个理论文字转WAV音频