那么他们的目标也不会是我们文字转WAV音频