所以他才会将这个作为自己的第一个目标文字转WAV音频