他最终还是选择了信任文字转WAV音频