不过基于互相信任文字转WAV音频