他还会去比较文字转WAV音频