他们倒不会刻意针对文字转WAV音频