因为他们都能够认出文字转WAV音频