看来他们是刻意做过处理了文字转WAV音频