第二部分是侦破过程文字转WAV音频