根据现有的观察记录文字转WAV音频