他使用了细微文字转WAV音频