所以两人才熟悉文字转WAV音频