这是双方都能勉强接受的方法――至少是表面看起来如此文字转WAV音频