这个问题的简单性实在是让人觉得不需要浪费多少的脑细胞去解答文字转WAV音频