最后得出的结论是完全一样的文字转WAV音频