他们发现两者除了体型差异以外长得基本上一模一样文字转WAV音频