当初他们三人推测出这个结论的时候文字转WAV音频