研究图画中每一个可能会成为线索的地方文字转WAV音频