爬取百度翻译之前,我们先要明白百度翻译是怎么在不改变网址的情况下实现翻译的。百度做到这一点是用 AJAX 实现的,简单地说,AJAX的作用是在不重新加载网页的情况下进行局部的刷新。了解了这一点,那么我们要怎么得到 AJAX 工作时请求的URL呢?如果我们全都带点开看,就会发现,他们的 kw 分别是:d 和 do。这是因为我打 dog 时一个单词一个单词打的,而 AJAX 是时时刷新。如果输入中文就不会出现这种情况。翻译中文时,我们找的也不是 sug 了,具体是什么,就看哪个包的 data 的值是我们要翻译的词。
暂无评论