登录后享用更多功能
您需要 登录 才可以下载或查看,没有账号?立即注册
×
事情的起因是这样的(见群聊截图)
此人竟将爬虫和hook混为一谈!
呢么,什么是爬虫呢?
网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。-摘自 百度百科 网络爬虫
呢么,什么是HOOK呢?
HOOK技术是Windows消息处理机制的一个平台,应用程序可以在上面设置子程序以监视指定窗口的某种消息,而且所监视的窗口可以是其他进程所创建的。当消息到达后,在目标窗口处理函数之前处理它。钩子机制允许应用程序截获处理window消息或特定事件。 钩子实际上是一个处理消息的程序段,通过系统调用,把它挂入系统。每当特定的消息发出,在没有到达目的窗口前,钩子程序就先捕获该消息,亦即钩子函数先得到控制权。这时钩子函数即可以加工处理(改变)该消息,也可以不作处理而继续传递该消息,还可以强制结束消息的传递。-摘自 百度知道 什么是HOOK技术 大致的意思就是,爬虫是一种能够抓取网页的!程序或者脚本! 而HOOK是一种针对Windows系统的一个能够截取消息的平台 也就是说能够在对方程序收到这个消息之前接收到这个消息并且可以对他进行修改 虽然网上也的确可以搜到“爬虫HOOK”,但我们进去看一下,会发现他们都是存在一个共同点,没错,就是JS(继续百度...)
JavaScript(简称“JS”) 是一种具有函数优先的轻量级,解释型或即时编译型的编程语言。虽然它是作为开发Web页面的脚本语言而出名,但是它也被用到了很多非浏览器环境中,JavaScript 基于原型编程、多范式的动态脚本语言,并且支持面向对象、命令式和声明式(如函数式编程)风格。 JavaScript是一种脚本语言,其源代码在发往客户端运行之前不需经过编译,而是将文本格式的字符代码发送给浏览器由浏览器解释运行。-摘自 百度百科 JavaScript 也就是说,js实际上是一种以文本形式存在的浏览器脚本,所有的js执行都必须由浏览器进行,所以js也是需要在本地才能执行的 而且你也会发现,他根本就不是HOOK网页的,而是通过JS脚本去修改服务器发送给客户端(也就是浏览器)数据的一种类似于HOOK的HOOK 这种东西大部分都会被用来制作一些网页游戏的WG,其原理同WG对游戏进行HOOK 而不是所谓的“爬虫HOOK”
|