黑帽实例分享-站群式的网站镜像与克隆

admin   ·   发表于 2018-4-6   ·   资源分享(公开)


其实这种手法在几年前就已经开始,操作者一般是先通过购买大量低价域名,然后有针对性的挑选网站来施行镜像或者所谓的克隆。这里的镜像不是通过软件下载整套目标模板和采集目标内容,指的是利用nginx或者appache等web服务器实现一种叫反向代理的技术。

实际是怎样运行的

只要有访问者打开了镜像站,那么镜像站的代码就会让服务器访问一次被克隆的网站,并获取源代码,作一系列的修改处理后,就会输出到访问者的页面。

我们继续往下看

实例分析:


我在360站长社区找到这个例子,打开原网站与第一个镜像站。

镜像站如下:

通过滚动到下面看到了原网站的模板

我们再查看镜像站的源代码,近乎与原网站代码一模一样,连名字都不改!

但镜像站如何加载了那个赌博站,通过对比源代码,我看到了其在Head头部加入了一段自己的gobay.js,将内容通过URL解码后可以看到这个JS文件主要作用是往页面输出了一个iframe的标签,指向的地址就是页面上的赌博站。

这个做法很聪明,一是百度对JS代码的解析能力低,二是就算解析出但对iframe里的内容不进行抓取。这样做的话就会降低会克隆站排名的影响,也会实现导流的效果。

js源码:

document.write(unescape("%3Ciframe%20width%3D%27100%25%27%20src%3D%27http%3A//www.wangtouxxz.pw/%27%20height%3D%275200px%27%20frameborder%3D%270%27%20scrolling%3D%27no%27%3E%3C/iframe%3E"));

解码后:

document.write(unescape("<iframe width='100%' src='http://www.wangtouxxz.pw/' height='5200px' frameborder='0' scrolling='no'></iframe>"));

这种手法还有用吗?

我查询了一下百度的收录量,多达3000+,查看了收录页最新快照时间为2017年06月16日,说明即便克隆站也是能有春天,而这收录量是多少站长还没达到的。360那边搜索发现已经不存在收录了,这里态度显然优胜。

总结:

目前这种手法有两种

第一种 土豪式是以仿照域名再注册的新域名,一般做出排名高于原网站,那访问者就傻傻分不清了,这种情况在百度站长社区经常看到。

第二种 是和项目一文章类似,成本较低,有资源的操作者会使用老域名+优质主站辅助二级域名做镜像站群,在百度官方文档上虽然认为二级站如同新站是独立分开的 ,但仍然会根据质量从主站上传递一部分权重,这样的话就知道为什么会被镜像站超越了。

你以为这样就完了?下面还有实例分享呢

现在来进行实战,我对phpstudy2016情有独钟,所以基本是用它来搭建便捷的环境,其中使用的是Appache

我们需要先对httpd.conf进行配置,开启转发模块,如下图所示,找到两个红色框框然后去除最前面的#符号,或者索性把所有带proxy的这些模块都去除吧,此外还需要开启rewrite模块,去除httpd.conf文件中”#LoadModule rewrite_module modules/mod_rewrite.so”前面的”#”号,因为phpstudy里已经默认开启,所以我们跳过。

然后在根目录创建.htaccess文件,内容如下:

一般站长用到这个文件是做伪静态的处理,但做镜像站就是为了将所有用户访问的网址通过URL重写到我们的核心文件hehe.php里,别忘了[P],作用就是我们刚开启的模块,用来隐性转发,整个文件作用也就是当你访问xxx.com/a.html的时候,实际上是访问了xxx.com/hehe.php?good=a.html,但我们的URL地址栏是仍然是a.html而不是hehe.php

核心文件
接下来是对核心文件hehe.php的编写

文件的大概内容:
1.我们通过URL转发,可以接收到传递过来的参数,然后通过curl或者file_get_contents的方式配合目标地址+传递参数,可以远程获取到源代码,要是乱码就需要进行重新编码。
2.获取到源代码后,要分情况修改标签的地址,如a标签,img标签,js代码,css代码,这些会影响到页面的模仿度,上文的镜像站和下图我的代码举例的就是处理了这些。
3.针对引流或者SEO甚至针对性的防镜像处理在源代码里修改,比如 加入JS代码,修改TDK等内容。
4.输出页面给用户呗

那怎样对付这些镜像站呢?

1.有些站长说补全路径就可破,其实在上图的代码我就已经针对绝对路径的方法做了简单处理,所以呵呵….

2.最简单有效的就是封禁IP,一般情况下站长可以直接查出镜像站的服务器IP或者根据日志里的记录,在服务器里或者控制面板里禁止该IP的访问。

3.要是加入了CDN而隐藏了IP 又或者PHP伪造IP,可以根据镜像站的代码查看是否有如上文举例的多余JS文件,在自己的网站上也创建相同JS文件,而JS文件可以多种处理,比如说输出一个空白页又或者给页面加一些非法内容或者关键词堆砌,举报让搜索引擎处理等等

4.上面这2种方法是可行的,但遇到不是做站群的而是同行恶意镜像,他们可以有多种办法突破你的限制。一般这些时候我建议非常时期用非常手段。

原文:http://www.homedt.net/335.html

0 Reply   |  Until 2018-4-6 | 1044 View
LoginCan Publish Content

HYBBS © 2016. All Rights Reserved. 老农民

Powered by HYBBS Version 2.2.9