那些年,我们被人窃取过的博客

程序人生 · piasy · 于 发布 · 最后由 giitsmile回复 · 2311 次阅读
653

很早之前就在博客统计中发现了来自各色奇怪网站的流量,而且之前也遇见过搜索引擎搜自己的博客,结果是各种奇怪的网站排在前面。之前也没在意,反正分了我的流量,我也没啥损失,加了原文链接的还能导点流量过来。今天再次想到了其中之一的“推酷网”,便尝试再搜了一下,看看到底有多少这样的无良网站恶意侵权,不试不知道,一试吓一跳。

搜索引擎

我以一篇博客的标题“深入理解 RecyclerView 系列之一:ItemDecoration”为关键字,在 Google、百度、必应进行搜索。

还是 Google 最给力:

必应倒还能搜出来,而且结果还挺整齐:

百度我就不说啥了,不过没搜出广告我也还挺欣慰的:

出于无聊的心态,我就点开了搜出来的结果,发现其中大部分都是经过备案的网站,那我在工业和信息化部ICP/IP地址/域名信息备案管理系统就查一下备案信息咯。

窃贼之一:推酷网

有原文链接,有广告,格式基本可以看。

窃贼之二:内存溢出

没有原文链接,有作者名字,没有广告,格式勉强可以看。

窃贼之三:Code Cloud

没有任何原作信息,垃圾广告一大堆,格式勉强可以看。

thief_codecloud.png

owner_of_thief_codecloud.png

有趣的是,这个网站所有者还有一个微博,每次扒别人一篇文章,还会发一篇微博公告一下(当然没有原作说明),不过粉丝不多:微博 ilizhike

窃贼之四:清屏网

没有任何原作信息,广告位还没租出去,格式基本不能看。

thief_qingpingshan.png

owner_of_thief_qingpingshan.png

窃贼之五:第七城市

没有任何原作信息,满屏垃圾广告,格式完全不能看。

thief_th7.png

owner_of_thief_th7.png

窃贼之六:阳和移动开发

没有任何原作信息,满屏垃圾广告,格式基本不能看。

thief_mobile_open.png

owner_of_thief_mobile_open.png

窃贼之七:码迷

没有任何原作信息,满屏垃圾广告,格式基本不能看。

thief_mamicode.png

owner_of_thief_mamicode.png

窃贼之八:电脑玩物

没有任何原作信息,有广告,格式基本能看。

thief_07net01.png

owner_of_thief_07net01.png

窃贼之九:壹读

原文信息写的是开发者头条,满屏垃圾广告,格式基本不能看。

thief_read01.png

遗憾的是,这个从这个网站起,就都没有备案信息了 :(

窃贼之十一:cnblogs 安卓MAN

没有任何原作信息,格式基本能看。

thief_cnblogs_amen.png

窃贼之十二:oschina 丁佳辉

原文信息写的是 cnblogs 安卓MAN,格式基本能看。

thief_oschina_ding.png

(暂)完

好了,也就不费更多工夫再多查了,大部分窃取全文的都是有直接流量收益的。

推酷 这样的站点,要是学学 开发者头条,只引用链接,其实也还是不错的,如果只是为了分析内容,抓取只做分析用也是极好的,还能省不少存储空间呢不是?

至于在博客平台上进行窃取的,其实很早很早以前我也干过全文转载的事儿,不过我好歹还是加了原文链接呀,其实之所以全文转载,主要是怕只记原文链接将来哪天就访问不到了。不过那也是学生时代干的蠢事了。

其实我也不想怎么着,就是百无聊赖,扒一扒这些网站背后都是什么人,按理说知道备案信息之后,是能找到真人的不是?

共收到 12 条回复
2
jixiaohua · #1 ·

这些垃圾站的确非常恶心,一个技术帖子被大量转载导致最后作者都找不到是谁了,除了损害了作者的权益也损害了读者的权益,因为作者写技术文章除了总结自己的经验,也希望通过文章抛砖引玉可以和更多人交流技术,而读者阅读文章的时候可以会产生新的想法,也更期待可以和作者交流,而这些转载完全阻隔作者和读者的交流!!!

因此Diycode不欢迎完整原文转载出现,大家发帖的时候可以引用原文链接,引用别人的东西并不可耻,但是全文转载就不太好了。

如果你是作者,写了博客,同时全文发过来,这不是转载,这是一处文章供全网

30
d_clock · #2 ·

除此之外,比较还有下面这两个:

  • SDK.CN:拿着原创辛苦的创作往里面插广告,居然还说有权对文章进行更改和重排版之类的,真心niubility;

  • 小波:这位兄台更niubility了,fork来的库敢说是自己的,别人翻译的文献也敢说自己的,劣迹斑斑啊,上搜索引擎搜一下,应该能扒出不少新闻!

653
piasy · #3 ·

#2楼 @d_clock 昨晚我还奇怪,为什么这些站点都没有广告,后来才发现是因为我开了 ad block 😂

213 1485143427
yasic · #4 ·

还有很多网站自动复制粘贴别人的帖子、文字都不改换个id就发到自己网站上了、

2
jixiaohua · #5 ·

#4楼 @yasic 都是用程序抓取的数据。

30
d_clock · #6 ·

#4楼 @yasic 嗯,有部分作者手动复制黏贴,连样式都懒得改!

411

tuicool 文章基本都是直接抓的,不过好在还有个原文地址

653

这篇吐槽文也发到了我的博客上,没想到这也被各种垃圾站给爬了,真是有趣 😂

2
jixiaohua · #9 ·

#8楼 @piasy 爬虫是不会尴尬的

650

哈哈 ,刚开始写博客的时候文章比较烂 ,后来索性删了 ,但是其他盗链的删除不了

1276

其实这些站点背后都在刷流量,特别恶心,它们的抓取速度比百度都快,同时也喷一下百度。

96

把垃圾网站都整理出来吧,深受其害

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册