Amaze UI Logo

收集文章: 2001

浏览人数: 1333008



老7分享个人网站利用python配合C++全自动采集内容站群算法做adsense月入万刀 原创

老7分享个人网站利用python配合C++全自动采集内容站群算法做adsense月入万刀

国庆将至,各站长论坛干货以及征文活动都开始了,下面就是loc大牛老7分享自己个人网站利用python配合C++全自动采集内容站群算法做adsense月入万刀的实操方案。虽然不是教程的方式,但是老7通过回答大家的问题让有基础的用户得到一些思路,毕竟很多东西无法说的太明,而且如果没有基础,说的再多也没用,每个人都有自己做互联网营销的方法。

此算法为python配合C++,改进和训练人工智能历经两个月的时间,收入增加效果明显,当然最主要的还是新算法起作用了。下面4张图,7月份9000多美元,8月份稍微增加一点,本月13000美元。这只是老7网站收益的一部分,google adsense收入则更超出这个。另外需要分享的是,paypal对于年收入超过50000美元的,受外汇管制的营销,用户可以直接打上海办事处电话,客服会告诉你一些提高限额的渠道,下面的图可以看到paypal收了200美元的费用,感觉有点高。


思路跟某些人说的全自动采集内容做站群,利用自己算法迷惑google思路比较接近,但具体细节摸索很多才能有点成效,主要靠大数据和机器深度学习完成。而且工作并没有很多人想象的那般轻松,采集会根据源做相应的调整。另外目前针对百度的效果还是有限,很多关键词搜索结果,百度中都不是匹配,不是百度不懂而是百度自私。Google则把最正确的用户需要的结果第一时间呈现给用户。


老7也是个人单干,以前5人小团队因为长大后各自结婚生子而各奔东西,自己也是利用github上开源的人工智能加深度学习组件了机器群,其实也就是几台强悍点的服务器。按照AlphaGo的思路,让其在网络里自行学习和运算,在某些(你懂得)搜索引擎和能获得优势的网站上给出最佳途径和对比方式。例如站群这一面,自行列出单价和浏览访问量,再自行搜集数据建立相应的网站(这个用python实现)。这样的好处就是能不会被Google或者其他反作弊系统识别,可以长期稳定来做。

关于有些人对全自动采集站可读性的质疑,老7表示他试图清晰的解释下其中一种最见效的方式。“比如说一段时期,“风油精”这个关键词很火——全智能大数据分析的,你也可以建立这样的一个大数据分析链,也可以使用某些机构的成果,github上有,我就是直接提取结果的。之后利用这个关键词,迅速的创建与之相关的域名和网站(这一部是程序员都能实现,我用的是python,大赞python),整个流程就是以接近病毒式扫描和创建关键词,以web形式呈现,引来的流量是非常可怕的,所以我有很多小vps负责负载。这就是google的一方面,还有某些细节属于个人核心技术了,等你到了那一步其实自然就能懂了。”

“再透露一点,关键问题点到为止哈。多想想自然就明白,机会是给有准备的人。比如“风油精”这个关键词,不管是围绕这个词的网站也好,论坛版块也好,单页文章也罢,所有信息数据均智能采集网络(有开源的程序判断文字的流畅性和可读性的,这点不用担心),接下来把采集来的数据如何排列起来才是亮点,就模拟那种回帖方式的啊,紧凑的那种,明白了吗?用户以为还真是人在回帖呢,比如这个风油精的使用感受之类的,PV会爆,我的小vps承受不了怎么办呢?github pages啊,无限的啊,小vps+github不用担心任何问题。关于检测那个语句的流畅和可读性,我的程序里里是去掉了的,太影响速度和效率了,以为要去其他平台逐句逐句的对比。索性去掉,反正收集的信息基本都是流畅完整的,到时候按照一定的方式(算法)打乱拼接就可以了,力争做到网络重复率极低便可。”

关于adsense垃圾采集站被K账号的问题,老7则分享说:“首先,不说站垃圾不垃圾,任何公司包括google都不会去定义一个网站是否垃圾或者歧视采集来的文章,更不会认为低人一等。例如很多人复制shadowsocks的文章,*现在百度屏蔽了shadowsocks 关键词*,这个文章的某些技术和知识就是适合自己本人,你就让其在你的小站上存在,天经地义。搜索引擎注重的是转换率和价值(复制的文章也是有价值的,高低而已,原创的价值最高)。你被k是否有某些不正当的流量,不要去购买那些所谓的几万十几万的ip流量,我可以告诉你,还不如不买(触犯某些人的利润,抱歉)原理和原因就不解释了,码字麻烦,而且得罪人。其次就是莫名其妙的点击和跳转后停留的时间等等等等因数。我的g帐号很多,近两年都没有K过。可以借鉴,最后祝网赚愉快。”


反对(0) 支持(0)


评论