本文转载自 http://www.trackself.com/ 作者:黎浩江
,这是其中一个测试站(暂时这还是一个不能赚钱的站),安装完后:http://x.oddsfun.com/x.zip
这个是一个基于drupal的二次开发的CMS,主要用于采集和赚美金(人民币我是失败了):
1.可以采集明文的HTML.(藏在javascript里的东西应该是不行的).我主要用于采图片.
2.采集程序何其多,它的特色是完全基于PHP和drupal,直接能用在bluehost等便宜到死的主机上,不需要非常规的PHP插件.
3.并发爬行(一个个爬,等明年吧).bluehost的最大值是50并发,我设置了15个并发,不会让你被bluehost封机器的
4.对wordpress支持相当好,我指的是采集用wordpress做的站.我在做采集的时候发现80%的国外站点是用wordpress做的.
5.我在里面装上了很多drupal必须要用到的模块和帮你下载好了一些我必须用到的模块,你自己选择性安装,方便上手drupal
6.能并发下载图片.
7.能并发上传到picasa,我是穷人,所以得想尽办法省流量,流量是其次,bluehost限制了文件数量最大不超过15万张(15万张,几周就到了,我某个站似乎有70万的图片了).也是这一点,导致我赚不到人民币,万恶的GFW!
使用说明:
慢慢会上来的,放完假了,最后一天假赶工,以完成上篇文章中对自己的诺言….我会开始我新的一个采集站,完全基于这个CMS,然后不断改,一边赚钱一边改程序,直到这个采集程序完善.
1.使用几个action生成初始代码,然后将这个代码放在codes里面,要更新内容的话,可以cron_html定期执行(注:这个程序的采集还是需要站长懂PHP的,虽然我已经非常尽力用multi-step-from写代码去满足你们[我自己是从来不用这些方法的]),学会写一点点PHP,那么你才会真正学会使用该采集程序,达到无站不采….!!!!关键是用好codes页面!!!!
发展:
1.BUG是一定有的.
2.我知道DEDE等的采集都已经很强大.事实上我觉得最大的特色不在于采集,而在于下载图片和上传图片到PICASA,如果你没这个需求,不如用DEDE等国内成熟的采集软件.
3.以后会开源的,等我看到真有人用再说.到时会放到GOOGLE CODE
关于赚美金:
没你想的容易,也没你想的困难,凡事在于尝试与坚持.
希望:
这个CMS能给我带来些新的朋友,新的idea,如果有点钱就更好了,哈哈.
(对了,暂时懒得做下载统计,下了的朋友在回复中哼一声)

