Oct
16
北京消息据京华时报报道,12月26日是2006年国家公务员考试成绩揭晓首日,同一时段点击率过高使得提供查询的国家人事部网站难负重荷,网络堵塞长达7个小时。网站主办方国家人事部政策法规司工作人员解释说,此事系“同一时段点击率过高引发网速滞后”所致。他还说,为迅速解决这一问题,人事部紧急增容了带宽。
下午4时30分,人事部网站得以点开,恢复成绩查询。
Mar
14
1、Best Practices Search Engine Forums
http://www.ihelpyouservices.com/forums/
2、SearchEngineWatch Forums
http://forums.searchenginewatch.com/forum/
3、SEF Search Engine Forums
http://www.jimworld.com/apps/webmaster.forums/
4、SearchGuild Search Engine Forums
http://www.searchguild.com/
5、 High Rankings Search Engine Optimization Forum
http://www.highrankings.com/forum/
6、cre8asiteforum
http://www.cre8asiteforums.com/
7、Digital Point Forums
http://forums.digitalpoint.com/
8、Open Directory Project Public Forum
http://www.resource-zone.com/
9、sitepoint Community Forums
http://www.sitepoint.com/forums/forumdisplay.php?&forumid=3
10、Ask Marketing Experts Forum http://www.ask-marketing-experts.com/forums/
11、Search Engine Marketing Forum http://www.top25web.com/bbs/index.php
12、Search Engine Optimization Forum
http://www.seo-guy.com/forum/
13、JimWorld - Search Engine Forums
http://www.jimworld.com/apps/webmaster.forums/bin/Ultimate.cgi
14、SEO Chat Forums http://forums.seochat.com/
15 WebmasterWorld Forums http://www.webmasterworld.com/
http://www.ihelpyouservices.com/forums/
2、SearchEngineWatch Forums
http://forums.searchenginewatch.com/forum/
3、SEF Search Engine Forums
http://www.jimworld.com/apps/webmaster.forums/
4、SearchGuild Search Engine Forums
http://www.searchguild.com/
5、 High Rankings Search Engine Optimization Forum
http://www.highrankings.com/forum/
6、cre8asiteforum
http://www.cre8asiteforums.com/
7、Digital Point Forums
http://forums.digitalpoint.com/
8、Open Directory Project Public Forum
http://www.resource-zone.com/
9、sitepoint Community Forums
http://www.sitepoint.com/forums/forumdisplay.php?&forumid=3
10、Ask Marketing Experts Forum http://www.ask-marketing-experts.com/forums/
11、Search Engine Marketing Forum http://www.top25web.com/bbs/index.php
12、Search Engine Optimization Forum
http://www.seo-guy.com/forum/
13、JimWorld - Search Engine Forums
http://www.jimworld.com/apps/webmaster.forums/bin/Ultimate.cgi
14、SEO Chat Forums http://forums.seochat.com/
15 WebmasterWorld Forums http://www.webmasterworld.com/
Mar
14
pr2
http://www.1articleworld.com/
http://www.ablearticles.co.uk/
http://www.allaboutarticles.org/
http://www.articlebag.com/
http://www.articlecorral.com/
http://www.articledaddy.com/
http://www.articlefeeder.com/
http://www.articleforyou.com/
http://www.articleinterchange.com/
http://www.articlejoe.com/
http://www.articlelocker.com/
http://www.articlemax.com/
http://www.articlepeak.com/
http://www.articleportal.com/
http://www.articleprobe.com/
http://www.articlerocket.com/
http://www.articlesearchnet.com/
http://www.articlesindex.com/
http://www.articlesnet.co.uk/
http://www.articlesnatch.com/
http://www.articlesonline.org/
http://www.articlesrightnow.com/
http://www.authorcontent.com/
http://www.bestarticlecity.com/
http://www.goodinfohome.com/
http://www.a1-articledirectory.com/
http://www.articlefrenzy.com/
http://www.articlejunction.com/
http://www.article-monster.com/
http://www.articleoptimizer.com/
http://www.articleoptimizer.com/
http://www.articlepipeline.com/
http://www.eclipse-articles.com/
http://www.fetcharticles.com/
http://www.free-article-directory.com/
http://www.articlesalley.com/
http://www.article-store.com/
http://www.contentarticles.com/
http://www.dezinersplace.com/
http://www.freearticlehq.com/
http://www.hotarticles.net/
http://www.internetmagnet.com/
http://www.outblogger.com/articles
pr3
http://www.wisearticles.com/
http://www.acearticles.com/
http://www.acmearticles.com/
http://www.addarticle-submitfree.com/
http://www.ababba.com/
http://www.activearticles.com/
http://www.articleaccess.com/
http://www.articleavenue.com/
http://www.articleboutique.com/
http://www.article-blogs.info/
http://www.articlebliss.com/
http://www.articleblender.com/
http://www.articleboy.com/
http://www.articlebunch.com/
http://www.articlecapital.com/
http://www.articlecircuit.com/
http://www.articlecrazy.com/
http://www.article-database.com/
http://www.articledestination.com/
http://www.article-domain.com/
http://www.articlefair.com/
http://www.articlefarm.com/
http://www.articlefocus.com/
http://www.articlegarden.com/
http://www.articlegroup.com/
http://www.articlehopper.com/
http://www.articlelookup.com/
http://www.articlemailbox.com/
http://www.articleonlinedirectory.com/
http://www.articlepot.com/
http://www.articlerampage.com/
http://www.articles365.com/
http://www.articles24.com/
http://www.articles4reprint.com/
http://www.articles-4-free.com/
http://www.articlesandauthors.com/
http://www.articlesbase.com/
http://www.articleselections.com/
http://www.articles-galore.com/
http://www.articleshelf.com/
http://www.articles-hub.com/
http://www.articles-keyword-rich.com/
http://www.articleskingdom.com/
http://www.articlesmagazine.com/
http://www.articlesnetwork.com/
http://www.articlestack.com/
http://www.articlestash.com/
http://www.bigarticledirectory.com/
http://www.cajun101.com/
http://www.content-corral.com/
http://www.contentfueled.com/
http://www.content-edge.com/
http://www.everydayarticles.com/
http://www.ezinearticles.biz/
http://www.ezine-writer.com.au/
http://www.ezineplug.com/
http://www.findandpostarticles.com/
http://www.free-articles-search.com/
http://www.freebie-articles.com/
http://www.free-content-resource.com/
http://www.freezinesite.com/
http://www.getyourarticles.com/
http://www.geminipublishing.com/
http://ireprint.info/
http://www.superarchives.com/
pr4
http://www.activeauthors.com/
http://www.amazines.com/
http://www.answer-site.com/
http://www.articlebeam.com/
http://www.articlebin.com/
http://www.articlebar.com/
http://www.articlecube.com/
http://www.articledepot.co.uk/
http://www.articlefever.com/
http://www.articlefusion.com/
http://www.articlehub.com/
http://www.articleintelligence.com/
http://www.articlekarma.com/
http://www.articlemap.com/
http://www.articlemarketer.com/
http://www.articlerich.com/
http://www.articles4free.com/
http://www.articlesbeyondbetter.com/
http://www.articlesoup.com/
http://www.articlesphere.com/
http://www.articles-submit.com/
http://www.articlewarehouse.com/
http://www.content-articles.com/
http://www.contentdesk.com/
http://www.contentmasterworld.com/
http://www.ezinecrow.com/
http://www.free-articles-zone.com/
http://www.freecontentzone.com/
http://freeinternetarticles.com/
http://www.freewebsitearticles.com/
http://www.freezine-articles.com/
http://www.goarticles.net/
http://www.infonexus.org/
pr5
http://www.anyarticles.com/
http://www.articlealley.com/
http://www.articlemotron.com/
http://www.articlesexpress.com/
http://www.articleson.com/
http://www.bigarticles.com/
http://www.earticlesonline.com/
http://www.ezinefinder.com/
http://www.iarticlebeach.com/
http://www.isnare.com/
pr6
http://www.articlebiz.com/
http://www.articlecity.com/
http://www.easyarticles.com/
http://www.ezinearticles.com/
http://www.goarticles.com/
http://www.goarticles.com/
http://www.1articleworld.com/
http://www.ablearticles.co.uk/
http://www.allaboutarticles.org/
http://www.articlebag.com/
http://www.articlecorral.com/
http://www.articledaddy.com/
http://www.articlefeeder.com/
http://www.articleforyou.com/
http://www.articleinterchange.com/
http://www.articlejoe.com/
http://www.articlelocker.com/
http://www.articlemax.com/
http://www.articlepeak.com/
http://www.articleportal.com/
http://www.articleprobe.com/
http://www.articlerocket.com/
http://www.articlesearchnet.com/
http://www.articlesindex.com/
http://www.articlesnet.co.uk/
http://www.articlesnatch.com/
http://www.articlesonline.org/
http://www.articlesrightnow.com/
http://www.authorcontent.com/
http://www.bestarticlecity.com/
http://www.goodinfohome.com/
http://www.a1-articledirectory.com/
http://www.articlefrenzy.com/
http://www.articlejunction.com/
http://www.article-monster.com/
http://www.articleoptimizer.com/
http://www.articleoptimizer.com/
http://www.articlepipeline.com/
http://www.eclipse-articles.com/
http://www.fetcharticles.com/
http://www.free-article-directory.com/
http://www.articlesalley.com/
http://www.article-store.com/
http://www.contentarticles.com/
http://www.dezinersplace.com/
http://www.freearticlehq.com/
http://www.hotarticles.net/
http://www.internetmagnet.com/
http://www.outblogger.com/articles
pr3
http://www.wisearticles.com/
http://www.acearticles.com/
http://www.acmearticles.com/
http://www.addarticle-submitfree.com/
http://www.ababba.com/
http://www.activearticles.com/
http://www.articleaccess.com/
http://www.articleavenue.com/
http://www.articleboutique.com/
http://www.article-blogs.info/
http://www.articlebliss.com/
http://www.articleblender.com/
http://www.articleboy.com/
http://www.articlebunch.com/
http://www.articlecapital.com/
http://www.articlecircuit.com/
http://www.articlecrazy.com/
http://www.article-database.com/
http://www.articledestination.com/
http://www.article-domain.com/
http://www.articlefair.com/
http://www.articlefarm.com/
http://www.articlefocus.com/
http://www.articlegarden.com/
http://www.articlegroup.com/
http://www.articlehopper.com/
http://www.articlelookup.com/
http://www.articlemailbox.com/
http://www.articleonlinedirectory.com/
http://www.articlepot.com/
http://www.articlerampage.com/
http://www.articles365.com/
http://www.articles24.com/
http://www.articles4reprint.com/
http://www.articles-4-free.com/
http://www.articlesandauthors.com/
http://www.articlesbase.com/
http://www.articleselections.com/
http://www.articles-galore.com/
http://www.articleshelf.com/
http://www.articles-hub.com/
http://www.articles-keyword-rich.com/
http://www.articleskingdom.com/
http://www.articlesmagazine.com/
http://www.articlesnetwork.com/
http://www.articlestack.com/
http://www.articlestash.com/
http://www.bigarticledirectory.com/
http://www.cajun101.com/
http://www.content-corral.com/
http://www.contentfueled.com/
http://www.content-edge.com/
http://www.everydayarticles.com/
http://www.ezinearticles.biz/
http://www.ezine-writer.com.au/
http://www.ezineplug.com/
http://www.findandpostarticles.com/
http://www.free-articles-search.com/
http://www.freebie-articles.com/
http://www.free-content-resource.com/
http://www.freezinesite.com/
http://www.getyourarticles.com/
http://www.geminipublishing.com/
http://ireprint.info/
http://www.superarchives.com/
pr4
http://www.activeauthors.com/
http://www.amazines.com/
http://www.answer-site.com/
http://www.articlebeam.com/
http://www.articlebin.com/
http://www.articlebar.com/
http://www.articlecube.com/
http://www.articledepot.co.uk/
http://www.articlefever.com/
http://www.articlefusion.com/
http://www.articlehub.com/
http://www.articleintelligence.com/
http://www.articlekarma.com/
http://www.articlemap.com/
http://www.articlemarketer.com/
http://www.articlerich.com/
http://www.articles4free.com/
http://www.articlesbeyondbetter.com/
http://www.articlesoup.com/
http://www.articlesphere.com/
http://www.articles-submit.com/
http://www.articlewarehouse.com/
http://www.content-articles.com/
http://www.contentdesk.com/
http://www.contentmasterworld.com/
http://www.ezinecrow.com/
http://www.free-articles-zone.com/
http://www.freecontentzone.com/
http://freeinternetarticles.com/
http://www.freewebsitearticles.com/
http://www.freezine-articles.com/
http://www.goarticles.net/
http://www.infonexus.org/
pr5
http://www.anyarticles.com/
http://www.articlealley.com/
http://www.articlemotron.com/
http://www.articlesexpress.com/
http://www.articleson.com/
http://www.bigarticles.com/
http://www.earticlesonline.com/
http://www.ezinefinder.com/
http://www.iarticlebeach.com/
http://www.isnare.com/
pr6
http://www.articlebiz.com/
http://www.articlecity.com/
http://www.easyarticles.com/
http://www.ezinearticles.com/
http://www.goarticles.com/
http://www.goarticles.com/
Mar
14
这几天试用了一下dede,发现dede真是强大啊,功能非常的丰富。个人感觉dede比起国外的那些什么dupal,manboo,jommla之类的都强多了,至少我花了两天时间研究dede才有点头绪,国外的那些基本上一个下午玩玩就会了。不过我感觉dede最强大的地方还是采集,今天研究了下dede的分页内容采集,稍有体会,写个教程留个纪念吧,也希望给新手一点指导,老手就不用看了。
我们以采集http://www.xiaocao.com/text/class1/class1/200609/text_28623.html 作为例子吧,这是一个典型的内容页面,文章的最下面有分页的地址。

首先,我们新建一个采集节点,如下图

注意,这里我用的是文章网址,不是文章列表网址,主要是为了演示方便,你也可以用文章列表网址替换你自己的来源网址,这里我就不多说了。
接下来就是设置分页匹配规则了,什么是分页匹配规则呢?我的理解就是告诉dede网页中哪些地方是放文章分页链接的,dede从中提取分页的链接地址。这里我们只要查看目标网页的源代码,找到分页地址附近的html代码就行了,如图。

然后填入分页匹配规则,这里的"[var:分页区域]"就是目标网页中分页链接的部分。右边的两个单选框,分别对应的是全部列出的分页列表形式,比如:"[1] [2] [3] 下一页";上下页形式的分页列表形式,比如:"[上一页] [下一页]"。容易看出,我们的目标网页是属于第一种情况,即所有的分页地址都已经列出来了。

下面就是设置采集的各个字段了,这里我只讲一下文章内容字段的规则,其他的规则比较简单,看看dede官方网站上的教程就足够了。

上图中匹配区域比较简单,我不多说了,重点是过滤规则。这里的过滤规则主要是把目标网页中的分页链接地址去掉,不然的话,那些分页链接也会作为文章内容采集过来,生成出来会很难看。因为我们要过滤的是分页链接地址,所以一定记得要把旁边的“分页内容字段”选上,不然在采集的时候会出错。如果是过滤其他内容的时候,可以不用选。还有一个要注意的地方就是:过滤规则里面的内容都是正则表达式,而匹配区域里面的不是,前面说的分页匹配规则里面的也不是。
至此,采集节点就设置完了,保存之后就可以开始采集了。

采集完成之后,我们在采集的内容里面能看到上图所出现的标记,那就是内容分页的标记,在生成html的时候,就会从标记的地方分页,如果你没有看到那个标记,说明采集节点的设置不对,自己再好好检查一下。
好了,最后是导出数据,然后生成html,看看我们采集出来的文章分页是什么样子吧:


效果非常好,看来dede确实非常强悍啊,呵呵。最后说明一下我的dede版本:3.1 lit,如果还有什么问题,欢迎一起探讨。
最后,把这个例子的配置文件贴出来,方便大家学习:
{!-- 节点基本信息 --}
{dede:item name='实用范文-工作总结'
imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'}
{/dede:item}
imgurl='/upimg' imgdir='../upimg' language='gb2312' typeid='1' macthtype='string'}
{/dede:item}
{!-- 采集列表获取规则 --}
{dede:list source='app' sourcetype='archives'
varstart='1' varend='26'}
{dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}http://www.xiaocao.com/text/class1/class1/200609/text_28623.html{/dede:url}
{dede:need}text_{/dede:need}
{dede:cannot}{/dede:cannot}
{dede:linkarea}<td class="newtitle"> <b>工作总结文章列表</b></td>[var:区域]<!-- 分页开始 -->{/dede:linkarea}
{/dede:list}
varstart='1' varend='26'}
{dede:url value='http://www.xiaocao.com/text/class1/class1/200609/text_28623.html'}http://www.xiaocao.com/text/class1/class1/200609/text_28623.html{/dede:url}
{dede:need}text_{/dede:need}
{dede:cannot}{/dede:cannot}
{dede:linkarea}<td class="newtitle"> <b>工作总结文章列表</b></td>[var:区域]<!-- 分页开始 -->{/dede:linkarea}
{/dede:list}
{!-- 网页内容获取规则 --}
{dede:art}
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font> [var:分页区域] </b>{/dede:sppage}
{dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'
isunit='' isdown=''}
{dede:match}<title>[var:内容]</title>{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = "范文"{/dede:function}
{/dede:note}
{dede:note field='dede_a rchives.litpic' value='[var:内容]' comment='缩略图'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = @litpic;{/dede:function}
{/dede:note}
{dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'
isunit='1' isdown=''}
{dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0">{/dede:match}
{dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim}
{dede:sppage sptype='full'}<p align='center'><b><font color='red'>[1]</font> [var:分页区域] </b>{/dede:sppage}
{dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'
isunit='' isdown=''}
{dede:match}<title>[var:内容]</title>{/dede:match}
{dede:function}{/dede:function}
{/dede:note}
{dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.writer' value='[var:内容]' comment='文章作者'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = "范文"{/dede:function}
{/dede:note}
{dede:note field='dede_a rchives.litpic' value='[var:内容]' comment='缩略图'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = @litpic;{/dede:function}
{/dede:note}
{dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'
isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}@me = time();{/dede:function}
{/dede:note}
{dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'
isunit='1' isdown=''}
{dede:match}<script language="JavaScript" type="text/javascript" src="/AD/artcontent.js"></script>[var:内容]<table width="100%" border="0" cellspacing="0" cellpadding="0">{/dede:match}
{dede:trim}<p align='center'><b>(.*)</b></p>{/dede:trim}
{dede:function}{/dede:function}
{/dede:note}
{/dede:art}
{/dede:note}
{/dede:art}
Mar
10
禁止搜索引擎收录的方法什么是robots.txt文件? 搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。 您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt文件放在哪里? robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。网站 URL 相应的 robots.txt的 URL http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt robots.txt文件的格式 "robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:":"。在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:User-agent: 该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。Disallow: 该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。robots.txt文件用法举例 例1. 禁止所有搜索引擎访问网站的任何部分 下载该robots.txt文件 User-agent: * Disallow: / 例2. 允许所有的robot访问 (或者也可以建一个空文件 "/robots.txt" file) User-agent: *Disallow: 例3. 禁止某个搜索引擎的访问 User-agent: BadBotDisallow: / 例4. 允许某个搜索引擎的访问 User-agent: baiduspiderDisallow: User-agent: *Disallow: / 例5.一个简单例子 在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。 需要注意的是对每一个目录必须分开声明,而不要写成 "Disallow: /cgi-bin/ /tmp/"。 User-agent:后的*具有特殊的含义,代表"any robot",所以在该文件中不能有"Disallow: /tmp/*" or "Disallow:*.gif"这样的记录出现. User-agent: *Disallow: /cgi-bin/Disallow: /tmp/Disallow: /~joe/ robots.txt文件参考资料 robots.txt文件的更具体设置,请参看以下链接:· Web Server Administrator's Guide to the Robots Exclusion Protocol · HTML Author's Guide to the Robots Exclusion Protocol · The original 1994 protocol description, as currently deployed· The revised Internet-Draft specification, which is not yet completed or implemented





