Archive for the ‘Google系列’ Category

在昨天(准确的说应该是今天凌晨),Google Reader是如何提取文章的作者信息? 一文中做了一个测试。 修改了两个地方: 一、把Wordpress后台中的nicename一项由原来的“zetal”更改成了“易智勇”; 二、在文章的结尾由原来的“Author:Zetal”更改成了“Author:易智勇”; 结果在文章发布后一个小时后去查看Google Reader中的订阅信息时,发现自己站点文章的作者信息全部都已经更改成了“易智勇”。 根据昨天的分析加上这个Test,应该可以确定,Google Reader在提取Blog文章(至少WP挂起来的博客应该是的)的作者信息时候,是由发表文章的帐号的nickname的信息。至于WP之外的Blog没有试过。 只是,在每篇文章的html源码中还是找不出什么端倪。虽然知道了应该可以通过对Nickname的修改来更改在Google Reader中自己想要显示的作者信息,但是却不知其根本的原因。What can I do? PS: 在已收录的URL和自己生产的sitemap.xml中找到一个和author有关的URL,http://www.i-zetal.com/author/admin/ 这个页面的title中的第一个词就是在后台的Nickname设置的值。或许这也是一种可能?Google Reader是从这一类型的页面去判断出来的? Author:Zetal Time:2010/1/31 19:19

Sunday, January 31st, 2010 at 19:19 | 2 comments
Categories: Google系列

今天在Google Reader中看订阅的文章发现,每个条目下面都有“作者:”这个信息,对于SEMyj中的作者信息,他可以识别出来作者是 Phyllis 还是 国平 ,我觉得还能理解,因为在其每篇文章的下面都有“Phyllis 发表在 PPC入门 于 2010年, 一月 20th | 35 个评论” 这样的信息,对应到源代码是: <div class=”articleinfo”> <b> Phyllis </b> 发表在 <a href=”http://www.semyj.com/archives/category/ppc” title=”查看 PPC入门 的全部文章” rel=”category tag”>PPC入门</a>  于2010年,一月 20th | <a href=”#postcomment” title=”留下评论”> 35 个回复 </a></div> 以谷歌的“智商”,或许可以通过语义分析出来作者是“Phyllis”。 可是为什么我自己的站点在Google Reader中的作者信息是“作者:Zetal”,在我的post中仅有文章的结尾的地方有“Author:Zetal”这条信息可能会被用来判断作者信息,可是我又看到在我转载的那几篇文章的那个作者信息也是如此,所以我把这种想法否定掉了。 我想到,在我的wp后台设置帐号的地方,有nickname我设置的是,zetal,可是也用的是小写,而且对于搜索引擎来说,应该是从页面的html中的信息去收集和分析出这些信息的。盯着源码看了许久,我暂时看不出Google Reader为什么把我的作者信息判断为“Zetal”,而不是“易智勇”呢?文章周围的信息、meta标签、link标签都看了,也没见有什么明显的地方,我告诉了Google,我的nickname是Zetal啊。 我现在先把后来的nickname改成了“易智勇”,并且在文章后面的Author信息也做一定修改,明天看看在Google Reader中的作者信息是否有变化呢? Author:易智勇 Time:2010/1/31

Sunday, January 31st, 2010 at 00:58 | 0 comments
Categories: Google系列