发布于 10 年前 作者 alsotang




  1. rubychina 在 google 中为何能显示那么丰富的版块信息?
  2. 我们社区的描述部分看起来好乱,我应该改进哪个地方?
  3. 为何 ruby-china 有搜索框?
  4. 论坛现在的帖子有 4w 多了,如果我想提供 sitemap 给搜索引擎的话,搜索引擎一般都不允许单个的 sitemap 超过 5w 行。超过 5w 行时推荐拆成子 sitemap。 请问我该如何拆分好呢?我以每用户来拆分 sitemap 的话,是不是太细了?
@alsotang 哈哈,我昨天整理了一些也发现了这点,而且我也拿ruby-china对比了一下,看来我们想一块了

另外,我这边搜cnode/cnodejs也是有搜索框的,还有一点我们的关键词处理的不好,搜cnode和cnodejs结果差别比较大 QQ20140925-3@2x.png

@Ricardo-Li 我开了个匿名浏览器,发现 cnode 和 cnodejs 搜出来的都是有搜索框的,奇怪了。

确实 cnode 和 cnodejs 的结果有差异,但是我觉得两者还是得取其一吧,cnode 听起来好听点。

我刚才做了 sitemap 特性出来,http://cnodejs.org/sitemap.xml ,现在跟 baidu 和 google 提一下,看看百度那边的收录能不能高点。 现在 google 收了 4w 多,但是百度才索引了 1w 多。不懂 google 多收录的是什么。

@Ricardo-Li 不知道google搜索结果中的描述和板块能不能自定义,我看 ruby-china 的描述也比较好看,我们的很乱。

sitemap.xml 文件可以指定板块, 就是不知道怎么调试那东西

Google搜索引擎的爬虫遵循Making AJAX Applications Crawlable规约。


  • 在首页页面源代码中加入<meta name="fragment" content="!">
  • URL中所有以#开始的片段,都修改为#!,服务端路由处理函数做相应的处理;
  • 在sitemap中列出希望爬虫抓取的URL

Fecth as Google工具测试效果。


可以借鉴prerender node的实现思路:如果HTTP请求头部中包含_escaped_fragment_,或者UserAgent字符串中有搜索引擎爬虫的标志,则返回一个自定义的页面快照。


@hades 我可以说这个回复没有帮助吗…

@bnuhero 你这个答案主要是面向重 ajax 渲染的网站的吧?

@alsotang 我找同士确认了一下,搜出来的第一个是权威答安,你说的第二个是,谷歌根据,网站首页的,导航按用户的点击来生成的,那个会经常变的。




@hades 嗯嗯,谢谢哈
