想问大家几个问题:
- rubychina 在 google 中为何能显示那么丰富的版块信息?
- 我们社区的描述部分看起来好乱,我应该改进哪个地方?
- 为何 ruby-china 有搜索框?
- 论坛现在的帖子有 4w 多了,如果我想提供 sitemap 给搜索引擎的话,搜索引擎一般都不允许单个的 sitemap 超过 5w 行。超过 5w 行时推荐拆成子 sitemap。 请问我该如何拆分好呢?我以每用户来拆分 sitemap 的话,是不是太细了?
@Ricardo-Li 帮看看
@alsotang 哈哈,我昨天整理了一些也发现了这点,而且我也拿ruby-china对比了一下,看来我们想一块了
另外,我这边搜cnode/cnodejs也是有搜索框的,还有一点我们的关键词处理的不好,搜cnode和cnodejs结果差别比较大
@Ricardo-Li 我开了个匿名浏览器,发现 cnode 和 cnodejs 搜出来的都是有搜索框的,奇怪了。
确实 cnode 和 cnodejs 的结果有差异,但是我觉得两者还是得取其一吧,cnode 听起来好听点。
我刚才做了 sitemap 特性出来,http://cnodejs.org/sitemap.xml ,现在跟 baidu 和 google 提一下,看看百度那边的收录能不能高点。 现在 google 收了 4w 多,但是百度才索引了 1w 多。不懂 google 多收录的是什么。
@Ricardo-Li 不知道google搜索结果中的描述和板块能不能自定义,我看 ruby-china 的描述也比较好看,我们的很乱。
Google搜索引擎的爬虫遵循Making AJAX Applications Crawlable规约。
几个要点是:
- 在首页页面源代码中加入
<meta name="fragment" content="!">
; - URL中所有以
#
开始的片段,都修改为#!
,服务端路由处理函数做相应的处理; - 在sitemap中列出希望爬虫抓取的URL
用Fecth as Google工具测试效果。
Bing和Yahoo也支持Google爬虫规范。
可以借鉴prerender node的实现思路:如果HTTP请求头部中包含_escaped_fragment_
,或者UserAgent字符串中有搜索引擎爬虫的标志,则返回一个自定义的页面快照。
是这个吗?
对于用户搜索一些基本的常识问题,Google会在排名第一的位置直接给出答案,如搜索where is the forbidden city, where is terracotta army等,不显示答案的来源链接,这会大大减少用户点击链接进入来源网站的机会,从而减少网站的访问量。
When Google Shows A Source Or Credit For Quick Answers & Knowledge Graph Google says it doesn’t provide a source link when the information is basic factual data. Barry Schwartz on September 15, 2014 at 9:03 am • 535 • • • • More
As Google continues to provide quick answers and knowledge graph data directly at the top of the search results, publisher concerns continue to rise. Publishers are worried that searchers will have less of a need and desire to click through from Google’s search results page to the publisher’s page, leaving the publishers with very little methods to monetize their content, thus reducing their ability to add more useful content to their site over time. I asked Google recently, when and how do they decide to provide a “source” link in the search results when they show quick answers or knowledge graph data. For example, a search for [what is SEO] returns a quick answer from Wikipedia with a link to Wikipedia:
But a search for [how old is obama] just gives the answer, without citing a source:
A Google spokesperson tells us that when the information is “basic factual information you can find many places (e.g., when Obama was born),” they will “just present it as is” without providing a source. But when the information is “not widely-known information” or when they “show relevant snippets from webpages,” Google will “typically show the source.” Google added that in “some cases”, such as when they are “working directly with the source” they may not show the source. This last example of not showing the source when working directly with the source is with the iPhone 6 answers that came up in Google last week.
@hades 我可以说这个回复没有帮助吗…
@bnuhero 你这个答案主要是面向重 ajax 渲染的网站的吧?
@alsotang 我找同士确认了一下,搜出来的第一个是权威答安,你说的第二个是,谷歌根据,网站首页的,导航按用户的点击来生成的,那个会经常变的。
我们公司的也是rubychina那些排得很整齐。
基本上就是要要有一个清晰的网站首页。
不知道这样的回答可否有用?
@hades 嗯嗯,谢谢哈