大多数这些应用程序都有点严格
在很多情况下,我在博客圈中找不到太多数据,因此我决定通过一系列小实验来测试其中的一些问题。,您可能永远不会在真实的网站上尝试它们,但我认为它们都有助于测试规范标签的限制以及 Google 如何处理它。 了解更多: 规范化 – 什么是规范标签? (1) 跨域聚合 兰德最近写了一篇关于他跨域使用规范标签的经验,我有机会在我的两个网站上尝试一下。
动机是合理的——我写了
篇关于庆祝创业 5 周年的帖子,在我的公司(用户效应)和个人(30GO30)博客上交叉发布 美国电话号码列表 是有意义的。由于我的个人博客相对较新,而且我觉得这篇文章更多是个人的而不是公司的,所以我希望他作为文章的来源而得到认可。 当然,我公司的博客相当古老,而且在您能想到的各个方面都很强大。
我在下面列出了一些指标
(从测试开始),供参考: 域统计 因此,显而易见的问题是:跨域规范 几乎可以自由开发几乎不需要任何检查的人工智能 标签是否可以覆盖我公司博客实际上更真实的所有其他信号? 简短的回答是:“是”。 5 月 10 日,我几乎同时在两个博客上发表了这篇文章。第二天,Google 开始对主页中的帖子标题进行索引(两个 SERP 中都出现了 2 个主页)。
日整个帖子被索引
排名仅在30GO30(帖子标题)。谷歌似乎对从强域到弱域的跨域规范没有问题。 (2)<BODY>标签中的Canonical 对于跨域使用规范标签的一个常见担忧是它可能被劫持。当然,有人可以破解您的服务器,但如果您允许用户生成内容而有人只是在页面中间留下规范标签怎么办? 为了测试这一点,我在结束 </BODY> 标记之前删除了一个规范标记。
我引用了同一域上的页面
假设 Google 更有可能处理内部规范而不是跨域(如果可行,我可以进入第二阶段)。错误放置的标 临时邮箱 签似乎没有任何影响 – 我在 5 月 9 日进行了更改,该页面对 5 月 14 日和 5 月 18 日的 SERP 没有影响。 在我开始这个实验后,Matt Cutts 发布了有关典型极端情况的文章并解决了这个特定问题: 首先,这是一个思考练习:如果我们在 HTML 正文中看到 rel=canonical,Google 是否应该信任它?答案是否定的,因为某些网站允许人们编辑网站页面上的内容或 HTML。
如果 信任
文中的 rel=canonical,我们会看到更多的攻击,人们会尝试通过在网页上放置 rel=canonical 来劫持网页的一部分。 因为我已经处于中等水平,所以我想我会顺其自然,但很高兴看到确认。 (3) 无效 <HEAD> 中的规范 为了不让我被指责盲目地听从马特所说的任何内容(只要我链接到他的博客,我几乎就可以指望它),我尝试了(2)的变体。