重複的内容是指,相同的内容出现在网际网路上多个地方。 「一个地方」被定义为唯一网址(URL),因此如果相同的内容出现在多个网址上,则表示您的网站内容重複。
虽然在技术上不是一种惩罚,但重複的内容有时还会影响搜寻引擎的排名。 如Google所称,在互联网上的多个位置存在多个“明显相似”的内容时,搜寻引擎可能很难决定哪个版本与给定的搜寻查询更相关。
重複的内容可能会对搜寻引擎提出三个主要问题:
他们不知道哪个版本包含/不包括在他们的索引中。
他们不知道是否将连结指标(网站信任评分,网站权威评分,文字连结,反向连结价值...等)指哪一个页面,或保持它为多个分开的版本。
他们不知道要为查询结果排名哪个网页版本。
当存在重複的内容时,网站所有者可能遭受排名和流量损失,这些损失通常来自两个主要问题:
为了提供最佳搜寻体验,搜寻引擎很少会显示同一内容的多个网页版本,因此最有可能是,被迫选择其中一个版本,这会稀释了其他版本的曝光度。
链接公平可能会被进一步稀释,因为其他网站也必须在重複之间进行选择。 而不是所有的入站链接指向一个内容,他们链接到多个片断,在重複之间传播链接公平。 由于入站链接是排名因素,因此这会影响一段内容的搜寻可见性。
在绝大多数情况下,网站所有者不会故意创建重複的内容,但是,这并不表示不会发生,实际上据估计,高达29%的网页内容实际上是重複的内容!
让我们来看看一些最常见的重複内容是无意中创建的:
网址参数(如点击跟踪和某些分析代码)可能会导致重複的内容问题,这个可能性的问题,不仅仅会由参数本身产生,还包括这些参数在URL中出现的顺序。
程式码範例
www.newscan.com.tw/blue-widgets?color=blue 重複于 www.newscan.com.tw/blue-widgets
www.newscan.com.tw/blue-widgets?color=blue&cat=3 重複于 www.newscan.com.tw/blue-widgets?cat=3&color=blue
同样,session ID是常见的重複内容发生原因,当浏览网站的每一个用户,网址参数URL中有不同session ID时,就会发生这种情况。
当多个版本的网页被索引时,友善列印的内容也会导致重複的内容问题。
www.newscan.com.tw/blue-widgets 重複于 www.newscan.com.tw/print/blue-widgets
这里的一个警讯是,可能的话,比较好的避免方式是,不添加URL参数或URL的替代版本(其中包含的信息通常可以通过scripts传递)。
如果您的网站在“www.site.com”和“site.com”上有不同的版本(带有或不带有“www”),并且在这两个版本中都有相同的内容,你应该已经有创建了每个版本的重複网页。
这同样适用于在http://和https://上维护版本的网站。如果网页的两个版本都是存在的并且可以被搜索引擎可以检索的,应该也是会遇到重複的内容问题。
内容不仅包括部落格文章或编辑内容,还包括产品讯息网页,在自己的网站上重新发布您的部落格内容,有可能是一个更为常见的重複内容来源,但电子商务网站也存在一个共同的问题:产品资讯,如果很多不同的网站出售相同的商品,而且他们都使用製造商对这些商品的描述,那幺相同的内容就会出现在网路上的多个位置。
修复重複内容的主要宗旨,就是指定哪个内容是【最正确的】。
只要网站上的内容可以在多个网址上找到,就应该对搜索引擎进行规範化处理,我们来看看三种主要方法:
使用301重定向到正确的URL,rel = "canonical " 属性,或使用 Google Search Console中的参数处理工具。
在许多情况下,处理重複内容的最佳方法是设置301转址从「重複」网页到原始内容网页。
当多个排名好的网页被合併成一个页面时,他们不仅不再相互竞争,他们也创造一个更强的相关性和整体流行讯息,这将对「正确」页面排名良好的能力产生良好的影响。
Rel="canonical"
处理重複内容的另一个选项是使用rel = canonical
属性。 这告诉搜索引擎一个特定的网页应该被视为一个指定的URL副本,所有的连结、内容指标和搜索引擎将导入于这个网页的【排名权重】并且应该被记录到指定的URL。
rel =“canonical”
属性是网页HTML表头的一部分,如下:
程式码範例
将 rel = canonical
属性添加到每个重複的网页的HTML表头上面,将上述範例“来源网页连结”部分由你的原始网页的替换连结(请保留引号),该属性传递与301重定向相同数量的连结权限(排名能力),并且由于它在网页(而不是服务器)上修复,所以通常需要较少的时间执行修复。
在处理重複内容时,使用Meta Robots标籤是很有用的,当放入“noindex,follow”
时。 通常称为Meta Noindex,Follow
和技术上称为content =“noindex,follow”
添加这些Meta Robots标记到的每个单独页面的HTML头部,应该可以从搜索引擎索引中排除。
程式码範例
上述 Meta Robots 标籤允许搜索引擎抓取网页上的连结,但不让这些连结包含在该索引中。
有一点非常重要,即使您要求Google不要抓取重複的网页,Google仍然有可能将其编入索引,因为Google有明确提醒您不要在您的网站上限制对重複内容的抓取访问。(搜索引擎希望能够看到你的代码中可能的错误,是因为希望可以排除意外因素,这使得他们可以在不确定的状况下做出一个「可能是自动的」“呼叫判定”。
使用Meta Robots 解决与分页有关的重複内容问题的一个好的方式。
Google Search Console可让您设定网站的主要网域( https://newscan.com.tw/ 替代为 https://www.newscan.com.tw/ ) 与指定Googlebot 可能使用不同的方式抓取各种网址参数(参数处理)。
Google根据您的URL结构和重複内容问题的原因,设置您的主选域名称或参数处理(或两者都设置)可能会提供一个解决方案。
使用参数处理作为处理重複内容的主要方法的主要缺点是您所做的更改仅适用于Google,使用Google Search Console的任何规则都不会影响Bing或任何其他搜索引擎的抓取工具如何解读您的网站; 除了调整Search Console中的设置之外,您还需要将网站站长工具用于其他搜索引擎。。
在整个网站内部进行连结时保持一致,例如如果网站管理员确定域名的版本为www.example.com/,则所有内部连结应该转到http://www.example.com/example而不是http://example.com/ 页面(注意缺少www)。
在组合文章内容时,请确保组合网页将正确连结导回原始内容,而不是使用URL变体方式。
添加一个额外的保护措施,以防止文章内容被盗取并且被窃取SEO权重,明智的做法是添加一个自我指向的 rel = canonical
连结到您的现有网页,这是一个canonical的属性,指向它已经在的URL,重点是挫败文章盗取者的努力。
虽然并不是所有的文章盗取都会经由来源代码(完整的HTML代码),但有些会,对于那些有盗取来源代码的,只要有使用 rel = canonical标籤将确保您的网站的版本被认为是“原始”内容。
「网站内部(On-Site SEO)SEO」,也可以称为「网页内部SEO(on-page SEO)」,是指单在网站上执行的优化网站的元素(其它如,连结到其它网际网路与其它外部信息,统称为「非网站内部SEO」,在此章节先不讨论),从自然搜寻上,提高网站搜寻排序并赚取更多有意义的流量,「网站内部SEO」,藉由优化网页内容与HTML程式码的网页来达成。仅此于帮助搜寻引擎解释网页内容,适当的网页SEO指是...
2 Google蜂鸟演算法-新视野网页设计Google蜂鸟初始发布日期:2013年8月20日与之前发布的「熊猫演算法」和「企鹅演算法」更新不同,后者最初是作为Google现有算法的附件发布的,目前「蜂鸟演算法」已彻底转变成为核心算法引用, 虽然核心算法中许多先前组件还是保持着,但「蜂鸟演算法」表明Google开始深入了解搜寻者「查询资料的意图为何?」,并将其与相关结果进行匹配。谷歌在2013年9月26日宣布了「蜂鸟演算法」,但实际上大约一...
3 网页因素 - On-Page Factors -新视野网页设计以一个网页的内容来说,为什幺值得目前搜索的排名结果,是应该依照搜寻者的观点来看的,当然对于搜索引擎来说这也是非常重要的,因此,创建优质内容是非常重要的, 什幺是优质内容呢? 从SEO的角度来看,所有好的内容都需要有两个要点,好的内容必须提供需求,并且是可以被连结的。就如同全球经济市场相同,讯息会依照供应与需求的关係而受到影响。 最优质的网页内容是可以提供最大需求的工作, 它可能是一个XKCD漫画的...
4 外部连结 - External Links-新视野网页设计外部连结是超连结,来源非自身网址之外的任何网址。简单的说,如果另一个网站连结到你,这被认为是到你的网站的外部连结。同样如果您连结到另一个网站,这也被视为一个外部连结。程式範例a href= http://www.external-domain.com/ Link Anchor Text /a 最佳方式在锚点文字中使用描述性关键字,这些关键字反映了目标网页所指定的相同主题或关键字,没有必要每次都使用...
5 Robots Meta 指令 - Robots Meta Directives -新视野网页设计Robots Meta 指令(有时也称为“Meta标籤”)是一些程式语法,它们提供网页爬虫如何抓取或索引网页内容的抓取指令,虽然robots.txt文件指令也可以帮网路爬虫提供了如何抓取网站的建议,但Robots Meta指令提供了更为严格的,指导网页爬虫如何抓取和索引页面的内容。有两种类型的Robots Meta 指令:属于HTML页面(如meta robots tag)的部分,以及Web服务器...
6 网页描述 - Meta Description -新视野网页设计网页描述 - Meta DescriptionMeta description(网页描述)是HTML属性,提供简明的网页摘要。它们通常出现在搜索引擎结果页面(SERP)中的蓝色可点击链接下。例如:Meta description可以是任意长度,但是搜寻引擎通常会截断超过160个字符之后的片段。最好保留Meta description有足够长度的说明,但是需要比160个字符的限制短。Meta des...
7 锚点文字 - Anchor Text-新视野网页设计锚点文字是超连结中可见的可点击文本。在现代浏览器中,它通常是蓝色和下底线方式呈现,例如这个连结到新视野网页设计公司首页。程式範例a href= http://www.example.com Example Anchor Text /a 搜寻引擎优化友善的锚点文字是简洁的、与目标网页相关的(从这个网页连结过去的网页)。什幺是锚点文字?锚点文字是连结到网站上其它文件档或显示位置时的超连结,显示方式为可...
8 Google Medic Update做了那些改变? YMYL是什幺?-新视野网页设计他所代表的意思很简单,就是“Your Money or Your Life.”,中文来就就是,生活与财产相关的网页,将来GOOGLE对于YMYL相关的内容将更为重视。哪些是YMYL的网页呢?虽然GOOGLE有提到Money字眼,但是他说的内容涵盖并不单单只是金钱,据GOOGLE所描述的,任何可以影响人们健康、快乐、安全或是财务的网站页面都是属于YMYL範围内。1.如果你的网站或是在网页中有提到股票...
9 网址连结 - URLs -新视野网页设计URL(全球资源定址器)(更一般地称为“网址”)指定网际网路上资源(例如网页)的位置。 该URL还指定如何检索该资源(也称为“协议”,如HTTP,HTTPS,FTP等)。Code Samplehttp://www.exampledomain.com强制限制字数要在所有浏览器中正确呈现,URL必须少于2,083个字符。http://www.example.com/category-keyword/s...
10 网址、网域、网名 - Domains -新视野网页设计什幺是网址(Domains)?网址是网站唯一的、人类可读的网际网路地址,它们由三部分组成:顶级网址(有时称为扩展网址或网址后缀)、一个网址(或IP地址)和一个可选的子网址。只有网址和顶级网址的组合被称为“根网址”,http://”是页面URL的一部分,但不是网址,被称为“协议”。让我们更仔细地看看这些元素:顶级网址(TLD)是出现在网址末尾的后缀的正式名称。顶级网址的一些例子包括:.com.net...
「网站内部(On-Site SEO)SEO」,也可以称为「网页内部SEO(on-page SEO)」,是指单在网站上执行的优化网站的元素(其它如,连结到其它网际网路与其它外部信息,统称为「非网站内部SEO」,在此章节先不讨论),从自然搜寻上,提高网站搜寻排序并赚取更多有意义的流量,「网站内部SEO」,藉由优化网页内容与HTML程式码的网页来达成。仅此于帮助搜寻引擎解释网页内容,适当的网页SEO指是...
2 Google蜂鸟演算法-新视野网页设计Google蜂鸟初始发布日期:2013年8月20日与之前发布的「熊猫演算法」和「企鹅演算法」更新不同,后者最初是作为Google现有算法的附件发布的,目前「蜂鸟演算法」已彻底转变成为核心算法引用, 虽然核心算法中许多先前组件还是保持着,但「蜂鸟演算法」表明Google开始深入了解搜寻者「查询资料的意图为何?」,并将其与相关结果进行匹配。谷歌在2013年9月26日宣布了「蜂鸟演算法」,但实际上大约一...
3 网页因素 - On-Page Factors -新视野网页设计以一个网页的内容来说,为什幺值得目前搜索的排名结果,是应该依照搜寻者的观点来看的,当然对于搜索引擎来说这也是非常重要的,因此,创建优质内容是非常重要的, 什幺是优质内容呢? 从SEO的角度来看,所有好的内容都需要有两个要点,好的内容必须提供需求,并且是可以被连结的。就如同全球经济市场相同,讯息会依照供应与需求的关係而受到影响。 最优质的网页内容是可以提供最大需求的工作, 它可能是一个XKCD漫画的...
4 外部连结 - External Links-新视野网页设计外部连结是超连结,来源非自身网址之外的任何网址。简单的说,如果另一个网站连结到你,这被认为是到你的网站的外部连结。同样如果您连结到另一个网站,这也被视为一个外部连结。程式範例a href= http://www.external-domain.com/ Link Anchor Text /a 最佳方式在锚点文字中使用描述性关键字,这些关键字反映了目标网页所指定的相同主题或关键字,没有必要每次都使用...
5 Robots Meta 指令 - Robots Meta Directives -新视野网页设计Robots Meta 指令(有时也称为“Meta标籤”)是一些程式语法,它们提供网页爬虫如何抓取或索引网页内容的抓取指令,虽然robots.txt文件指令也可以帮网路爬虫提供了如何抓取网站的建议,但Robots Meta指令提供了更为严格的,指导网页爬虫如何抓取和索引页面的内容。有两种类型的Robots Meta 指令:属于HTML页面(如meta robots tag)的部分,以及Web服务器...
6 网页描述 - Meta Description -新视野网页设计网页描述 - Meta DescriptionMeta description(网页描述)是HTML属性,提供简明的网页摘要。它们通常出现在搜索引擎结果页面(SERP)中的蓝色可点击链接下。例如:Meta description可以是任意长度,但是搜寻引擎通常会截断超过160个字符之后的片段。最好保留Meta description有足够长度的说明,但是需要比160个字符的限制短。Meta des...
7 锚点文字 - Anchor Text-新视野网页设计锚点文字是超连结中可见的可点击文本。在现代浏览器中,它通常是蓝色和下底线方式呈现,例如这个连结到新视野网页设计公司首页。程式範例a href= http://www.example.com Example Anchor Text /a 搜寻引擎优化友善的锚点文字是简洁的、与目标网页相关的(从这个网页连结过去的网页)。什幺是锚点文字?锚点文字是连结到网站上其它文件档或显示位置时的超连结,显示方式为可...
8 Google Medic Update做了那些改变? YMYL是什幺?-新视野网页设计他所代表的意思很简单,就是“Your Money or Your Life.”,中文来就就是,生活与财产相关的网页,将来GOOGLE对于YMYL相关的内容将更为重视。哪些是YMYL的网页呢?虽然GOOGLE有提到Money字眼,但是他说的内容涵盖并不单单只是金钱,据GOOGLE所描述的,任何可以影响人们健康、快乐、安全或是财务的网站页面都是属于YMYL範围内。1.如果你的网站或是在网页中有提到股票...
9 网址连结 - URLs -新视野网页设计URL(全球资源定址器)(更一般地称为“网址”)指定网际网路上资源(例如网页)的位置。 该URL还指定如何检索该资源(也称为“协议”,如HTTP,HTTPS,FTP等)。Code Samplehttp://www.exampledomain.com强制限制字数要在所有浏览器中正确呈现,URL必须少于2,083个字符。http://www.example.com/category-keyword/s...
10 网址、网域、网名 - Domains -新视野网页设计什幺是网址(Domains)?网址是网站唯一的、人类可读的网际网路地址,它们由三部分组成:顶级网址(有时称为扩展网址或网址后缀)、一个网址(或IP地址)和一个可选的子网址。只有网址和顶级网址的组合被称为“根网址”,http://”是页面URL的一部分,但不是网址,被称为“协议”。让我们更仔细地看看这些元素:顶级网址(TLD)是出现在网址末尾的后缀的正式名称。顶级网址的一些例子包括:.com.net...
关于本站 | 联系方式 | 发展历程 | 相关帮助 | 广告联系 | 网站地图
备案号:粤ICP备18132238号-1 技术支持:杰奇SEO