rp_Google结构化数据.jpg

Posted by & filed under 个人杂记, 互联网, 外贸, 站长心得, 读书笔记.

Google结构化数据

结构化,无论是结构化SEO还是结构化营销都在在2014年异军突起,成为网络营销中一个十分明显的趋势。在Google上,不仅仅通用搜素推出了富文本以及知识图谱等等结构化产品,同时Google赋予了结构化更大更重的使命,即通过结构化这一途径进一步实现整合营销。可以说结构化在很大程度上代表了未来搜索引擎以及整合营销的发展趋势。作为为中小外贸企业实战指南系列的最后一篇,如果要我在移动化,结构化,社会化和本地化四大新的营销趋势中选出影响最为深远的一个趋势的话,我想我会毫不犹豫的选择结构化,因为他背后的改变真正意味着下一代搜索引擎的出现,同时它也以为着数字营销新的变革已经来临。但是在国内目前很多人还没有意识到这一趋势的意义。所以,在深入某个具体营销领域之前,吴嘉阳认为有必要深入理解一下结构化的含义。

什么是结构化

我们从网站与搜索引擎互动的视角,大概分三个部门来了解下结构化的意义:

  • 数据输入端—网站标注出的数据
  • 数据处理端—搜索引擎的数据处理机制
  • 数据展现端—搜索引擎上展现的结构化数据展示

结构化从本质上来说,是网站的数据按照一定的格式给到搜索引擎,而搜索引擎则再把这些格式化数据处理后,通过一定的格式把这种数据在搜索结果中得以展示的互动过程。

  1. 数据输入端—网站标注出的数据

在数据输入端,也就是从网站本身来说,尤其是中小外贸站来说,网站上的数据是结构化这一互动过程的开始。或者说白了,最后你的网站通过什么样的方式被结构化以及被结构化的展现出来都取决于三个最为基础的前提:

1)你的网站上有丰富的,原创性的数据。当然,数据包括原创性的文字,数字,图片,视频等等多种形式

2)你网站上的丰富数据必须通过Google能很好理解和处理的数据格式标注出来。这件事情看似简单,但如果你考虑到Google每天要处理超级海量的数据,并且还要进行高效,清晰的展示的话,这项工程绝对极为复杂。为了很好的处理这项工作,Google甚至专门推出了一套用于把数据分类型结构化标注的语法:schema.org(实际上Google曾经尝试过几种结构化数据的标注语法:Microdata等等,但是目前来看,最为成功,应用最为广泛的还是schema.org)这里我们细节的来看一下电商行业最为常用的schema标注类型以及标注的方法有哪些:

富文本信息标注(1-3都是可以和”富文本”标注何在一起用和出现的,所以“富文本”只是结构化数据的一种表现形式而已)

About product offers

A product offer consists of product information (details about the product itself, such as its name, brand, and model) plus one of the following:

  • Offer (price and other offer information).
  • AggregateOffer (aggregated details about multiple Offers for the same product, including the lowest and highest available prices).

A Product can include an Offer or AggregateOffer (using “offers”); or an Offer or AggregateOffer can include one or more products (using “itemOffered”). Use the structure that works best for your content.

When you mark up your content for product information, use the following properties of the schema.org Product type:

Property Type Description
name (required) Text The name of the product.
image URL The URL of a product photo. Pictures clearly showing the product, e.g. against a white background, are preferred.
description Text Product description.
brand Text The brand of the product.
review Review A nested Review of the product.
aggregateRating AggregateRating A nested aggregateRating of the product.
offers Offer An offer to sell the product. Includes a nested Offer or AggregateOffer.
sku
gtin8
gtin13
gtin14
mpn
Text Various identification properties; these are described at schema.org/Product. Google recommends including brand and at least one identifier for each product.

When marking up offers within a product, use the following properties of the schema.org Offer type:

Property Type Description
price (required) Number The price of the product. Follow schema.org formatting guidelines.
priceCurrency(required) Text The currency used to describe the product price, in three-letter ISO 4217 format.
priceValidUntil Date The date (in ISO 8601 date format) after which the price will no longer be available. (Your product snippet may not display if the priceValidUntil property indicates a past date.)
availability ItemAvailability Value is taken from a constrained list of options, expressed in markup using URL links. Google also understands their short names (for example InStock or OutOfStock, without the full URL scope.)
url URL A URL to the product web page (that includes the Offer). (Don’t use offerURL for markup that appears on the product page itself.)
itemOffered Thing The item being sold. Typically, this includes a nested product, but it can also contain other item types or free text.

An AggregateOffer is a kind of Offer representing an aggregation of other offers. When marking up aggregate offers within a product, use the following properties of the schema.org AggregateOffer type:

Property Type Description
lowPrice (required) Number The lowest price of all offers available. Floating point number.
highPrice Number The highest price of all offers available. Floating point number.
priceCurrency (required) Text The currency used to describe the product price, in three-letter ISO 4217 format.
offerCount Number The number of offers for the product.

关于如何标注富文本信息,这里只举个例子:(之后的每个标注,都举一个例子,例子太多这文章就奔着10万字去了)具体技术标注细节可以查看:http://www.schema.org

路径标注(面包屑标注)

Properties

Breadcrumbs can contain a number of different properties which you can label using Microdata or RDFa markup. Google recognizes the following breadcrumb properties.

Property Description
title The title of a breadcrumb.
url The URL of a breadcrumb.
child The next breadcrumb in the hierarchy. The child must be another Breadcrumb item.

Examples

The following HTML code describes a breadcrumb trail for a product page on a women’s clothing site.

href="http://www.example.com/dresses"<Dresses ›href="http://www.example.com/dresses/real"<Real Dresses ›href="http://www.example.com/dresses/real/green"<Real Green Dresses

This set of breadcrumbs will appear on the page like this:

DressesReal DressesReal Green Dresses

The following sections describe how to mark up this content using microdata or RDFa.

事件标注(或者可以叫中国人喜欢叫的活动标注)

Basic markup properties

The full list of properties for an event are described on schema.org/Event. Use the most specific applicable subtype of Event, such as ComedyEvent, Festival, FoodEvent, MusicEvent, TheaterEvent, or SportsEvent. Please mark up as many properties as you can, as they will help Google algorithms correctly index your pages. The following subset of properties is required to be eligible for Event rich snippets:

Property Type Description
name (required) Text The name of the event. This is shown in the rich snippet. See specific policies about event names below.
url (required*) URL A link to the event’s details page.
* Required if the event’s details are on a different page. If the event is described on the page you are marking up, there is no need to mark up the url property.
location (required) Place or
PostalAddress
The location or venue of the event. A text string is permitted, but we recommend that you represent the location by using a nested Place or Organization to separately specify a venue name and its address.
startDate (required) Date The starting date and time of the event. See important information about the requirement for ISO 8601 date format.
offers (optional) Offer An offer to buy tickets for this event. If present, some subfields are required.
offers.price (required) Number The lowest available price, including service charges and fees, of this type of ticket.
offers.priceCurrency (required) Text The 3-letter currency code.

Example Event markup for rich snippets

The following example describes some basic information about a music concert, including the name, date and time, location, and URL for more information.

You can use the Structured Data Testing Tool to check that your markup is correct.

type="application/ld+json"<{"@context":"http://schema.org","@type":"Event","name":"Example Band goes to San Francisco","startDate":"2013-09-14T21:30","url":"http://example.com/tourdates.html","location":{"@type":"Place","sameAs":"http://www.hi-dive.com","name":"The Hi-Dive","address":"7 S. Broadway, Denver, CO 80209"}}
搜索栏标注

How do you set it up?

Sitelinks search box setup involves the following general steps:

  1. Install a working search engine on your site.Sitelinks search queries send the user to your site’s search results page, so you need a functioning search engine to power this feature.
  2. Put the schema.org markup on your homepage.Your markup should have all the elements shown in the JSON-LD example below:
    < span>script type="application/ld+json"<{"@context":"http://schema.org","@type":"WebSite","url":"https://www.example-petstore.com/","potentialAction":{"@type":"SearchAction","target":"https://query.example-petstore.com/search?q={search_term_string}","query-input":"required name=search_term_string"}}script<
    1. "url"—This property specifies the URL of your website. It must match the canonical URL of your domain’s homepage.
    2. potentialAction:target—This property specifies a search URL pattern for sending queries to your site’s search engine.
      Key points about the URL pattern:

      • It must include a string enclosed in curly braces that is a placeholder for the user’s search query (e.g., {search_term_string}). The string inside the curly braces must also appear in the name attribute of the query-input property.
      • It must point to the same domain on which the markup is found.
      • An actual query string instead of the placeholder string must produce a valid search results page on your site.
    3. query-input—the value for the name attribute of query-input must match the string enclosed inside curly braces in the target property of potentialAction.
  3. Wait for Google Search algorithms to identify your site as a candidate for the new Sitelinks search box.

See Examples below and specifications for more details.

Recommended Practices

Follow these general guidelines for using the Sitelinks search box.

  • Site-wide configurations
    • Set a preferred canonical URL for your domain’s homepage using the rel=”canonical” link element on all variants of the homepage. This helps Google Search choose the correct URL for your markup.
    • No changes to robots.txt are necessary for Sitelinks search box to work correctly. Continue to follow our Webmaster Guidelines on this topic.
    • Make sure that your server supports UTF-8 character encoding.
  • Markup guidelines
    • Put the markup on the homepage of your site. It is not necessary for the markup to be repeated on other pages of your site.
    • We recommend JSON-LD. Alternatively, you can use microdata.
    • Specify only one URL search pattern for the target. We are experimenting with multiple pattern support, so if you have feedback or use cases for multiple target support, let us know in our Webmaster Central Help Forum.

知识图谱标注(部分)

Customizing Your Knowledge Graph

The Knowledge Graph is Google’s system for organizing information about millions of well-known “entities”: people, places, and organizations in the real world. Google’s algorithms merge information about entities from many data sources. For some types of information, though, the best source of data is the entity itself.

Specifically, companies and people can now customize their own data in the Knowledge Graph by adding structured data markup to their official website. The following types of data may be customized:

注意标注完这些代码后,你一定要用结构化数据标注的监测工具监测一下你的标注是不是有错误,是否能够在页面成功显示:结构化数据监测工具地址:https://developers.google.com/webmasters/structured-data/testing-tool/

3)当你完成了上述网站上数据的结构化标注后,你需要通过网站管理员工具提交给Google,并通过Google的结构化数据测试工具进行测试,以确保标注正确。

2.数据处理端—搜索引擎的数据处理机制

搜索引擎如何处理网站标注出来的结构化数据,其实是整个结构化互动中最为核心的部分,也是技术含量最高的部分。同时,也正是搜索引擎背后这种与上一代搜索引擎相区别的互动过程,彰显了新一点搜索引擎的特点和强大威力。吴嘉阳将和大家一起梳理一下上一代搜索引擎与网站的互动模式与新一代搜索引擎与网站互动模式的差别,从而能更好的解释结构化这一新的搜索营销和数字营销的特点所在。

1)上一代搜索引擎的工作原理:自然语言分析

我们都知道搜索引擎的基本工作流程简单来说是这样的:(目前很大一部分搜索依然是这样工作的,目前占比大概75%)

(1)搜索引擎的蜘蛛排名页面数据

(2)爬行来的数据存入第一层数据库中

(3)根据自然语言分析得出一个页面所表达的主题

(4)将数据进行整理:把这个页面的主题,摘要,URL存入第二层数据库

(5)当用户查询一个关键词“A”的时候,搜索引擎会根据这个词“A”与第二层数据库中的主题进行语义匹配,如果匹配上了就展示这个结果

不知道你有没有在这个工作流程中发现一些问题:在这个工作流程中,其实只支持单点的关于关键词“A”的理解,这话什么意思呢?说白一点就是,对于关键词“A”的理解,完全依赖于语义分析分析出那个页面的内容和表达最符合“A”的语义。或者换句话说,在寻找哪个搜索结果最符合“A”的含义之前,其实搜索引擎必须要做的就是对“A”进行一个固定的定义,就是必须把“A”的含义固定死,不然你根本不可能找到符合“A”的页面结果进行展示。举个例子来说,假设一个关键词是“1”,那么在寻找那个网页的内容最能表达“1”的含义之前,我们其实必须对“1”这个概念有一个非常透彻的理解,并规定好“1”的含义,不然连概念本身都模糊不清,怎么去寻找对这个概念表述的最佳结果呢?

我知道,这段文字有点绕,但如果你多读几遍,发挥你的逻辑思维能力,应该还是能理解的。

2)下一代搜索引擎的工作原理:大数据基础上的人工智能

通过上面的文字,我们已经了解,搜索引擎对于单点的概念理解与反馈(也就是关键词的搜索与搜索结果的展示)是没有问题的了。搜索引擎看起来完美无缺了,但是真的是这样吗?

(下一代新的搜索引擎依赖于人工智能,这一大方向是可以肯定的。但是,关于下一代新的搜索引擎的工作方式则是包含了我个人的大量的信息收集,观察,分析,以及大量实践的一家之言,并不是搜索引擎官方公布的信息,望大家既不盲从,又不武断,自己判别吸收)

事实上,搜索引擎单点理解的工作逻辑无论是与用户的对事物的理解,还是与用户期望得到的搜索结果之间,有一定的差距。因为无路是在我们人的头脑中,还是在现实生活中,从来没有一个概念或者事物是一个单纯的,单一的概念。举个例子来说,比如说一个关键词“人”,它其实是一个非常复杂的综合概念,因为我们可以去从多角度解释这个概念。从生物学来说,人分男女老幼;从职业的角度来说,有画家,音乐家,工人;从地理角度来说分中国人,美国人;从精神角度来说人必须具有人类所应该有的人性才能称之为人等等等等,这个概念的含义可以无限的广阔下去。在上一代搜索引擎哪里非常好办,我们只需要实现为“人”这个关键词事先设定好一个概念然后按照这个概念去寻找对这个概念表达最佳的那个网页并予以展示就好了。但是,对于新一代搜索引擎来说,搜索引擎该如何定于“人”这个关键词呢?又该如何进行这种搜索结果的展示呢?

吴嘉阳观察,Google目前采用了一种类似于柏拉图复合概念的方法(学哲学的“职业病”又出来了)·············这写的有点太装了。说白了,对于复合概念来说,新一代搜索引擎并不对这个概念进行一个预先的含义设定,而是在大数据积累的基础上,通过不断完善和进化的人工智能去判断这个符合概念在其他分支概念中是否成立,如果都成立的话,就用取交集的方法来判断,这一符合概念的含义范围。(这里又绕了,同学们还是老方法,多读几遍吧)还用“人”这个关键词举例子,新一代搜索引擎并不对“人”这个概念预设含义边界,而是通过大数据基础上训练出来的人工智能去判断和识别人的分支概念,这个人工智能会自动识别到,从生物学来说,人分男女老幼;从职业的角度来说,有画家,音乐家,工人;从地理角度来说分中国人,美国人;从精神角度来说人必须具有人类所应该有的人性才能称之为人等等等等,当这些分支概念全部集合起来,也就是这个“人”的这个复合概念了。(当然,这个复合概念的范围实际上还是有限的,只不过这个范围会非常的广泛)

在上面这一段文字中,我们看到了新旧搜索引擎工作原理的差异。但是,需要注意的一点是,事实上,新一代搜索引擎是在原有基础上的继承和发展。一方面大数据的积累和人工智能的训练根源于大量的语义分析和搜索;同时,也正是对于“单点概念”的海量积累使得概念之间建立起联系成为了可能。

新一代搜索引擎创新性的工作原理,对我们SEO从业人员或者说数字营销从业人员有两个重大的启示:

内容:有价值的内容会更加重要!

从上面分析新一代搜索引擎的工作机制的文字中,你可以发现,Google并不是按照原来的方式单单去对应关键词和页面表达之间的相关性了,而是真正的以一种类似“人脑”的理解方式去理解内容之后,再去关联关键词与内容的相关性。这本身是对关键词概念的理解,以及对页面内容概念的理解上的质的飞越。那么既然Google能更好的理解内容和关键词了,那也就意味着传统的那些投机取巧的SEO手段(关键词堆砌,堆外链等等)更加不会有效了。反过来说,如果从现在开始重视高质量内容建设,那么你的这些内容会在今后的几年里面收到越来越多的好处。当然,这个过尝是缓慢的,可能需要三四年,但是这并不妨碍高价值内容成为新一代搜索引擎的核心。

内容:内容的关联组织

以往我们在进行内容建设的时候有两个很多人喜欢搞的通病,一:投机取巧,搞采集,伪原创,这种事坚决不能要的,不符合趋势的上面已经说过了。二:不重视内容之间的关键性。包括文章之间的内链,相互提及,内容相关等等。我们都知道知识图谱是一张关系网,因此内容上的相互关联更容易形成搜索结果展示上的“知识图谱”展示。

从最直观的角度上来看,最能体现Google新一代搜索引擎特点的产品某过于Google从去年开始大力推行的“知识图谱”了。有兴趣的同学可以好好的研究一下知识图谱,据Google内部小道消息(注意:是小道消息,不一定准确,自行判断,概不负责!)“知识图谱”类型的搜索和搜索结果展示在今年的全部搜索中所占到的比重中将占到25%,之后每年逐步扩大。所以,新的搜索引擎真的已经来了,如果你还把SEO停留在之前的理解上,等待你的就是理论上的和实践上的双重淘汰。(PS:其实吴嘉阳挺希望看到一批SEO里面的大忽悠被淘汰出这场游戏的)

3.数据展现端—搜索引擎上展现的结构化数据

来到结构化互动的最后一步,搜索引擎上的机构化数据展示。在这个互动过程地第一步,也就是“数据输入端—网站标注出的数据”中,吴嘉阳已经向大家介绍了标注各种结构化数据的方法,但是你有没有发现我在第一部分并没有展示这些结构化数据标注后的效果呢?现在,我们家来一起看看这些数据经过结构化标注后,在搜索引擎上展示出来的效果吧:

富文本信息标注

商品信息标注

路径标注(面包屑标注)

面包屑标注

事件标注(或者可以叫中国人喜欢叫的活动标注)

事件标注

搜索栏标注

sitelink及搜索栏标注

知识图谱标注(右侧部分)

Google知识图谱标注

总结一下,看到这里你应该已经理解什么是结构化的本质了,并且能够应用几种结构化标注方法去提升你的流量了。这篇文章可能是移动化,结构化,社会化和本地化这四篇文章中理论性最强,也是逻辑性最强的一篇了。但是,吴嘉阳认为这是为了讲透结构化这一最为重要的趋势和优化方法所必要的。而且,我也自信,这边文章应该是国内介绍结构化最为深度和最为实战的文章了,所以如果你真有看不懂的地方,不妨真的多读几遍,或者到我的QQ群108502553里来与我交流。话又说回来,如果你真的是为了切实提升你网站的流量,是为了提升自己的网络营销技能,希望你能多读几遍这篇文章并尽量理解这些文字,相信你会比看那些浅显的文字收获更大。如果你实在看不懂那些理论性的文字,推荐你只看第一部分,也就是关于优化的部分,至少它对于提升你网站的流量还是会非常有帮助的。

最后,还想说几句,作为《中小外贸企业SEO及营销实战指南》系列的最后一篇文章,这篇文章其实还没有完全表达我关于结构化的全部信息收集,观察和思考。这里我想在强调一次,移动化,结构化,社会化和本地化都不是孤立的,而是相互融合的,这也正是整合营销的发展方向。其实除了吴嘉阳总结的移动化,结构化,社会化和本地化之外,也还有很多比较要重的营销要点和优化方法,实在是不能在这个系列中一一写完。天下没有不散的宴席,这个系列终归是要结束的,吴嘉阳真心的希望我所写的这些文字对中国数以万计的中小外贸企业的网络营销有一点点的帮助,哪怕只是最微小的一点,我的这些努力也算是有所回报了。事实上,如果你真的好好的读了这四篇文章,如果你真的去实践了我在这四篇文章中提到的方法,丝毫不夸张的说你的流量翻一倍是十分有保障的。但是,我明白好文章也永远只是为那些有缘人有心人写就的,仔细阅读,用心实践的毕竟是极少数。好了,不再多说,《中小外贸企业SEO及营销实战指南》系列就此结束,也许,有一天会有一个机缘会让我继续扩充这个系列,各位小伙伴可以通过我的QQ群108502553关注后续更新的文章,再见!—2015年2月2日23点  于杭州

本博客所有文章均为作者原创文章,版权所有,转载请注明: 转载自吴嘉阳William Wu-网络营销研究者