谷歌的搜索引擎到底是如何工作的

谷歌

谷歌的搜索引擎在技术上很复杂。

有数百(有些人说是数千)不同的因素被考虑在内,以便搜索引擎可以计算出不同的因素是什么  应该去哪里

它就像一个神秘的黑盒子,很少有人知道里面究竟是什么。

然而,好消息是搜索引擎实际上很容易理解。

我们可能不知道每一个因素(一百或一千),但我们也不需要。

我将通过一种简单的方法将其归结为基础,以取悦Google,排名更高,并  带来更多的网站流量

我还将向您介绍一些最新的发展,例如RankBrain,它可以帮助Google  猜测  您实际需要的内容(即使您没有输入)。

但首先,我将向您详细介绍Google的搜索引擎是如何运作的,以便您可以看到它并不像您想象的那么难以理解。

搜索引擎如何抓取网络?

谷歌的第一份工作是用“蜘蛛”“抓取”网络。

这些是很少自动化的程序或机器人,他们在网络上搜索任何和所有的新信息。

蜘蛛  会在您的网站上记笔记,从您使用的标题到每页的文字,以了解更多关于您是谁,您做什么以及谁可能有兴趣找到您。

搜索引擎如何工作坚果壳版本51031c668bfe0 1

从表面上看,这可能听起来很简单。

但考虑到 每天每分钟创建300-500个新网页,这不是一件小事。

因此,第一个巨大的挑战是找到  新数据,记录它的内容,然后将这些信息(具有一定的准确性)存储在数据库中。

Google的下一个任务是找出当有人在搜索查询中输入时如何最佳匹配并在其数据库中显示信息。但是,缩放再次成为一个问题。

谷歌现在一年内处理超过2万亿次搜索。这比1999年的每年仅十亿还要多。

在过去的17年里,这个数字大约增加199,900%

因此,数据库中的信息需要在有人预期之后在不到一秒的时间内正确分类,重新排列和显示。

时间是至关重要的。根据玛丽莎梅尔十年前为谷歌工作的回顾,速度获胜。

她报告称  ,当他们能够加快谷歌地图主页加载的时间(通过减小其大小),流量在七天内跃升10%,几周后流量跃升25%。

谷歌赢得了搜索引擎竞赛,因为它能够:

  1. 查找并记录更多信息
  2. 提供更准确的结果
  3. 并且比其他任何引擎都更快地完成这两项任务

它得到跨在其“穿梭信息传回的往复令人难以置信的好管道 ”该用户连接到它的信息数据库。

pipiline 1

谷歌在所有这些方面的早期开端跃升的原因之一归结为其结果的准确性。

它显示的信息要好得多。

这样想吧。

当你输入一些东西到谷歌,你在期待  什么。这可能是一个简单的答案,比如您所在城市的天气,或者可能有点复杂,例如“Google的搜索引擎如何真正起作用?”

与当时的其他替代方案相比,谷歌的搜索结果更好地回答了这些问题。这些信息是最好的。

而这一突破来自谷歌的联合创始人在大学实际工作的初步理论。

 

为什么链接很重要?

谷歌的联合创始人于1998年回到斯坦福,当时他们发表了一篇题为“PageRank引用排名:为网络带来秩序”的论文。

看看吧 – 你甚至可以在这里阅读整篇文章

图143

PageRank的突破很简单。

学术论文通常按论文收到的引用次数“排名”。他们收到的越多,他们就该主题就被考虑得越权威

谷歌联合创始人拉里·佩奇和谢尔盖·布林希望将相同的“评级”系统应用于网络信息。他们使用反向链接作为投票的代理 页面收到的链接越多,对该特定主题的感知就越具有权威性

链接是投票1

当然,他们不只是看链接的数量。他们还通过考虑谁在进行连接来考虑质量。

如果您收到两个链接,例如,来自两个不同的网站,那么对某个主题具有更多“权限”的链接将更有价值。

他们还考虑 了更好地衡量链接“质量”的相关性

例如,如果您的网站谈论“狗食”,那些谈论与“狗”或“狗食”相关的事情的其他网页或网站的链接  比谈论“卡车轮胎”更有价值

ext vs int 1

现在,在我们进一步讨论之前,请理解我们正在讨论十多年前的概念。

PageRank可能在几年前就已经很重要了,但从那时起它就发生了巨大的变化。所以今天不要担心它。

其中一个原因是因为像RankBrain这样的新算法开发。

 

什么是’RankBrain’,它是如何工作的?

几年前,谷歌工程师格雷格科拉多首次承认RankBrain

RankBrain已成为导致搜索查询结果的第三重要信号。

谷歌过去五年一直在研究这项技术, 以帮助搜索引擎处理数量的大幅增加而不会失去准确性。

RankBrain的秘诀在于它使用人工智能  来不断学习如何改进

rankbrain图1

因此,它为用户处理新信息或新搜索查询的次数越多,它在返回此信息时实际上会变得更好,更准确。

例如,谷歌的算法“ 可能有多达10000个变化或子信号 ”根据搜索引擎land的说法。好多啊!

正如您可以想象的那样,以某种方式管理所有这些动作将是非常困难的(如果不是不可能的话)。

这就是RankBrain帮助管理工作负载的地方。

一般来说,两个最重要的排名因素是:

  1. 链接(和引用)
  2. 单词(内容和查询)

RankBrain有助于分析或理解这些事物之间的联系,因此Google可以理解某人所要求的背景

rankbrain语义搜索难度1

例如,假设您输入“工程师工资”一词。

现在考虑一下。你在找什么类型的工程师工资?

它可以是“民用的”,“电气的”,“机械的”,甚至是“软件”。

这就是为什么谷歌需要使用几个不同的因素来弄清楚你要求的确切内容。

但是,让我们说过去几年发生了以下事件:

  • 你获得了计算机科学学位。
  • 您的IP地址放在斯坦福大学的校园内。
  • 你在Twitter上关注科技记者。
  • 您几乎每天都阅读TechCrunch。
  • 而你 上周正在谷歌搜索 “软件工程师工作”。

看到了吗?

谷歌能够将所有这些随机数据拼凑在一起。就像一堆拼图突然聚集在一起。

所以现在谷歌知道向你展示什么类型的“工程师工资”,即使你从未明确要求“软件工程师工资”。

这也是Google在您提出问题之前现在回答您问题的方式。

例如,立即进行通用搜索,例如“披萨”。

现在,你看到了什么?

图片144

您会在顶部看到典型的广告空间。

然而,广告下面的本地结果假设您在询问“在哪里获得披萨”。

最右边的知识图表几乎提供了关于可以想象的披萨的每一个事实和数字。

RankBrain可以处理和过滤所有这些数据,在您提问之前给出答案。

稍微改变你的搜索(像这个“披萨小屋”),搜索引擎结果页面(SERP)随新信息而变化。

图片140

现在你知道Google的搜索引擎是如何运作的。

虽然您不需要成为专家,但了解这些基础知识可以帮助您更好地了解如何为您的潜在客户提供他们想要的东西(这样您可以获得更好的排名和更多的流量)。

以下是一些值得关注的重要事项。

 

如何排名更高:解决人们的问题

人们在谷歌中输入搜索字符串,以获得他们所面临的任何问题的答案。

如果他们正在寻找答案,那就意味着他们有一个问题。

如果他们有问题,那就意味着他们有问题。

所以你的主要工作是解决某人的问题。

从理论上讲,它真的很简单。如果你比其他人更好地解决某人的问题,你将获得更好的排名和更多的流量

让我们看一些例子,这样你就可以看到它在现实生活中的确切运作方式。

工作一整天都有人回家。所有他们都期待着做的就是抓住一些快速吃东西,与家人闲逛或在Netflix上观看新节目。

但在他们能够一起吃饭之前,他们试图跑完厨房水槽,发现它已经堵塞了。

游手好闲的人。

不过已经很晚了,所以他们不想打电话给水管工。相反,他们前往谷歌并开始输入“如何疏通排水”作为他们的搜索查询

然后这是他们看到的:

粘贴图片0 631

看到了吗?!

在顶部的方式是管道工的广告(以防你想要专业人士打电话)。

接下来是一个即时应答框,其中包含Google认为已帮助其他人的分步说明。因此,您可能已经能够在不离开此页面的情况下修复您的接收器!

否则,下面是其他人通常会问的相关问题(以及他们的答案)。

所以这一切都引出了一个问题:你如何创造有助于解决用户问题的东西?

我会在一秒钟内回答这个问题,但这是你 不记录的事情

粘贴图片0 635

“关键字密度”曾经是一种老派战术,当谷歌的算法愚蠢和静态时曾经是相关的。但今天,凭借RankBrain,谷歌已成为一个边缘天才。

因此,像1999年这样的关键字填充再次只能让你长期受伤。正如你所看到的,这对某人的问题是一个可怕的“回答”或“解决方案”。

在说完之后,页面上有一些地方需要特别注意。

例如, Google使用标题标签  和元描述来提供此页面的官方答案。

当有人在查询中输入时,这两个元素也会出现在SERP上。

那么,您应该使用这些领域的主要主题,以便每个人都知道您的网页正在讨论的内容。

粘贴图片0 633

你想看看那些文字被拉出来的地方吗?

只需右键单击网站即可查看源代码。例如,我的主页看起来像这样:

图片141

您可以在代码顶部看到标题标记和元描述。

我也在使用Yoast的WordPress SEO  插件来帮助在WordPress的背面添加这些额外的字段。

这样,你所要做的就是用纯文本写出特定的标题和描述(而不是用代码弄脏你的手)。

否则,实际的页面内容应该为人类编写(而不是关键字填充到欺骗或欺骗搜索引擎)。

相反,以下是您的网页内容的外观:

粘贴图片0 630

在那个例子中,我正在写一篇深入的回复来帮助某人找出复杂问题的解决方案(关键词研究)。

但即使这是一个复杂的主题,我也试图给他们一个简单的,逐步的解决方案,以便他们尽快解决这个问题。

Google甚至会立即考虑网站使用数据,  以确定您的内容有多大帮助。

例如,假设某人点击了Google的网站,并因设计不佳或难以阅读的内容而被关闭。因此,他们会立即“反弹”给谷歌以找到不同的结果。

那是个坏兆头!谷歌现在能够接受并确定你不是一个快乐的搜索者。因此,也许谷歌会尝试找到一些其他结果来换掉那个,希望让每个人都开心。

这就是我打破段落并包含大量图像的原因。目标是帮助人们快速找到他们正在寻找的东西。我希望他们能够更快地阅读页面并更容易地消化信息,这样他们就可以坚持更长时间而不是反弹。

这是在搜索引擎中排名很好的关键。给人们他们想要的东西,让他们留下来或回来更多,结果谷歌会更快乐。

让我们回到我们堵塞的排水示例,看看它在另一个环境中是如何工作的。

粘贴图片0 629

这些都是非常好的结果!

在每种情况下,制作每个页面的人都提供了对常见问题的详细解答。

让我们把注意力集中在第二个搜索结果上,雅虎的“7个很好的方法来疏通(图片)”,来发现他们做的有多好,以至于在一个大的流行的搜索查询中名列第二。

粘贴图片0 632

这似乎是一个很好的结果,因为它为我们提供了多种尝试方法,以及照片,因此我们可以准确地看到发生了什么。

让我们点击它看看它们提供了什么。

粘贴图像0 634

整体还不错!

它为用户提供了优质,高质量的内容,以帮助解决问题。您的内容越好,当其他人发现它有用时,它将获得的链接或“赞成”越多。

链接和其他引文或社交信号有助于提醒Google。他们告诉搜索引擎您的网页正在兴起并开始关注您的网站以获取这些主题。

您的页面将获得更好的待遇,提升排名,接触更多人,获得更多链接或投票,并继续上升趋势。

这就是Google过程的精髓所在。

通过为他们提供他们正在寻找的东西,让人们感到高兴。当你做得对,它会给你综合的好处,突然间你的网站流量就会增加。

 

结论

谷歌的搜索引擎是世界上最复杂的技术之一。

它以闪电般的速度处理令人费解的大量数据,以便为人们提供他们正在寻找的内容和他们何时需要的内容。

Google的广告业务占据了所有搜索广告收入的78%,这是一个很好的理由。

但是当你把所有东西都归结为基础时,搜索引擎实际上很容易理解。

他们只是想帮助人们找到他们想要的东西。

人们使用谷歌来寻找答案和解决方案。他们有自己的想法,他们希望找到一个答案,帮助他们清除问题,继续他们的一天。

谷歌通过从各种地方提取数据来确定你特别想要的东西,即使你没有以这种方式输入,谷歌也比其他任何人都做得更好!

您如何看待Google提取数据以更好地回答您的问题:令人毛骨悚然或有帮助?

Leave a Reply

Your email address will not be published. Required fields are marked *