Google的最新算法更新BERT可以帮助Google更好地理解自然语言,尤其是在语音搜索中上起到非常大的作用。
BERT将影响大约10%的查询。这也将影响自然排名和精选内容结果,为用户带来更好的更精准的信息。所以这是不小的改变!
但是您是否知道BERT不仅是任何算法更新,还是研究论文和机器学习自然语言处理框架?
实际上,在实施该产品的前一年,BERT引起了产品搜索活动的狂热风暴。
之前有专家解释了Google的BERT到底是什么,它如何工作,如何影响搜索以及是否可以尝试为其优化内容。
搜索中的BERT是什么?
BERT代表变压器的双向编码器表示,实际上有很多东西。
它被广泛称为Google搜索算法成分/ tool / framework(称为Google BERT),旨在帮助Search更好地理解Search中单词的细微差别和上下文,并使这些查询与有用的结果更好地匹配。
此外,BERT是Google生成的自然语言处理NLP框架,然后将其开源,因此整个自然语言处理研究领域实际上可以更好地从整体上理解自然语言。
您可能会发现,在线上大多数BERT提及都与Google BERT更新无关。
其他研究人员正在发表许多有关BERT的实际论文,这些论文并未使用您认为Google BERT算法更新时会使用的东西。
BERT极大地促进了自然语言对NLU的理解,而Google转向开源BERT的举动可能永远改变了自然语言的处理方式。
机器学习的ML和NLP社区对BERT感到非常兴奋,因为它需要花费大量的精力来进行自然语言的研究。它已经对很多单词进行了预训练,整个英语维基百科中有25亿个单词。
Vanilla BERT为机器学习和自然语言多样化任务中的神经网络提供了预先训练的起点层。
虽然BERT已在Wikipedia上进行了预培训,但已对问题和答案数据集进行了微调。
可以微调的那些问答数据集之一称为MS MARCO:由Microsoft构建和开放源代码的人类生成的机读理解数据集。
研究人员还与SQuAD(斯坦福问题解答数据集)就自然语言理解展开竞争。BERT现在甚至超过了SQuAD上的人类推理基准。
许多主要的AI公司也在构建BERT版本:
(1)Microsoft通过MT-DNN(多任务深度神经网络)扩展了BERT 。
(2)来自Facebook的RoBERTa。
(3)之所以创建SuperGLUE Benchmark是因为原始的GLUE Benchmark变得太容易了。
BERT可以解决哪些问题?
我们人类很容易理解某些事情,包括搜索引擎在内,机器根本无法真正理解。
(1)言语问题
单词的问题在于它们无处不在。越来越多的内容在那里
单词是有问题的,因为很多单词是模棱两可的,多义的和同义的。
Bert旨在帮助解决含糊不清的句子和短语,这些句子和短语由许多具有多种含义的单词组成。
(2)歧义和一词多义
英语中几乎所有其他单词都有多种含义。用口语来说,由于同音词和韵律,情况更糟。
例如,对于带有英语口音的人,“四支蜡烛”和“叉子手柄”。另一个例子:喜剧演员的笑话主要是基于单词的玩法,因为单词很容易被误解。
对于我们人类来说,这不是一个很大的挑战,因为我们具有常识和上下文,因此我们可以理解围绕情境或对话上下文的所有其他单词,但搜索引擎和机器则没有。
对于未来的对话式搜索而言,这并不是一个好兆头。
上一篇:你需要使用视频营销的8个强大理由
下一篇:网站11个基本SEO推广阶段