西红柿小说网 > 都市小说 > 穿越:2014 > 第315章 知识“贴标”全文阅读

古语云,书中自有黄金屋。

真实意义上的黄金屋虽然不尽然。

但知识能用来换钱,这个众所周知。

既然知识能够用来换钱。

那么知识来源的手段自然也能用来换钱。

而且知识来源手段用来搞钱的话很可能比知识本身来钱更快。

作为自然语言处理的知识来源的算法和数据能换钱。

同样作为自然语言处理知识来源的狭义知识自然一样是能够换钱的。

对于算法能换钱的基本上为世人所周知。

即便是此前不知道这个能换钱的如果长时间关注林灰前段时间的所忙碌的重点也能清楚。

此前牵扯林灰多数时间的基本都是生成式摘要算法这件事。

无利不起早,没有足够的利益驱动林灰自然不会为这件事鞍前马后。

算法能换钱这件事基本不难懂。

算法往往直接影响一些算法驱动型产品的效率。

而效率就是真金白银。

能够直接影响效率的算法自然是能够很容易换取丰厚报酬的。

理解了算法能换钱。

其实也就不难理解数据为什么能换钱。

毕竟数据是很多机器学习算法构建的基石。

机器学习算法的出现往往要依赖于有标注的数据。

而且在相当长的一段时期内机器学习算法不仅是依赖于有标注的数据。

而且是依赖于大量有标注的数据。

标注数据量较小的情况下,很多时候是不足以训练一个性能优异的机器学习算法的。

从这个角度出发,就不难理解数据为什么可以换钱。

很多时候甚至可以完全可以把数据理解为是一种隐性的知识。

而数据标注的过程实际上就是将散漫自有的离散数据结构化、标签化的过程。

在算法和数据之外,所谓的狭义知识是什么呢?

狭义知识一般指通过规则或词典等形式由人工定义的显性知识。

狭义知识主要包括三种:

——即语言知识、常识知识和世界知识。

其中,语言知识是指对语言的词法、句法或语义进行的定义或描述。

其主要特色是定义了同义词集合。每个同义词集合由具有相同意义的词组成。

常识知识是指人们基于共同经验而获得的基本知识。

世界知识包括实体、实体属性、实体之间的关系等。

或许有人不理解?

为什么这类知识能换钱呢?

这些东西不都是显而易见吗?

这些知识虽然本质上依旧是人们所能理解的显性知识。

但对人们来说显而易见的显性知识。

不等于对机器同样是显而易见的。

对于这类知识往往要通过规则化或者是词典化的处理以便于这些知识能够通过简单的处理成让机器理解。

这些很容易被机器所理解的知识叫狭义知识,也被称为专家知识。

尽管现在主要训练模型已经是谋求算法甚至是数据本身了。

但狭义知识是相当有市场的。

反正从此前和尹芙·卡莉的交流来看。

都2014了,硅谷现在开发点什么机器学习仍旧是要动不动跟哈佛、牛津之类高校合作。

这些人之所以仰仗哈佛、牛津除了是指望这些高校进行下数据标注之外。

主要应该就是指望着这些高校在狭义知识方面的加持了。

这些人这么做也容易理解。

毕竟最早涉及到自然语言处理方面的模型数据的时候人们是用狭义知识进行训练的,而不是依靠数据和算法。

甚至林灰印象中,即便是前世,在互联网迅速崛起之前,人们唯一训练自然语言处理方面模型只能是用狭义知识。

而林灰手中就拥有相当多的狭义知识,且水平什么的应该比现在西方世界所用的不知道高多少。

从硅谷为了获取狭义知识每年砸几千万美元的架势来看。

林灰手中的一些狭义知识如果能够拿来变现的话要比利用标注数据变现还方便。

但这仅仅是理论上容易变现。

林灰没有绝对的话语权以及随之而来的权威性。

林灰怎么去向潜在的受众去说其所拥有的狭义知识资料要比现在硅谷所用的普遍材料更高明呢?

其实潜在的买家林灰倒是清楚的很。

要知道就算是在往后几年对大量的狭义知识感兴趣并且又不差钱的买家其实也不是特别多。

林灰估计这个时空下可能对大规模狭义知识库感兴趣的买家无外乎是Microsoft、Google之类的超级巨头。

不过纵然是知道这些潜在买家,林灰也不可能去主动找对方啊。

那样的话岂不是成为了兜售么?

而兜售等于直接丧失了主动性。

毕竟按照买家的思维逻辑是:

兜售等同于卖家对产品不自信。

亦即商品缺乏权威。

对于有的商品缺乏权威等同于直接给判了死刑。

买家凭什么要为缺乏权威性的内容买单呢?

或许这只是林灰的臆测,但林灰觉得这种事情是大概率事件。

没权威性,纵然是更高水平的东西。

想拿来换钱也是很蓝的啦。

而拥有了绝对的权威性,事情则不一样了。

很多时候就成了卖家市场。

买家上门求着那种。

就像尹芙·卡莉描述下的自然语言处理方面的算法团队兴衰轮转不断。

但哈佛、牛津之类的高校却始终不用担心没有算法团队去同他们进行合作。

毕竟某种程度上这些顶级高校在狭义知识尤其是在部分NLP开发离不开的语言知识上几乎就等同于权威。

这种情况下别说这些高校不用担心吃饭的问题。

甚至是很多算法团队也得看人家脸色。

拥有权威性。

水平没那么高也很容易吸金。

甚至是不需要这些高校亲自去产出知识。

某些时候甚至可以直接对“通行知识”进行“贴标”。

对,没错,知识贴标。

这才是真正意义上的躺着赚钱。

而且是躺在大气层那种。

很美好,不过很遥远。

不过林灰也不必要太灰心。

因为涉及到话语权的追求,林灰并不孤单。

和林灰同行并不是某人。

而是一个五千年悠久历史的东方古国。

林灰相信通过不断的求索会一天实现涉及到话语权的终极追求。