十八世纪末期,在美国的西进运动中,人们在萨克拉门托河里发现了金砂。
在勇气、贪婪的作用下,工人、农民、海员和传教士,前仆后继,前来淘金。
这就是赫赫有名的“淘金热”。
不过在这场轰轰烈烈的西进运动中真正依靠淘金赚到大钱的人却不见得有多少。
反倒是在淘金热这一过程中另辟蹊径的卖水人赚得盆满钵满。
“数据标注”这个领域某种程度上就是前世人工智能迅速崛起时的“卖水人”。
在前世人工智能迅速崛起的时候。
海外大多数科技公司几乎都不约而同将目光都聚焦于追求更先进的算法、平台框架建设、商业化。
“数据标注”作为一条既不瑰丽也不独特的领域。
纵然数据标注在机器学习尤其是监督学习中扮演着相当重要的工作。
但数据标注这个领域依然让很多海外科技公司不屑一顾。
甚至是很多海外巨头以及前世一些专门搞人工智能的海外公司对数据标注也是不屑一顾。
或者也不是不屑于顾,只是选择性无视罢了。
毕竟在很多海外科技公司眼中看来数据标注是一项吃力不讨好的体力活。
而投资者因为对数据标注不甚了解。
也往往对数据标注这一领域不甚关注。
反而是那些以技术为核心或者说PPT上以技术为核心的科技公司反倒是更容易脱颖而出并受到投资者青睐。
然而在前世当人工智能喧嚣的风头不再。
褪去华丽的外衣之后再看一众人工智能行业各从业公司时。
会发现曾经那些大张旗鼓追求先进算法、商业化以及平台框架建设的海外公司不见得有多少赚钱的。
(打脸地说,多数都在赔钱,而且是烧钱那种赔
就比如说前世人工智能方面的一面旗帜deepmind这家公司被谷歌收购后基本上一直在烧钱)
反倒是从事于数据标注这方面的一些当初不怎么上台面的海外小公司赚得盆满钵满。
甚至于还出现了一些估值能够达到七十亿美元左右的独角兽公司。
虽然估值这种东西一般有不少的水分。
但作为一个人工智能有关的公司估值七十亿美元也差不多了。
毕竟前世一贯被称为人工智能风向标的deepmind当初被谷歌收购的时候也不过才被估了不到十亿美元。
对了,为什么上面所有提及的公司都指的是海外的公司呢甚至是连所谓的“不怎么上台面的小公司”也是特指海外的一些公司呢?
无怪乎林灰会单独将国内互联网公司区分出来。
因为一些众嗦粥汁的原因,国内的互联网企业基本都是温室里的花朵。
而是国内的互联网除了个别比较能打的之外多数都着实不怎么争气。
很多时候以国际的眼光来看问题的时候,会发现国内的一些互联网公司奇奇怪怪。
甚至总给人一种莫名其妙的感觉。
或者高情商地说,国内互联网公司普遍是领先地球online好几个版本的理解。
很多时候国内互联网会根据不同的时期呈现出不同的形态。
有的时候国内的互联网公司会表现的像房地产公司,有的时候会表现的像传媒公司,有的时候表现的像车企,有的时候像搞cx的。
唯独没啥科技公司的样子。
对于国内互联网公司这一众魑魅魍魉,很多时候林灰是干脆无视的。
真要创业就去跟国际上诸如IBM、Microsoft之类的巨头去角逐。
在国内互联网的小鱼塘去逐鹿着实没啥挑战性。
具体到数据标注。
前世国内在数据标注似乎是从来都是一片混乱。
因为数据标注没啥门槛,至少看起来是没什么门槛。
一个大学生不到一天培训基本就可以做普通的数据标注。
这样的行业自然是卷的厉害。
有多卷呢?
林灰记得前世他最开始接触数据标注的时候还是在读书期间。
那个时候即便是众包任务。
差不多也能一小时标注就轻轻松松赚50~70。
工资日/结,很不错的兼职工作。
林灰记得大学期间有一段时间缺钱又没好意思问家里要。
搞了半个月的数据标注,结果意外还攒了点钱。
而当林灰穿越前夕同样强度的数据标注基本就只能是一个小时十块左右。
工资能月结就不错了(有的甚至三月结),而且还要扣税。
雷布斯说得确实没错,站在风口上,猪都会飞。
很多时候,就算飞不起来,能赶上红利期,多少也能蹭点荤腥。
而当红利期过了,就直接一地鸡毛。
事实是只要跟互联网沾边的。
别管啥层次,总之就卷的不行。
但涉及到数据标注这着实是卷的太厉害了。
在互联网各行各业涨工资的情况下数据标注这一行业的从业人员工资直接缩水了五分之一。
简直可以说是惨不忍睹了。
在前世涉及到数据标注这一领域这种疯狂卷的情况下。
很多时候甚至是劣币驱逐良币。
等到拥有核心数据的大厂意识到数据标注的重要性之后准备下场了。
却发现甚至没立锥之地。
纵然是拥有核心数据。
对于数据标注,很多时候也只能将寻求外包。
诸如摆渡众测、狗洞微工、阿狸众包、鹅厂搜活等众多数据标注平台基本就是这类产物。
简直就超级离谱。
不过这件事也侧面提醒林灰。
如果林灰真的能数据标注上鼓捣出名堂的话。
没道理在涉及到解读数据、数据可视化等领域没实力。
那样林灰的触角可以轻而易举地触及到别的地方。
这些暂且不说,仅仅是形成数据标注方面的掌控的话。
也很牛比的了。
这几乎意味着将来林灰是有可能在数据层面上彻底卡死不少企业进军人工智能的可能性的。
最起码也有不少企业想在人工智能领域分一杯羹的话也要看林灰的脸色。
呃,怎么听起来越来越像反派了?
不过也无所谓,多数时候林灰是愿意与人为善的。
毕竟与人为善是美德,但在波谲云诡的互联网环境中一味的傻白甜是要付出代价的。
可以不掀桌子,但必须要有掀桌子的实力。
不过这些都是以后的事情了。
尽管突然意识到了前世信息中所包含的超大规模文本数据标注的经济价值以及标注数据在人工智能时代所具有的独特地位。
林灰神色上也没流露出太多异常。
毕竟脑海中无论想到的东西如何波澜壮阔。
实际执行的时候也只能一步一步地来。
是很难一步到位的。
就比如林灰此前所想的将一些文本数据标注拿去换钱。
类似于出售真要想利用数据标注进行大规模的变现依然是有难度的。
该去哪找能够一次性吃下几十万条几百万条甚至是更大规模标注文本的买家呢?
其实林灰是知道超大规模标注文本的潜在买家。
但跟狭义知识差不多,纵然知道潜在买家,林灰也不可能去兜售。
过于主动反而容易被动。
似乎最好的做法就是借助于掮客,即一个中间人。
含蓄地将林灰手中有大量数据标注信息且有意进行变现的消息透露给可行的买家,然后从中牵线。
不过去哪找这样的中间人呢?
对于这个问题林灰没太理想的答桉。
莫非是要靠尹芙·卡莉么?
看着眼前刚刚提出问题一脸求知欲的尹芙·卡莉。
林灰觉得像尹芙·卡莉这种很纯粹的人估计是很难胜任这种工作的。
林灰甚至为自己生出这样的想法而愧疚。
林灰确实也应该有点愧疚。
因为他刚才的思考似乎冷落尹芙·卡莉有一会了。
不过林灰不会让尹芙·卡莉白等的。
林灰相信接下来他所向尹芙·卡莉的谈话会让尹芙·卡莉收获满满的。
事实也正如林灰所预计的那样。
这确实是一次收获满满的谈话。
dd