“拒绝谈判?”
太平洋彼岸,阿美瑞卡某处会客室,一名男子充满着完全不可置信的眼神。
“我就说,他们绝不会答应进口核辐射地区的粮食的,他们跟我们不一样,他们是有底线的。”
“鲍姆,不对。我们现在还没有开始谈条件呢,这些东西,我们要谈什么,他们现在不可能知道的。”
“Jacks,那他们为什么拒绝的如此干脆?连谈都不愿意谈?究竟哪里出了问题?
“难道是工业人工智能模型的未来不够诱人?还是他们已经发现了什么?”
“不不不,”杰克斯摇头:“我们的专家评估了那么长时间才得出的确切结论,他们那落后那么多的水平,专家们即便是猜到了,也绝对不敢打包票作保证。”
现在的人工智能训练,包括最强大的GPT4.0,都是一样的原理,就是海量语料和海量算力的堆积。
语言模型,像ChatGPT,海量的语料获取非常容易,网络上爬取就是了,无非就是需要进行一番清洗,只要不在乎成本,可以无限堆积。
哪怕是OpenAi和GitHub合作共同训练的代码机器人模型,那也有GitHub代码仓库里不计其数的代码做训练支撑。
但工业模型训练呢?工业生产数据可不像语言和代码那样,全网都是,爬取就完了。
哪儿来的那么多的工业数据来做训练支撑呢?
且不说各家的工业数据都是核心隐私,根本不可能共享。就算能也没用。
智库评估,哪怕把全美甚至全世界的工业生产数据全部撸来,也不够工业模型训练之万一的。
换言之,就是这玩意不可能存在。
……
“是的,不可能存在。”文国昌开完会,立刻就赶往了华州,他要见一见程旭,程旭也是直接了当:
“文老,以现有的人工智能模型训练方式,至少十几二十年内,成熟的大型工业人工智能模型没有任何出现的可能。”
“你说的这些,包括,现有工业生产数据根本不可能支撑大型工业模型的训练这种观点,很多专家也都说了。”
文国昌问道:“但是,他们都不敢这么保证。你为什么就敢说十几二十年不可能?”
“他们是你的智囊团,要对你的决策负责。”程旭笑道:“而我嘛,只是跟一个老朋友聊聊天,我有什么不好说的?”
“小鬼头。”文国昌笑了笑,没有再纠结这个问题,这其中的道道,他比程旭明白。
“你说十几二十年不会出现大型工业人工智能模型,我选择信你。”
文国昌起身,郑重的说道:“这个决策,是我个人做出的,有我来负责。”
“文老,您等会儿,”程旭立刻制止:“我什么时候说过了。”
“你刚才不是说……”文国昌心中突然一惊,满脸疑惑的看着程旭。
“文老,我说的可是,以现有的人工智能模型训练方式,是有这个前提条件的。”
程旭笑道:“换言之,阿美瑞卡不会有,但我可没说我们不会有。”
“价值判定方法?”文老询问道。
“文老也知道价值判定?”
程旭一惊,不过随后也就明白了,就现在的世界形势,这么重要的东西不关注反倒不正常了。
文国昌点了点头,也没有瞒着:“我不想知道也得知道,从昨天到今天,价值判定这四个字儿都快把我的耳朵磨出茧子来了。各路专家分析来分析去,没有形成统一认知。
“认为它好的,那叫一个夸,夸得天上有地下无的,开创人工智能训练新的时代,这评价,高的没边儿了。
“也有人认为,它是有点儿突破,但也就那么回事儿,再怎么强也强不过阿美瑞卡。毕竟人家起步早,没有个三五十年怎么赶得上呢?还是建议得妥协。
“现在,我想听听,你这个创造者对价值判定是怎么样的一个看法。”
“文老,价值判定是什么我就不跟您讲了,相信专家们肯定分析过了,讲的肯定比我好。”
程旭笑道:“我就给您说说,基于价值判定核心,出现的一种新的训练模型:我管它叫【条概模型】。”
“现在的人工智能训练模型,不管哪一种,都是概率统计模型。”
程旭说着,看文老有些懵,瞬间改了一种说法:“这就像什么呢,我们把人工智能当成一个牙牙学语小孩儿,我们教一个孩子学习语言。
“现在的模型是怎么教的呢?给它一大堆的文章,成G成T的给它,它就会自己去拆解这些文章,统计字与字、词与词之间的组合和出现的概率。
“计算是计算机擅长的啊,尤其是GPU,专有运算能力非常强大,海量的数据和算力堆积就形成了现在看似是思考和逻辑的语言能力,其本质还是统计概率。
“而我的条件概率模型呢,开始的时候是不会给它海量文章的,它像孩子一样,先学识字、再学组词造句、再学词性分解。
“训练了完了这些,再给它灌输中量的文章语料,去统计这些字这些词出现的境况概率和词性分解情况,慢慢的形成看起来具有一定思考和逻辑的语言能力。”
“看起来本质还是概率统计啊!”文国昌笑道。
“对,本质还是概率统计,”程旭也笑了:“它形成的东西,也只是看起来具有思考性和逻辑,它自己本身是没有这个概念的。
“不过话说回来,如果它真的像孩子一样,慢慢的形成思维,那就不是强大,而是可怕了吧?”
文国昌点了点头,他听懂了。
虽然本质还是概率统计,但是条件概率,提前通过某种手段剔除掉了绝大部分不可能的情况,那剔除的这部分,训练量就完全省下来了。
从程旭的话里边也非常明显的听出来,现有模型训练是海量数据堆积、海量算力支撑,而条概模型,是先行基础逻辑,然后中量数据投喂,进行统计分析。
海量,那是没量,愈多愈善。但,中量——可能也不少,但至少有数了。
这一比较——
突然想起刚刚说起的工业人工智能训练模型,按现有的训练方式,全世界的工业数据都不足以支撑。
那条概模型呢?
“条概模型能省多大水平的数据?”文国昌也是殷切的问道。
程旭一眼就看出了文老的心思,因为他压根没有加以掩饰:
“利用条概模型,我说的是未来的成熟条概模型哈,而不是千寻临时用的那个还不完善的模型雏形。
“利用条概模型,以我国的工业体系数据,绝对足以支撑一个大型工业人工智能模型的训练。”
“哈哈哈哈哈哈……”
文国昌仰面大笑,内心十分舒爽:
阿美瑞卡是在吹牛、在忽悠,他们一定想不到,我们未来竟然有可能真的实现吧?