民用机器人的开发进度喜人,训练数据也比战斗机器人简单很多。
现在视频平台、短视频平台数据太多了,各种各样都能找到。
而且稍微有点技术能力,就能用软件将视频下载,甚至陆凡直接在服务器上开发了几个软件看视频的接口。
新一代小八正用公司无数人的短视频账户,开始快速浏览视频信息,吸收短视频、纪录片、电视剧、电影的视频数据。
将视频里的人物动作解析、场景解析、物品名称标记等等。
将无数信息变成自己可用的数据。
在这个过程中,陆凡和公司团队也发现一些问题。
那就是小八的安全性,或者说危险性上升了!
视频内容中,也有暴力视频,这会污染小八数据库。
在最新一次会议上,有工程师就汇报道:“老板,我们检查模拟软件时,发现小八学了一些危险动作,这些危险动作如果用在人身上,甚至能造成伤亡!”
“还有老板,我们的小八机器人,网络安全问题也要重视,万一有黑客控制小八,让小八攻击人类怎么办?”
最近陆凡太忙,民用机器人这边,调试好网络学习程序后,就交给其他人盯着。
果然出现问题!
所有人都看向陆凡,彭志辉和一些高级工程师也帮不上忙,他们最近都在研究战斗机器人硬件。
刚才大家提出的问题,对战斗机器人来说就无所谓了。
战斗机器人,就是为了杀伤而存在。
并且还不是大规模使用。
只为一场演习,就算发现问题,有的是时间修改。
民用机器人不久后就要面向市场。
而目前为止夏国并没有关于机器人的法律规定,现在还没有人意识到机器人会十分危险!
只要智源机器人公司造出机器人,就可以和卖其他电器那样,进行简单的审核就上市销售。
将来肯定会因为智源机器人公司的机器人,推出相关法律法规,限制机器人上街,但目前并没有。
陆凡摸着下巴,皱眉道:“的确是个问题,大家一起想想集思广益。”
办法也是有的,机器人终究是程序,还不是拥有智慧的电子生命,不可能突然背叛人类。
“我们可以剔除数据库内,所有伤害人类的数据。”有人说道。
陆凡点头道:“这个没问题,我待会重新编个小程序,可以把暴力、打斗、针对人类伤害的所有视频检索出来,把它们删除。”
“将来程序上限制机器人对人类攻击。”
工程师们又提出别的问题。
“现在问题是有可能面临网络攻击,就拿360摄像头为例,这种摄像头的确方便很多人可以随时查看视频画面。”
“可也有不法分子利用漏洞,控制摄像头监控他人,网上一些小网站就能看到这种视频。”
“甚至有人用这个收取费用,出多少钱就能获取多少个摄像头地址,偷窥别人!”有工程师担忧地说道。
小八机器人的安全问题,其实还包括了陆凡整套AGI系统的安全。
总有一些厉害技术大牛,可能破解小八机器人的系统。
虽是民用机器人,可里面也有划时代技术。
国外特殊势力和同行竞争对手,在小八上市后,也会第一时间将小八大卸八块研究。
开了几小时会,终于拿出一套解决方案。
那就是数据上传到服务器内运算。
整个小八机器人,内部没有AGI系统,类似现在的云电脑,只要有一块屏幕,就能玩顶级网游,运算都靠云端服务器。
这需要网络比较好才行,否则小八机器人的动作会迟缓。
没有网络连动都动不了。
防御服务器不被入侵,比防御小八被拆卸研究获取控制系统简单太多。
一些本地运行的游戏,总能很轻易制作出外挂。
可类似LOL这种服务器内计算的游戏,外挂少很多,还能随时检测发现。
还有一种终极解决问题的办法。
那就是把小八缩小,弄出玩具一样,让它对人类没有任何威胁。
像是陆凡以前的那台小八,就基本没办法攻击人类,陆凡一脚就能将它踹翻。
这相当于自废武功,陆凡自然不会采纳。
最终方案敲定,就用“云运算”的方式。
公司也要招聘计算机安全专家。
陆凡在计算机安全上的造诣,比不上机器人程序,也许Lv5等级都没有。
“云运算的方式,我们处理不了太多数据,服务器不够,同时技术实力也有些欠缺,从安全角度考虑,还不能租赁其他云服务器。”彭志辉说道。
“慢慢解决问题吧,我们先兑现上市承诺,前期限量销售1000台,我们技术实力应该没问题,实在不行24小时都盯着服务器。”
“样机多久能做好?”陆凡看向硬件工程师问道。
负责硬件的工程师项目组组长说道:“已经在组装了,大概3天能调试结束,具体能不能动起来,还要看AGI系统能否流畅运行,云运算后,简单了不少,以前我们相当于在机器人身上安装高配电脑主机,现在只用一套通讯系统,和控制系统。”
“尽快调试吧,AGI系统和硬件结合时,我亲自负责调试。”陆凡最后说道。
会议结束,陆凡开始编写小程序,把小八网络收集的不良视频剔除。
陆凡设计的AGI系统,其实是人工智能Chatgpt的加强版。
那为什么不制作一个专门回答问题,对标Chatgpt的程序呢。
不是做不出来,而是需要时间训练这套系统。
陆凡目前用的是视频训练小八,主要让小八学习视频里人物的动作,识别物品等等。
这是比文本数据更丰富的数据信息。
回答问题方面,反倒是比不上Chatgpt。
OP公司用了1750000000个参数,其中包含大约1500000000个量的转换器(transformer)结构,这些转换器结构通过分析大量数据来学习语言的模式和上下文关系。
这才做到让Chatgpt回答各种各样的问题。
陆凡对小八的训练数据还比不上对方。
但不停训练下去,陆凡将迈过文本训练这一关,让小八通过调用视频里的信息回答问题。
这又要夸奖一下视频平台的创作者们了。
各大平台拥有海量高质量视频科普博主,这些人的视频中,大到对宇宙的描述,小到买菜砍价技巧,都能找到答案。
关键是语音,对应文字符号,同时画面也可能相关。
一条讲述苹果的详细科普视频,小八能理解苹果的一生,而文字却很难包含这么丰富的信息。
如果这个世界没有陆凡,那字节公司将来很可能做出厉害的人工智能。
陆凡会不停训练小八,当视频参数积累足够后,他还会让小八吸收文本信息。
相当于让一个成年人看书,能理解书里的内容。
而目前的大数据文本训练,更像是给一个天赋异禀逻辑力惊人的婴儿,塞一大堆文本数据,让它总结归纳文本数据的上下联系。
其实婴儿最终即便看起来什么问题都能回答,但这个婴儿依旧完全不理解文字信息。
只是它知道,要这么回答,而不知道为什么要这么回答。
小八不停积累下去,也许有一天,因为陆凡的一些灵感,升级相关技术,能让小八“活过来”。