游戏公司?这分明是科技巨头

第499章 AI进度

不过模型的学习能力强是一回事,数据又是一回事。

如果将模型比作一个人,优秀的模型就是天赋很高的天才。

可就算是顶级的天才,没有高质量的学习资料,能学到的东西也有限。

现在腾达的这个dh模型,缺乏的就是学习资料。

“我们现在的数据源有哪些?”

“就是各大平台上网友们交流的一些数据,比如短视频平台的评论区,直播平台的弹幕。不过这些数据的质量,实在是太低了。”

陈腾微微点头。

魏龙说的很有道理。

短视频平台的评论区,有相当多的一部分评论都是没什么意义的回复。

这个没意义,指的是对ai训练没意义。

比如颜值博主的评论区什么“好美”“好漂亮”的夸赞。

对于ai训练来说,意义不大。

经过筛选处理过后,能用的数据少得可怜。

陈腾又想到了gpt。

实际上第一代的gpt是在2018年推出的。

但是第一代的gpt在市场上,并没有搅动什么风云。

因为智能水平太低了,根本没有人乐意与这样的ai对话。

直到四年之后,足足喂了四年的数据,这才有了许多人愿意对话聊天的gpt。

可见ai的学习与发展,是一条十分漫长的路。

“如果按照现在的学习速度,你觉得我们的ai需要多长的时间,才能通过图灵测试?”

所谓图灵测试,就是让一个人去问ai问题。

看看这个人,能否发现正在与自己聊天对话的是ai。

能发现是ai,则未通过图灵测试。

未能发现是ai,则通过图灵测试。

这个测试方法在学术界具备一定的争议。

有人觉得这是一个很好的测试手段,有人则觉得这种测试手段没什么必要。

但是不管怎么说,图灵测试都可以作为一个ai智能程度的一个指标。

能通过图灵测试的人工智能不一定特别有用,但至少具备一定的智能程度。

“如果按照现在的学习速度,通过图灵测试的话大概需要两年吧。如果数据的量充足且优质,也许两三个月甚至更短的时间就能通过图灵测试了。”

魏龙有些无奈地说道。

优化模型、输入数据。

他们搞人工智能的,无非就是在做这两件事情。

“我倒是有一个想法,可以试一试,我们可以在互联网上,将dh0.1伪装成普通的用户,让真人用户和dh0.1对话试试。”

“可是dh0.1现在的水准,恐怕和正常人聊上几句,就会让人觉得聊天内容牛头不对马嘴了。”

“那有什么关系?”陈腾反问,“你现在上网去和人讨论问题,牛头不对马嘴的情况难道遇到的少吗?”

魏龙:“……”

还真别说,他确实在互联网上见证过生物多样性。

“那我们就伪装成真人,去和用户聊天?”

“嗯,你去找蒋华,让他配合你们弄些人机账号出来吧。”

“好的。”

“什么时候你们觉得这个对话模型有资格被称之为dh1.0了,我们就向用户正式开放我们这个对话模型。”

“如果能和大量真人进行对话,我觉得一年以内,甚至半年的时间我们就能达到1.0版本。智力水平,应该有七八岁小孩子这么高。”

“那还不错。”

陈腾对七八岁小孩子的智力水平还是认可的。

至少能对话了。

如果在这个基础上再进步,那就真的可以商业化了。

人气小说推荐More+

四合院之学会当老六
四合院之学会当老六
一朝穿越,满院禽兽,手持止血钳,做个老六,新手写作,若有不妥之处,请多指正,本书不修仙,单女主,争取为大家带来一本好书。本书纯属娱乐,请诸位看官不要过多强调是否遵循原剧,是否严谨,我只是想把我心中的四合院里的那些人那些事表达出来罢了。敬请谅解,谢谢大家。
许愿塔的哈哈
人在黄埔毕业,从团长开始崛起
人在黄埔毕业,从团长开始崛起
++(麾下已经两个军,放心入)穿越抗战时期,秦风成为一名晋绥军团长。同时激活签到词条系统。只要每日签到,就能获得词条奖励,词条可以赋予麾下将领和士兵。...当看到这些词条后,秦风懵了,怎么我的这些词条都好像带点副作用?无奈的他只好想办法筛选目标,尽可能让副作用降至最低。...不知不觉中,秦风麾下已经猛将如云!万架战机鹰击长空!大洋舰队纵横四海!重装机械部队啸聚天地!最后,秦风将目光看向了墙上大地
落笔成张
四合院之大城小爱
四合院之大城小爱
++++讲述贺来在四合院的一生,与女主雨水共渡余生,和众大爷斗智斗勇,改写他们价值观念,走上真正的情满四合院
阿萨蒂格岛的道林辰
四合院:情满
四合院:情满
现代人张大壮穿越到上世纪60年代,竟然是众禽的四合院中!还是个路人甲?嘿!算了,没有那个主角命,就别耍那个主角病,来了就安心混日子吧。不过,能改不?应该。。能吧?
真金火不炼
次元入侵现实
次元入侵现实
地球平行位面,灵气复苏,火影、海贼王、死神正在融入地球,翻开网络,刘浩发现只有自己一人熟知剧情,你说,我要不要告诉他们?西游、洪荒剧情正在开启
吴子雄