公司动态
被以为国产AI之光的DeepSeek V3出糗:竟然自称是
要说这两天年夜模子圈的顶流话题,那相对长短DeepSeek V3莫属了。不外在网友们纷纭测试之际,有个bug也成了热议的核心——只是少了一个问号,DeepSeek V3居然称本人是ChatGPT。乃至让它讲个笑话,天生的成果也是跟ChatGPT一样:加之DeepSeek V3此次爆火的一个亮点,就是练习只花了557.6万美元的本钱。于是乎,有人就开端猜忌了:它不会是在ChatGPT的输出基本上练习的吧?好巧不巧,Altman也发了一个状况,仿佛在暗讽着什么……不外DeepSeek V3并非是第一个呈现“报错家门”的年夜模子。比方Gemini就曾说过本人是百度的文心一言……那么这究竟是怎样一回事?为什么DeepSeek V3报错家门?起首须要夸大的一点是,从现在网友们团体探讨的观念来看,说DeepSeek V3是在ChatGPT输出上练习的可能性不年夜。之以是这么说,正如网友Riley Goodside所总结的那样——由于ChatGPT的影子无处不在。即使DeepSeek V3成心用ChatGPT的输出做了练习,但这并不主要。全部在ChatGPT之后呈现的年夜模子,多少乎都见过它。比方ShareGPT,一个并不新颖的ChatGPT对话数据集,很多人曾经实验在它跟别的ChatGPT数据源长进行调剂。但即使如斯,也没能呈现DeepSeek V3级其余年夜模子。紧接着,Riley Goodside又拿出了DeepSeek V3讲演中的一些证据:并且如果用了ChatGPT数据的话,有些对于DeepSeek V3品质的成绩是说明欠亨的。比方Pile测试(基本模子紧缩Pile的后果),DeepSeek V3得分多少乎与Llama 3.1 405B相称,这跟它接没打仗ChatGPT数据有关。并且讲演称95%的GPU-hours用于预练习基本模子,即使是跟ChatGPT数占有关,那这局部也会在post-training阶段产生(后5%)。而比升引没用ChatGPT数据,或者咱们应该愈加存眷的是为什么年夜模子会频仍呈现“报错家门”的成绩。TechCrunch针对这个成绩给出了一句锋利的点评:由于AI公司们获取数据的处所——收集,正在充满着AI渣滓。究竟欧盟的一份讲演曾猜测,到2026年,90%的在线内容可能是AI天生的。这种“AI传染”就会让“练习数据彻底过滤AI的输出”变得艰苦。AI Now Institute的首席迷信家Heidy Khlaaf则表现:只管存在危险,开辟者仍然被从现有AI模子中“蒸馏”常识所带来的本钱节俭所吸引。不测地在ChatGPT或GPT-4输出长进行练习的模子,也纷歧定会展现出让人想起OpenAI定制新闻的输出。那么当初对网友们热议的成绩,量子位停止了一波实测,DeepSeek V3现在还不处理这个bug。仍旧是少了个问号,答复成果会纷歧样:DeepSeek V3更多弄法不外有一说一,绝年夜局部网友对DeepSeek V3的才能是赐与了年夜年夜的确定。从各路AI年夜佬们群体直呼“优雅”中就能印证这一点。而就在这两天,网友们连续晒出了更多DeepSeek V3加持的适用弄法。比方有网友拿DeepSeek V3跟Claude Sonnet 3.5一决高低,在Scroll Hub平分别用它俩创立网站。博主在测试之后,以为DeepSeek V3完整胜出!另有网友分享了用DeepSeek V3在AI视频编纂器中的休会。他表现当前不必再在FFMPEG下令上挥霍时光了,DeepSeek V3不只收费,还能转变你的任务流程。AI编程神器Cursor也能跟DeepSeek V3联合,来看一个做贪吃蛇的案例。嗯,DeepSeek V3是有点好用在身上的。One More Thing对此前颁布的53页论文,也有网友存眷到了一个非技巧性的细节——奉献列表中,不只展现了技巧职员,另有数据解释跟商务等任务职员:网友以为这种做法十分合乎DeepSeek的调性:参考链接:[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/[2]https://x.com/victormustar/status/1872647314231398524[3]https://x.com/breckyunits/status/1872422078592516295[4]https://x.com/op7418/status/1872689338242482203[5]https://x.com/goodside/status/1872911457857208596[6]https://x.com/kevinsxu/status/1873146905846530472义务编纂:上方文Q文章内容告发
]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->
上一篇:日本 6 家半导体企业就培育及取得人才睁开配合 下一篇:没有了