开云「中国」kaiyun网页版登录入口-开云体育扫数在ChatGPT之后出现的大模子-开云「中国」kaiyun网页版登录入口

开云体育扫数在ChatGPT之后出现的大模子-开云「中国」kaiyun网页版登录入口

发布日期:2025-06-27 09:12  点击次数:80

开云体育扫数在ChatGPT之后出现的大模子-开云「中国」kaiyun网页版登录入口

金磊 发自 凹非寺开云体育

量子位 | 公众号 QbitAI

要说这两天大模子圈的顶流话题,那富饶曲直DeepSeek V3莫属了。

不外在网友们纷繁测试之际,有个bug也成了热议的焦点——

仅仅少了一个问号,DeepSeek V3果然称我方是ChatGPT。

以至让它讲个见笑,生成的截止亦然跟ChatGPT雷同:

加之DeepSeek V3此次爆火的一个亮点,就是熟识只花了557.6万好意思元的老本。

于是乎,有东谈主就启动怀疑了:它不会是在ChatGPT的输出基础上熟识的吧?

张开剩余90%

好巧不巧,Altman也发了一个情状,似乎在暗讽着什么……

不外DeepSeek V3并非是第一个出现“报错家门”的大模子。

举例Gemini就曾说过我方是百度的文心一言……

那么这到底是怎么一趟事?

为什么DeepSeek V3报错家门?

最初需要强调的少量是,从当前网友们举座探求的不雅点来看,说DeepSeek V3是在ChatGPT输出上熟识的可能性不大。

之是以这样说,正如网友Riley Goodside所追念的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3专诚用ChatGPT的输出作念了熟识,但这并不伏击。扫数在ChatGPT之后出现的大模子,简直王人见过它。

举例ShareGPT,一个并不崭新的ChatGPT对话数据集,很多东谈主也曾尝试在它和其它ChatGPT数据源上进行改变。但即便如斯,也没能出现DeepSeek V3级别的大模子。

即便DeepSeek V3专诚用ChatGPT的输出作念了熟识,但这并不伏击。扫数在ChatGPT之后出现的大模子,简直王人见过它。

举例ShareGPT,一个并不崭新的ChatGPT对话数据集,很多东谈主也曾尝试在它和其它ChatGPT数据源上进行改变。但即便如斯,也没能出现DeepSeek V3级别的大模子。

紧接着,Riley Goodside又拿出了DeepSeek V3弘扬中的一些凭据:

况且若是用了ChatGPT数据的话,有些对于DeepSeek V3质料的问题是确认欠亨的。

举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B相配,这跟它接没构兵ChatGPT数据无关。

况且弘扬称95%的GPU-hours用于预熟识基础模子,即等于跟ChatGPT数据关联,那这部分也会在post-training阶段发生(后5%)。

况且若是用了ChatGPT数据的话,有些对于DeepSeek V3质料的问题是确认欠亨的。

举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B相配,这跟它接没构兵ChatGPT数据无关。

况且弘扬称95%的GPU-hours用于预熟识基础模子,即等于跟ChatGPT数据关联,那这部分也会在post-training阶段发生(后5%)。

而比升引没用ChatGPT数据,简略咱们应当愈加温雅的是为什么大模子会赓续出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句尖锐的点评:

因为AI公司们获得数据的地点——收罗,正在充斥着AI垃圾。

因为AI公司们获得数据的地点——收罗,正在充斥着AI垃圾。

毕竟欧盟的一份弘扬曾展望,到2026年,90%的在线施行可能是AI生成的。

这种“AI轻侮”就会让“熟识数据透顶过滤AI的输出”变得鬈曲。

AI Now Institute的首席科学家Heidy Khlaaf则暗意:

尽管存在风险,耕作者依然被从现存AI模子中“蒸馏”常识所带来的老本省俭所诱惑。

不测地在ChatGPT或GPT-4输出上进行熟识的模子,也不一定会展示出让东谈主念念起OpenAI定制音信的输出。

尽管存在风险,耕作者依然被从现存AI模子中“蒸馏”常识所带来的老本省俭所诱惑。

不测地在ChatGPT或GPT-4输出上进行熟识的模子,也不一定会展示出让东谈主念念起OpenAI定制音信的输出。

那么当前对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3当前还莫得处置这个bug。

依旧是少了个问号,文告截止会不雷同:

DeepSeek V3更多玩法

不外有一说一,绝大部分网友对于DeepSeek V3的才气是予以了大大简直定。

而就在这两天,网友们连续晒出了更多DeepSeek V3加抓的实用玩法。

举例有网友拿DeepSeek V3和Claude Sonnet 3.5一决上下,在Scroll Hub等分歧用它俩创建网站:

博主在测试之后,以为DeepSeek V3完全胜出!

还有网友共享了用DeepSeek V3在AI视频剪辑器中的体验。

他暗意以后不必再在FFMPEG号令上浮滥期间了,DeepSeek V3不仅免费,还能改变你的责任过程:

AI编程神器Cursor也能跟DeepSeek V3勾通,来看一个作念馋嘴蛇的案例:

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友温雅到了一个非时代性的细节——

孝顺列表中,不仅展示了时代东谈主员,还极度据稳固和商务等责任主谈主员:

网友以为这种作念法止境相宜DeepSeek的调性:

参考聚会:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

— 完—开云体育

发布于:北京市

相关资讯
热点资讯
  • 友情链接:

Powered by 开云「中国」kaiyun网页版登录入口 @2013-2022 RSS地图 HTML地图