金磊 发自 凹非寺开云体育
量子位 | 公众号 QbitAI
要说这两天大模子圈的顶流话题,那富饶曲直DeepSeek V3莫属了。
不外在网友们纷繁测试之际,有个bug也成了热议的焦点——
仅仅少了一个问号,DeepSeek V3果然称我方是ChatGPT。
以至让它讲个见笑,生成的截止亦然跟ChatGPT雷同:
加之DeepSeek V3此次爆火的一个亮点,就是熟识只花了557.6万好意思元的老本。
于是乎,有东谈主就启动怀疑了:它不会是在ChatGPT的输出基础上熟识的吧?
张开剩余90%好巧不巧,Altman也发了一个情状,似乎在暗讽着什么……
不外DeepSeek V3并非是第一个出现“报错家门”的大模子。
举例Gemini就曾说过我方是百度的文心一言……
那么这到底是怎么一趟事?
为什么DeepSeek V3报错家门?
最初需要强调的少量是,从当前网友们举座探求的不雅点来看,说DeepSeek V3是在ChatGPT输出上熟识的可能性不大。
之是以这样说,正如网友Riley Goodside所追念的那样——因为ChatGPT的影子无处不在。
即便DeepSeek V3专诚用ChatGPT的输出作念了熟识,但这并不伏击。扫数在ChatGPT之后出现的大模子,简直王人见过它。
举例ShareGPT,一个并不崭新的ChatGPT对话数据集,很多东谈主也曾尝试在它和其它ChatGPT数据源上进行改变。但即便如斯,也没能出现DeepSeek V3级别的大模子。
即便DeepSeek V3专诚用ChatGPT的输出作念了熟识,但这并不伏击。扫数在ChatGPT之后出现的大模子,简直王人见过它。
举例ShareGPT,一个并不崭新的ChatGPT对话数据集,很多东谈主也曾尝试在它和其它ChatGPT数据源上进行改变。但即便如斯,也没能出现DeepSeek V3级别的大模子。
紧接着,Riley Goodside又拿出了DeepSeek V3弘扬中的一些凭据:
况且若是用了ChatGPT数据的话,有些对于DeepSeek V3质料的问题是确认欠亨的。
举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B相配,这跟它接没构兵ChatGPT数据无关。
况且弘扬称95%的GPU-hours用于预熟识基础模子,即等于跟ChatGPT数据关联,那这部分也会在post-training阶段发生(后5%)。
况且若是用了ChatGPT数据的话,有些对于DeepSeek V3质料的问题是确认欠亨的。
举例Pile测试(基础模子压缩Pile的后果),DeepSeek V3得分简直与Llama 3.1 405B相配,这跟它接没构兵ChatGPT数据无关。
况且弘扬称95%的GPU-hours用于预熟识基础模子,即等于跟ChatGPT数据关联,那这部分也会在post-training阶段发生(后5%)。
而比升引没用ChatGPT数据,简略咱们应当愈加温雅的是为什么大模子会赓续出现“报错家门”的问题。
TechCrunch针对这个问题给出了一句尖锐的点评:
因为AI公司们获得数据的地点——收罗,正在充斥着AI垃圾。
因为AI公司们获得数据的地点——收罗,正在充斥着AI垃圾。
毕竟欧盟的一份弘扬曾展望,到2026年,90%的在线施行可能是AI生成的。
这种“AI轻侮”就会让“熟识数据透顶过滤AI的输出”变得鬈曲。
AI Now Institute的首席科学家Heidy Khlaaf则暗意:
尽管存在风险,耕作者依然被从现存AI模子中“蒸馏”常识所带来的老本省俭所诱惑。
不测地在ChatGPT或GPT-4输出上进行熟识的模子,也不一定会展示出让东谈主念念起OpenAI定制音信的输出。
尽管存在风险,耕作者依然被从现存AI模子中“蒸馏”常识所带来的老本省俭所诱惑。
不测地在ChatGPT或GPT-4输出上进行熟识的模子,也不一定会展示出让东谈主念念起OpenAI定制音信的输出。
那么当前对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3当前还莫得处置这个bug。
依旧是少了个问号,文告截止会不雷同:
DeepSeek V3更多玩法
不外有一说一,绝大部分网友对于DeepSeek V3的才气是予以了大大简直定。
而就在这两天,网友们连续晒出了更多DeepSeek V3加抓的实用玩法。
举例有网友拿DeepSeek V3和Claude Sonnet 3.5一决上下,在Scroll Hub等分歧用它俩创建网站:
博主在测试之后,以为DeepSeek V3完全胜出!
还有网友共享了用DeepSeek V3在AI视频剪辑器中的体验。
他暗意以后不必再在FFMPEG号令上浮滥期间了,DeepSeek V3不仅免费,还能改变你的责任过程:
AI编程神器Cursor也能跟DeepSeek V3勾通,来看一个作念馋嘴蛇的案例:
嗯,DeepSeek V3是有点好用在身上的。
One More Thing
对于此前公布的53页论文,也有网友温雅到了一个非时代性的细节——
孝顺列表中,不仅展示了时代东谈主员,还极度据稳固和商务等责任主谈主员:
网友以为这种作念法止境相宜DeepSeek的调性:
参考聚会:
[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
[2]https://x.com/victormustar/status/1872647314231398524
[3]https://x.com/breckyunits/status/1872422078592516295
[4]https://x.com/op7418/status/1872689338242482203
[5]https://x.com/goodside/status/1872911457857208596
[6]https://x.com/kevinsxu/status/1873146905846530472
— 完—开云体育
发布于:北京市