那一夜, 梁文峰 思索良久,他想到了千千万万在大A亏钱的散户,难道他们亏掉的一切,就换来这样一个 deepseek 吗?他想到了广大的token使用者们,他们怎么办。他做出了一个决定,这件事哪怕他摔得粉碎,即便失败,因为他知道,星星之火可以燎原。 4月26日,梁文峰从 深度求索 首席执行官办公室 ...
www.zhihu.com/question/2031494133160861736
大家注意到没有,DeepSeek V4 的技术报告副标题是「Towards Highly Efficient Million-Token Context Intelligence」。 可以看到DeepSeek依然还是走效率路线,DeepSeek 不再只在「能力 benchmark」上跟 OpenAI ,Anthropic,Gemini等公司正面竞争了,而是在「高效长上下文推理」这条赛道上切入。
www.zhihu.com/question/2030963929510310856
期待已久的DeepSeek多模态终于上线了, 这也就意味着,DeepSeek-VL模型马上会开源出来。 在上周DeepSeek-V4开源的时候,我是有点失望的, 因为原生多模态,在很多家已经验证过了,想不通为啥DeepSeek为啥还是一直纯文本模型。 这不,就来了吗。 DeepSeek不欺我呀~
www.zhihu.com/question/2032851960177631968
DeepSeek 更新「快速模式」和「专家模式」,二者有何区别?这是否意味着 V4 快来了?
www.zhihu.com/question/2024876426596291384
4月7日晚有用户发现DeepSeek疑似开启了灰度测试,目前在web端和APP端均可以使用到“专家模式”。
www.zhihu.com/question/2025005145658762894
DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日),已经有很多科技巨头接入DeepSeek,比如英伟达、微软等等。 DeepSeek官网入口(PC端):
www.zhihu.com/question/10816472228
目前主流的编程 benchmark 就三个: SWE-Bench Verified 、 SWE-Bench Pro 和 Terminal Bench 2.0。 下面 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 在这三个基准测试上与其它大模型的对比: 这里也简单介绍一下这三个基准测试。
www.zhihu.com/question/2031035628486398465
按照deepseek以往出现类似症状的经验,多半是后台在搞更新所导致,往好里想,或许是网上之前传的沸沸扬扬的V4版本要来了。 用不了也没办法,只能等着。 不如趁这个闲下来的时间点整理一下历史对话内容,把有用的东西摘录到笔记软件上。
www.zhihu.com/question/2021714204932014774
DeepSeek多位骨干离职去大厂,他们的去向透露出哪些信息? 会对DeepSeek自身带来多大影响? 【 #DeepSeek多位核心骨干离职去大厂#】#DeepSeek核心骨干离职去向# 当AI(人工智能)圈为DeepSeek-V4的技术突破欢呼时,在… 显示全部 关注者 364
www.zhihu.com/question/2031824748590494923
DeepSeek 拟首次启动融资,估值超百亿美元,有何战略意图?对国内 AI 大模型赛道带来哪些改变?
www.zhihu.com/question/2028616808370849247