我们在昨晚尝试询问 DeepSeek 的最新状态,在关闭“深度思考”和“联网搜索”后查询模型信息时发现,其上下文长度已提升至1M Token(此前为128K),知识库截止日期更新至2025年5月。
离春节不到一周,过去两年的经验告诉我们,国产AI新产品的爆发期又要来了。 Kimi K2.5在OpenRouter上一骑绝尘,Minimax也在官网上隐隐约约透露出M2.2的版本代号。 大家等得很焦急,智谱和DeepSeek年前是不是也得来点大动作?
这家以技术效率闻名的AI公司,最近动作特别频繁:一边接连发布重磅技术成果,一边敞开大门大力招人。创始人梁文锋的名字还频频出现在核心论文的作者栏里——种种迹象都让人觉得,他们可能正在准备“搞个大事情”。
最近几个月,大语言模型(LLM)领域出现了一个有趣的现象:虽然开源社区依然活跃,但闭源模型(如GPT 5系列、Claude 4.5、Gemini 3.0)似乎正在加速拉开差距。可能是西方马上圣诞节的缘故,各家的狠活都一个接一个地来了。这种差距不仅仅体现在跑分上,更体现 ...
IT之家2 月 11 日消息,华为云“码道”(CodeArts)代码智能体在马年春节前开启万人公测。 目前,“码道”个人版已面向开发者免费开放,企业版后续公布。该产品接入 GLM-4.7 和 DeepSeek-V3.2 模型,支持 JetBrains 系列、 Visual Studio Code 两大 IDE。 据官方介绍,“码道”是华为云打造的智能编码产品,深度融合 IDE、自主开发模式与代码大 ...
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: ...
使用微信扫码将网页分享到微信 春节期间,互联网上最火的不是春晚小品,也不是春节档电影,而是 DeepSeek。 这匹来自中国的 AI 黑马,以极低的训练成本实现了媲美 OpenAI o1 的性能,凭借强大的中文能力、堪称赛博觉醒的顿悟时刻和秉持开源精神,迅速搅动了 ...
DeepSeek引发的冲击波仍在持续:不仅多个平台宣布接入DeepSeek,各个行业也密集搭上这趟“快车”。尽管DeepSeek通过优化算法显著降低算力需求,但因其高性价比助推AI普及,使得算力需求反而呈现指数级膨胀。对于国内算力产业而言,DeepSeek的创新带来了一个可以 ...
导读:DeepSeek的训练用到了自研的强化学习算法GRPO,它由OpenAI发明的强化学习算法PPO发展而来。DeepSeek的GRPO算法和OpenAI的PPO算法有何区别?这两种算法相比有何优缺点?为什么DeepSeek要使用GRPO算法而不是PPO算法?本文对这些问题进行解答。本文先简要回顾PPO算法 ...
钛媒体APP on MSN
从DeepSeek恐慌到Cowork恐慌
Cowork恐慌可能比DeepSeek恐慌更为持久。
随着DeepSeek的大火,其背后的联网搜索支持方也受到关注。2025年世界移动通信大会期间,博查CTO翁柔莹接受每经记者专访时表示,DeepSeek爆火前已接入其搜索API。目前,博查Search API的日调用量已达3000万次,承接着国内AI应用60%的联网搜索请求。 每经记者|宋欣悦 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果