【只招1%的天才 DeepSeek全华班的震撼？】

Ray · 发表于 2025-1-27 08:29:14

2025年1月20日，中国AI初创公司深度求索（DeepSeek）发布了推理模型DeepSeek-R1正式版，并开源模型权重，允许用户通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上表现优异，性能比肩OpenAI o1正式版。DeepSeek的低成本、高性能模型引发了硅谷的恐慌，OpenAI正迎来一个最强劲的对手。

DeepSeek的崛起

低成本高性能
DeepSeek-V2和DeepSeek-V3模型以极低的成本实现了与OpenAI相当的性能。DeepSeek-V2的推理成本降至每百万token仅1元，约为Llama3 70B的七分之一，GPT-4 Turbo的七十分之一。DeepSeek-V3的API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中），输出每百万tokens 8元，性价比进一步提升。
开源策略
DeepSeek-R1的开源策略进一步加剧了硅谷的恐慌。R1模型允许所有人在遵循MIT License的情况下自由使用和蒸馏训练其他模型，这种开放精神挑战了硅谷巨头通过封闭技术赚取巨额利润的模式。

硅谷的恐慌

微软CEO的评价
微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示：“看到DeepSeek的新模型，真的令人印象非常深刻。他们切实有效地开发出了一款开源模型，在推理计算方面表现出色，且超级计算效率极高。”
英伟达科学家的评价
英伟达高级研究科学家Jim Fan表示：“我们生活在这样一个时代：一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能。”

DeepSeek的创新

模型结构创新
DeepSeek在模型结构层面进行了从0到1的创新，使得模型成本大大降低，被业内戏称为“AI届拼多多”。
人才密度
DeepSeek团队最大的特点是人才密度极高，且多来自于中国本土市场。公司只招1%的天才，去做99%中国公司做不到的事情。应届生、在读生，特别是来自清北的应届生在其中非常活跃。

梁文锋的创业故事

早期经历
梁文锋1985年出生于广东湛江，2002年考入浙江大学电子信息工程专业，2007年考上浙江大学信息与通信工程专业硕士。2008年，梁文锋带领团队运用机器学习技术探索全自动量化交易。
创业历程
2010年，梁文锋从浙江大学硕士毕业，毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。2013年，梁文锋将人工智能与量化交易结合，创立了雅克比投资。2015年，他创立了杭州幻方科技有限公司，即今天的浙江九章资产管理有限公司。
AI创业
2023年，梁文锋宣布要做通用人工智能（AGI），并成立了杭州深度求索人工智能基础技术研究有限公司（DeepSeek）。DeepSeek专注于AI大模型的研究与开发，梁文锋也成为量化投资者投身AI创业的“第一人”。

对行业的影响

改变游戏规则
DeepSeek的成功表明，AI能力的提升并不一定需要巨额投入。Noah's Arc资本管理公司表示，DeepSeek-V3可能彻底改变训练和推理领域的游戏规则。
对硅谷的挑战
外媒一致认为，DeepSeek的进展为硅谷敲响了警钟。加州大学伯克利分校的AI政策研究员Ritwik Gupta指出，AI能力没有护城河，中国的系统工程师人才库比美国更大，他们更懂得如何充分利用计算资源。

岛主 · 发表于 2025-1-27 08:33:52

最近DeepSeek好火

【只招1%的天才 DeepSeek全华班的震撼？】

浏览过的版块

新人须知

常见问题

维权申诉

关注AIMed

关注启航岛

关于合作

通讯联系