快捷导航
查看: 417|回复: 1

【只招1%的天才 DeepSeek全华班的震撼?】

[复制链接]

49

主题

10

回帖

219

积分

管理员

积分
219
发表于 2025-1-27 08:29:14 | 显示全部楼层 |阅读模式
2025年1月20日,中国AI初创公司深度求索(DeepSeek)发布了推理模型DeepSeek-R1正式版,并开源模型权重,允许用户通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上表现优异,性能比肩OpenAI o1正式版。DeepSeek的低成本、高性能模型引发了硅谷的恐慌,OpenAI正迎来一个最强劲的对手。

DeepSeek的崛起
  • 低成本高性能
    DeepSeek-V2和DeepSeek-V3模型以极低的成本实现了与OpenAI相当的性能。DeepSeek-V2的推理成本降至每百万token仅1元,约为Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。DeepSeek-V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,性价比进一步提升。
  • 开源策略
    DeepSeek-R1的开源策略进一步加剧了硅谷的恐慌。R1模型允许所有人在遵循MIT License的情况下自由使用和蒸馏训练其他模型,这种开放精神挑战了硅谷巨头通过封闭技术赚取巨额利润的模式。


硅谷的恐慌
  • 微软CEO的评价
    微软CEO萨蒂亚・纳德拉在瑞士达沃斯世界经济论坛上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他们切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。”
  • 英伟达科学家的评价
    英伟达高级研究科学家Jim Fan表示:“我们生活在这样一个时代:一个不是美国公司的AI企业却实现了 OpenAI成立时的使命——做真正开放的前沿研究、为所有人赋能。”


DeepSeek的创新
  • 模型结构创新
    DeepSeek在模型结构层面进行了从0到1的创新,使得模型成本大大降低,被业内戏称为“AI届拼多多”。
  • 人才密度
    DeepSeek团队最大的特点是人才密度极高,且多来自于中国本土市场。公司只招1%的天才,去做99%中国公司做不到的事情。应届生、在读生,特别是来自清北的应届生在其中非常活跃。


梁文锋的创业故事
  • 早期经历
    梁文锋1985年出生于广东湛江,2002年考入浙江大学电子信息工程专业,2007年考上浙江大学信息与通信工程专业硕士。2008年,梁文锋带领团队运用机器学习技术探索全自动量化交易。
  • 创业历程
    2010年,梁文锋从浙江大学硕士毕业,毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。2013年,梁文锋将人工智能与量化交易结合,创立了雅克比投资。2015年,他创立了杭州幻方科技有限公司,即今天的浙江九章资产管理有限公司。
  • AI创业
    2023年,梁文锋宣布要做通用人工智能(AGI),并成立了杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。DeepSeek专注于AI大模型的研究与开发,梁文锋也成为量化投资者投身AI创业的“第一人”。


对行业的影响
  • 改变游戏规则
    DeepSeek的成功表明,AI能力的提升并不一定需要巨额投入。Noah's Arc资本管理公司表示,DeepSeek-V3可能彻底改变训练和推理领域的游戏规则。
  • 对硅谷的挑战
    外媒一致认为,DeepSeek的进展为硅谷敲响了警钟。加州大学伯克利分校的AI政策研究员Ritwik Gupta指出,AI能力没有护城河,中国的系统工程师人才库比美国更大,他们更懂得如何充分利用计算资源。


4

主题

18

回帖

103

积分

管理员

积分
103
发表于 2025-1-27 08:33:52 | 显示全部楼层
最近DeepSeek好火
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版 启航岛

Powered by Discuz! X3.5 © 2024-2025

快速回复 返回顶部 返回列表