2025年1月20日,中国AI初创公司深度求索(DeepSeek)发布了推理模型DeepSeek-R1正式版,并开源模型权重,允许用户通过模型蒸馏等方式训练其他模型。这款大模型在数学、代码、自然语言推理等任务上表现优异,性能比肩OpenAI o1正式版。DeepSeek的低成本、高性能模型引发了硅谷的恐慌,OpenAI正迎来一个最强劲的对手。 DeepSeek的崛起低成本高性能
DeepSeek-V2和DeepSeek-V3模型以极低的成本实现了与OpenAI相当的性能。DeepSeek-V2的推理成本降至每百万token仅1元,约为Llama3 70B的七分之一,GPT-4 Turbo的七十分之一。DeepSeek-V3的API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中),输出每百万tokens 8元,性价比进一步提升。 开源策略
DeepSeek-R1的开源策略进一步加剧了硅谷的恐慌。R1模型允许所有人在遵循MIT License的情况下自由使用和蒸馏训练其他模型,这种开放精神挑战了硅谷巨头通过封闭技术赚取巨额利润的模式。
硅谷的恐慌 DeepSeek的创新 梁文锋的创业故事早期经历
梁文锋1985年出生于广东湛江,2002年考入浙江大学电子信息工程专业,2007年考上浙江大学信息与通信工程专业硕士。2008年,梁文锋带领团队运用机器学习技术探索全自动量化交易。 创业历程
2010年,梁文锋从浙江大学硕士毕业,毕业论文题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。2013年,梁文锋将人工智能与量化交易结合,创立了雅克比投资。2015年,他创立了杭州幻方科技有限公司,即今天的浙江九章资产管理有限公司。 AI创业
2023年,梁文锋宣布要做通用人工智能(AGI),并成立了杭州深度求索人工智能基础技术研究有限公司(DeepSeek)。DeepSeek专注于AI大模型的研究与开发,梁文锋也成为量化投资者投身AI创业的“第一人”。
对行业的影响
|