Deepseek：从量化基金到前沿AI模型制造者的转型之路

在拥挤的大模型赛道中，Deepseek（深度求索）的诞生可谓独树一帜。其创始人梁文锋此前更为人熟知的身份，是国内顶级量化基金“幻方量化”的创办者。而如今，他正带领一支独立团队，致力于推动通用人工智能（AGI）的探索与实现。

缘起：为何一家量化基金会投身AI大模型？

2023年，幻方量化宣布成立独立公司Deepseek，全面进军大模型领域。这一举动引发行业广泛关注：一个以量化投资著称的团队，为何要踏入技术要求极高、资金消耗巨大的AGI研发领域？

实际上，Deepseek并非突然转型。早在2019年，幻方就曾投入近2亿元自研深度学习训练平台“萤火一号”，配备1100张GPU。两年后，更是豪掷10亿元打造“萤火二号”，搭载约1万张NVIDIA A100芯片——这一数字，即便在国内科技巨头中也寥寥无几。

正如梁文锋所言：“我们不是因为看到机会才做，而是因为我们想做、能做，也适合做。”

与许多聚焦垂直场景的团队不同，Deepseek明确将AGI作为研发方向。其目标不是复刻一个ChatGPT，而是深入语言模型背后，尝试解开人类智能的奥秘。

梁文锋提出了一个核心假设：“人类智能的本质可能是语言，思考本身或许就是一种语言编织的过程。”如果这一假说成立，那么从大语言模型中诞生出人类级别的AGI，并非遥不可及。

这也意味着，Deepseek更重视基础研究而非短期应用。正如团队所说：“我们关注的是研究和探索本身，而不是急于商业化。”

大模型研发不仅技术门槛高，更是资金密集型的长期投入。初步进入赛道的门槛就高达数亿美元，单次训练成本也需数千万元。

Deepseek依托幻方量化的资金支持，具备较充足的研发预算。此外，团队还拥有年度数亿元的公益资金池，在必要时可倾斜用于AGI研究。在算力方面，早早布局的GPU集群为其打下坚实基础，使其在硬件资源上不输科技巨头。

尽管如此，梁文锋也坦言：“从纯商业角度看，基础研究的投资回报率极低。”真正推动他们前进的，并非短期利益，而是一种探索未知的信念。

在招人标准上，Deepseek显得尤为“反传统”。团队不过度强调候选人的过往经验，反而更看重其基础能力、创造力和热情。

梁文锋认为，缺乏经验的人往往更愿意反复尝试、谨慎思考，从而找到更适应当前情境的解决方案。这种“无知者无畏”的特质，恰恰是创新的重要来源。

团队也不设置KPI考核，不强调短期成果，而是给予成员充分的探索空间和犯错自由。正如他们所说：“创新往往自然发生，无法被刻意计划或教授。”

Deepseek计划将大多数训练成果公开，推动技术民主化。他们希望让更多开发者——甚至个人或小团队——能够以低成本接触和使用大模型，避免技术被少数公司垄断。

与科技巨头可能将模型与自身生态绑定的策略不同，Deepseek强调“完全开放与独立”。这种开源态度，也与团队一贯的初心一脉相承：推动技术普惠，而非追求闭环获利。

Deepseek与幻方量化是什么关系？
Deepseek是一家独立公司，虽由幻方孵化并资助，但专注于AG研发，与幻方的量化业务并无直接关联。

为何选择进入大模型领域？
团队多数成员具备AI背景，长期以来对人工智能充满信念。AGI被视为下一个极具挑战的领域，Deepseek希望在此方向做出贡献。

如何应对巨头竞争？
尽管科技巨头资源优势明显，但Deepseek认为初创团队灵活性更强、创新效率更高，尤其在面对分散、长尾需求时更具优势。

是否担心持续投入的成本问题？
团队承认创新本身是昂贵且低效的，但他们已做好长期投入准备，并相信这是一条值得坚持的道路。

未来的商业化方向是什么？
目前仍以研究为核心，短期不急于商业化。长期来看，将通过开源和开放模型降低使用门槛，推动技术广泛应用。

在人工智能浪潮席卷全球的今天，Deepseek代表了一种不同寻常的探索路径：它出身于金融领域，却怀揣科研理想；它具备雄厚资金，却选择开放与开源；它不追逐热点，而是坚持“做重要而困难的事”。

正如梁文锋所引用的法国新浪潮导演特吕弗之言：“要极度渴望，也要极度真诚。”或许正是这种纯粹与坚定，让我们对AGI的未来多了一份期待。