在拥挤的大模型赛道中,Deepseek(深度求索)的诞生可谓独树一帜。其创始人梁文锋此前更为人熟知的身份,是国内顶级量化基金“幻方量化”的创办者。而如今,他正带领一支独立团队,致力于推动通用人工智能(AGI)的探索与实现。
缘起:为何一家量化基金会投身AI大模型?
2023年,幻方量化宣布成立独立公司Deepseek,全面进军大模型领域。这一举动引发行业广泛关注:一个以量化投资著称的团队,为何要踏入技术要求极高、资金消耗巨大的AGI研发领域?
实际上,Deepseek并非突然转型。早在2019年,幻方就曾投入近2亿元自研深度学习训练平台“萤火一号”,配备1100张GPU。两年后,更是豪掷10亿元打造“萤火二号”,搭载约1万张NVIDIA A100芯片——这一数字,即便在国内科技巨头中也寥寥无几。
正如梁文锋所言:“我们不是因为看到机会才做,而是因为我们想做、能做,也适合做。”
目标不止于复制,而是探索AGI的本质
与许多聚焦垂直场景的团队不同,Deepseek明确将AGI作为研发方向。其目标不是复刻一个ChatGPT,而是深入语言模型背后,尝试解开人类智能的奥秘。
梁文锋提出了一个核心假设:“人类智能的本质可能是语言,思考本身或许就是一种语言编织的过程。”如果这一假说成立,那么从大语言模型中诞生出人类级别的AGI,并非遥不可及。
这也意味着,Deepseek更重视基础研究而非短期应用。正如团队所说:“我们关注的是研究和探索本身,而不是急于商业化。”
资金与算力:可持续研发的双重支撑
大模型研发不仅技术门槛高,更是资金密集型的长期投入。初步进入赛道的门槛就高达数亿美元,单次训练成本也需数千万元。
Deepseek依托幻方量化的资金支持,具备较充足的研发预算。此外,团队还拥有年度数亿元的公益资金池,在必要时可倾斜用于AGI研究。在算力方面,早早布局的GPU集群为其打下坚实基础,使其在硬件资源上不输科技巨头。
尽管如此,梁文锋也坦言:“从纯商业角度看,基础研究的投资回报率极低。”真正推动他们前进的,并非短期利益,而是一种探索未知的信念。
人才策略:重潜力轻经验,崇尚自主创新
在招人标准上,Deepseek显得尤为“反传统”。团队不过度强调候选人的过往经验,反而更看重其基础能力、创造力和热情。
梁文锋认为,缺乏经验的人往往更愿意反复尝试、谨慎思考,从而找到更适应当前情境的解决方案。这种“无知者无畏”的特质,恰恰是创新的重要来源。
团队也不设置KPI考核,不强调短期成果,而是给予成员充分的探索空间和犯错自由。正如他们所说:“创新往往自然发生,无法被刻意计划或教授。”
开源与开放:致力降低大模型使用门槛
Deepseek计划将大多数训练成果公开,推动技术民主化。他们希望让更多开发者——甚至个人或小团队——能够以低成本接触和使用大模型,避免技术被少数公司垄断。
与科技巨头可能将模型与自身生态绑定的策略不同,Deepseek强调“完全开放与独立”。这种开源态度,也与团队一贯的初心一脉相承:推动技术普惠,而非追求闭环获利。
常见问题
Deepseek与幻方量化是什么关系?
Deepseek是一家独立公司,虽由幻方孵化并资助,但专注于AG研发,与幻方的量化业务并无直接关联。
为何选择进入大模型领域?
团队多数成员具备AI背景,长期以来对人工智能充满信念。AGI被视为下一个极具挑战的领域,Deepseek希望在此方向做出贡献。
如何应对巨头竞争?
尽管科技巨头资源优势明显,但Deepseek认为初创团队灵活性更强、创新效率更高,尤其在面对分散、长尾需求时更具优势。
是否担心持续投入的成本问题?
团队承认创新本身是昂贵且低效的,但他们已做好长期投入准备,并相信这是一条值得坚持的道路。
未来的商业化方向是什么?
目前仍以研究为核心,短期不急于商业化。长期来看,将通过开源和开放模型降低使用门槛,推动技术广泛应用。
在人工智能浪潮席卷全球的今天,Deepseek代表了一种不同寻常的探索路径:它出身于金融领域,却怀揣科研理想;它具备雄厚资金,却选择开放与开源;它不追逐热点,而是坚持“做重要而困难的事”。
正如梁文锋所引用的法国新浪潮导演特吕弗之言:“要极度渴望,也要极度真诚。”或许正是这种纯粹与坚定,让我们对AGI的未来多了一份期待。