硬刚OpenAI的DeepSeek,创始人竟是澳洲学长

puppy

嘿,各位留澳的小伙伴!最近AI圈是不是被一个叫DeepSeek的国产大模型刷屏了?它不仅免费开源,代码能力还强到直接挑战GPT-4,在好多权威榜单上都名列前茅。但最让人惊喜和骄傲的是,这个项目的幕后大佬,竟然就是咱们一位澳洲学长!没错,就是从澳洲校园里走出去的“自己人”。从留学生到硬刚OpenAI的AI领军人物,这位学长的故事也太酷了吧?想知道他是谁,经历了怎样一段开挂的奋斗历程吗?快来文章里寻找答案,顺便膜拜一下大神!

学长带飞!关于DeepSeek你需要知道的几件事
它是谁? 一个纯正的国产AI大模型,叫DeepSeek(深度求索)。最炸裂的是,它的幕后大佬,就是咱们澳洲阿德莱德大学毕业的学长——梁文广。
它有多牛? 代码能力直接叫板GPT-4,在多个全球权威AI排行榜上名列前茅,性能已经稳稳站在了世界第一梯队。
和我有啥关系? 关系大了!它免费开源,API(应用程序接口)价格便宜到令人发指(1块钱人民币处理75万个汉字),简直是为咱们留学生量身定做的写代码、肝论文、省钱刷due的神器!
这个故事告诉我们? 留澳背景不是天花板,而是超级起跳板。你的校友,可能就是下一个改变世界的人!别小看自己,也别小看你身边的每一个人。

嘿,各位在澳洲奋斗的小伙伴们!

不知道你有没有过这样的深夜:Final大作业的due就在几小时后,你对着屏幕上一片飘红的bug欲哭无泪。旁边的咖啡已经续了第三杯,但脑子还是一团浆糊。你打开ChatGPT,小心翼翼地输入问题,结果它要么给你一段看似正确但跑不通的代码,要么就是告诉你“As an AI model, I can't...”心态瞬间崩了。

就在上学期,我的朋友Leo,一个在USYD读Computer Science的大神,就经历了这么一幕。他那个关于机器学习的Final Project,复杂到头发都快掉光了。他一边骂骂咧咧,一边在各种AI工具之间切换,希望能找到救命稻草。就在他快要放弃的时候,一个国内的同学给他发来一个链接,说:“试试这个,国产的,叫DeepSeek,听说写代码很猛。”

Leo抱着死马当活马医的心态试了试,结果……奇迹发生了。不仅他代码里的一个隐藏极深的逻辑错误被揪了出来,AI还提供了一种更优化的算法,思路清晰,注释详细,看得他目瞪口呆。更让他震惊的是,当他想继续追问时,发现这玩意儿居然是免费的!

故事的高潮在第二天,当Leo兴奋地跟我们分享这个宝藏工具时,另一个朋友突然在群里甩出一张截图,上面是DeepSeek创始团队的介绍。他激动地打字:“卧槽,你们看这个创始人!梁文广,阿德莱德大学!这不就是咱们的澳洲学长吗?!”

那一刻,我们整个留学圈的小群都炸了。一个我们以为遥不可及,在AI领域硬刚OpenAI的顶尖项目,创始人竟然是“自己人”!一个曾经也可能在阿村的图书馆里赶过due、在Rundle Mall逛过街的学长,如今正带领团队,做着挑战世界顶级科技巨头的事情。这感觉,除了“牛”和“骄傲”,真的找不到别的词来形容。

所以今天,咱们就来好好扒一扒,这位澳洲学长和他的DeepSeek,到底有多硬核!

它到底有多强?数据才是硬道理

在AI圈,吹牛是没用的,一切都得看榜单和数据。DeepSeek不是那种只会喊口号的“PPT模型”,它是真的能打。

咱们先说它的看家本领——代码能力。DeepSeek团队专门推出了一个叫DeepSeek-Coder V2的模型。这个模型有多恐怖呢?在一个叫做HumanEval的权威代码生成能力测试中,它的得分高达86.9%,这个成绩已经超过了OpenAI最强的GPT-4o。简单来说,就是你给它一个编程任务,它生成正确、可用代码的能力,已经不输甚至超越了我们目前能接触到的最强AI。

想象一下,你以后写代码,旁边等于坐了一个24小时在线、不用付工资、还比大多数高级工程师都厉害的“技术总监”。这对于我们CS专业的同学来说,简直就是天降福音。

当然,它不只是个“码农”。它的通用模型DeepSeek-V2,在综合能力上同样表现惊人。在一个衡量模型综合知识和推理能力的重量级榜单MMLU上,DeepSeek-V2的得分也达到了顶级水平,这意味着无论你是写商科的report,还是分析文科的文献,它都能给到你非常靠谱的帮助。

更关键的一点是,DeepSeek选择了一条更难但更伟大的路——开源。什么叫开源?就是它把模型的“武功秘籍”(模型权重)直接公开了,全世界的开发者和研究人员都可以下载、学习、甚至修改它。这和OpenAI那种把核心技术藏得严严实实的“闭源”模式完全相反。这种开放的姿态,不仅推动了整个AI社区的进步,也为它赢得了全球开发者的尊重。

价格屠夫!1块钱能干这么多事?

如果说强大的性能是DeepSeek的A面,那它“离谱”的价格就是它的B面,而这一面,对我们学生党来说,吸引力可能更大。

我们都知道,天下没有免费的午餐,调用像GPT-4这样的顶级模型API是要花钱的,而且不便宜。对于想自己做点小项目、开发个小应用的同学来说,API的费用是一笔不小的开销。

DeepSeek V2直接把价格打到了“骨折价”。它的API定价是:每百万输入Tokens收费1元人民币,每百万输出Tokens收费2元人民币。(Token可以简单理解为AI处理语言的单位,1百万Tokens约等于75万个汉字)。

这是什么概念?我们来做个对比。目前OpenAI最先进的模型之一GPT-4o,其API价格大约是每百万输入Tokens 5美元(约36元人民币),每百万输出Tokens 15美元(约108元人民币)。

不算不知道,一算吓一跳。DeepSeek V2的价格,只有GPT-4o的大约1/30到1/50!

一块钱,你可以让DeepSeek帮你阅读并总结差不多5本《哈利·波特与魔法石》的全部内容。这对于需要处理海量文献、整理学习资料的我们来说,意味着什么不言而喻。以前想都不敢想的“AI学习助理”,现在几乎是以“白菜价”向我们敞开怀抱。

为什么能这么便宜?这得益于它采用了一种叫做“专家混合网络”(MoE)的先进技术。你可以把它想象成一个“专家团队”,而不是一个什么都懂的“全才”。当你问一个关于编程的问题,系统会自动把它交给“编程专家”来处理;当你问一个历史问题,就由“历史专家”出马。这样一来,每次调用模型时,只需要激活一小部分“专家”,而不是整个庞大的模型,极大地提升了效率,降低了成本。

这种技术上的领先,最终转化为了我们用户实实在在的福利。

从阿德莱德到AI之巅:学长的开挂人生

聊了这么多模型本身,我们现在把目光转回到故事的主角——梁文广学长身上。

他的履历,简直就是一部现实版的“爽文”。从澳大利亚的阿德莱德大学毕业后,梁文广回国,并没有像大多数人一样按部就班地找工作,而是投身到了一个当时在国内还非常小众的领域——量化交易。

他和几位志同道合的伙伴一起,创立了“幻方量化”(High-Fre-Capital)。可能你对这个名字有点陌生,但在金融圈,这可是如雷贯耳的存在。幻方量化是中国最顶级的量化私募之一,管理着数百亿的资金。所谓量化交易,就是利用复杂的数学模型和强大的计算机算法,在瞬息万变的市场中自动进行交易决策,这背后需要的就是顶级的算力、数据处理能力和算法人才。

可以说,在做大模型之前,梁文广和他的团队就已经在“AI”的边缘疯狂试探了十几年。他们为了处理海量的金融数据、运行复杂的交易策略,早就开始自建超级计算机了。

当AI大模型的浪潮袭来时,很多人还在讨论要不要入局,幻方已经凭借着多年积累的优势,果断下场。他们成立了专门的AI公司“深度求索”(DeepSeek AI),并且把在量化领域赚到的钱,毫不犹豫地投入到了这场更宏大的技术竞赛中。

为了搞研发,他们打造了名为“萤火”的系列超级计算机。根据公开信息,他们的算力集群规模在国内乃至全球都处于领先地位。这就像打仗,他们不仅有顶尖的将领(人才),还有最精良的武器(算力)。

从一名留学生,到量化巨头创始人,再到AI领域的破局者,梁文广学长的每一步都踩在了时代的脉搏上。他的故事告诉我们,在澳洲的学习经历,绝不仅仅是一纸文凭。它赋予我们的是国际化的视野、独立思考的能力,以及敢于挑战未知领域的勇气。这些软实力,在未来的职业生涯中,可能比专业知识本身更为重要。

学长的成功,对我们意味着什么?

一个澳洲学长硬刚OpenAI的故事,听起来很燃,但它不仅仅是一个用来膜拜的传奇。对我们每一个在澳洲学习生活的留学生来说,这件事的意义其实非常具体。

首先,它打破了我们心中的“天花板”。我们中的很多人,可能会不自觉地认为,那些最前沿、最顶尖的科技创新,似乎总是发生在硅谷,创始人也大多是常春藤名校的背景。但梁学长的例子雄辩地证明,英雄不问出处。无论你是在墨大、悉大,还是在阿大、昆大,只要你拥有真才实学和改变世界的梦想,舞台就足够大。

其次,它给我们提供了触手可及的强大工具。别再把DeepSeek仅仅看作是一个新闻了,把它用起来!

  • CS/IT的同学:把它当作你的编程副驾驶。无论是debug、写测试用例,还是学习新的编程语言和框架,让DeepSeek-Coder成为你的私人导师。
  • 商科/文科的同学:利用DeepSeek V2强大的信息处理能力。把几十页的英文文献扔给它,让它在30秒内给你生成一份中文摘要和核心观点。写report需要数据支持?让它帮你搜集、整理和分析。
  • 所有专业的同学:用它来头脑风暴。当你对一个课题毫无头绪时,和它聊一聊,它的“胡说八道”有时反而能激发你意想不到的灵感。

最后,它为我们的职业规划提供了一个新的参照。AI时代已经到来,它不是一个遥远的概念,而是正在重塑各行各业的现实。梁文广的路径——从一个需要极强数理和编程能力的领域(量化),自然过渡到另一个技术驱动的领域(AI)——揭示了一个朴素的道理:打好坚实的数理基础,掌握过硬的编程能力,是通往未来科技之门的万能钥匙。

不管你现在学的是什么专业,都请多分一点时间和精力给数据科学、编程和数学。这些底层的硬核技能,会让你在未来的任何一个赛道上,都拥有更强的竞争力和更多的选择权。

所以,下次当你在图书馆里为一个复杂的公式、一段难懂的代码而头疼时,不妨换个角度想一想。

你现在啃下的每一块硬骨头,都在为你未来的某个可能性铺路。或许你不会成为下一个梁文广,但谁又能说得准呢?从澳洲校园里走出去的“我们”,未来有着无限的可能。

别再只是仰望星空了。像我们的学长一样,试着去成为那颗星。手边已经有了DeepSeek这样强大的工具,剩下的,就看你的了。


puppy

留学生新鲜事

337216 博客

讨论