海华233圣约翰

“深度求索”创始人17岁考入浙大,团队成员大多来自国内顶尖院校

0

40 丨1周前

近日,“来自东方的神秘力量”又一次震撼海外人士心脏,它就是DeepSeek。

游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。

冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

为什么DeepSeek能出圈?

在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。

它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片,双方的成本至少是10倍的差距。

在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。

国外独立测评机构Artificial Analysis测试后,发出了“超越了迄今为止所有开源模型”的惊叹;Meta科学家田渊栋感慨:“这是非常伟大的工作。”

“性价比”是商业社会中的制胜法宝之一,DeepSeek也因创新的模型架构和史无前例的性价比被称为“大模型界的拼多多”,引发字节、阿里、百度等大厂的大模型价格大战。

2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。

在此次座谈会上,共有9人先后发言,其中就有深度求索(DeepSeek)创始人梁文锋。


梁文锋是谁?


低调的梁文锋是个80后,出生在广东的一个五线城市,父亲是一名小学老师。他毕业于浙江大学,主修软件工程,人工智能方向。

17岁时,梁文锋考入浙大,读的是电子工程系人工智能方向,毕业后在浙大攻读硕士研究生,论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。

2015年,30岁的梁文锋和朋友一起创办了杭州幻方科技有限公司,立志成为世界顶级的量化对冲基金。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。到2017年底,几乎所有的量化策略都采用AI模型计算。

2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。

有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。

从公开的工作经历和职业生涯来看,梁文锋在量化投资和高性能计算领域具有深厚的背景和丰富的经验,创业范畴横跨金融和人工智能领域。

DeepSeek团队:

90后、95后为主,喜欢“高潜力年轻人”

据报道,DeepSeek的员工规模不到140人,是Open AI的十分之一左右。据领英网站检索样本发现,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。

和动辄上千人的“大厂”AI开发团队相比,DeepSeek百余人的规模显得相当精炼,并且在选人标准上两者也大有不同:互联网公司一般看重成熟的经验,最好有在核心项目成功过的经历,而DeepSeek则喜欢“高潜力年轻人”。以该公司选择的“稀疏训练”技术路径为例,刚毕业的博士生由于在学校里接触过相关前沿课题,对这一技术路径更加熟悉,而“业界老鸟”则不一定对最新技术能保持高度敏感。

据“智能涌现”,一名曾与DeepSeek有过合作的猎头表示,DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。

梁文锋曾在采访中表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。业内人士表示,DeepSeek的薪资水平能够对标业内任何顶尖机构,而且人才如果在字节跳动等取得offer,DeepSeek还会加码竞争。DeepSeek开出的应届工程师薪酬已经等同于业界同等岗位的“总监/经理”的薪酬了。

此外梁文锋非常推崇“极客文化”,在公司内部推行扁平化管理,并且鼓励员工个人发挥潜能进行学习和创新。DeepSeek也不会采用互联网巨头常用的“赛马”机制,减少团队内耗。在算力资源的调配上,梁文锋对每个人都不设上限,只要提出有潜力的思路,他都会给员工调拨足够的资源进行尝试研究。据悉产生R1模型的技术思路就是一名年轻员工“突发奇想”提出的点子,梁文锋为他搭配了一个团队,“花了几个月时间才跑通(技术路线)”。事实证明,DeepSeek这种“轻经验、重潜力”的用人思路,为中国AI界迎来了一次划时代的创新发展。

在团队配置上,DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。

OpenAI前政策主管、Anthropic联合创始人Jack Clark曾这样评价DeepSeek:“雇用了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量。”

通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,均为14薪。

其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。


注:本文引自光明社教育家,内容来源橙柿互动·都市快报、红星新闻

圣约翰

0
0
他的发布
其他相关
0
0
发送