最近最火的是中國出現(xiàn)的這款最強(qiáng)AI引擎。這里面對我感觸最多的是幾位年輕人才,因?yàn)槭昵拔乙捕冀?jīng)歷過這個(gè)過程,尤其是前期過程。
我們當(dāng)時(shí)2014年底投身AI引擎,這個(gè)賽道當(dāng)時(shí)幾乎沒有什么競爭對手,所以在鳥巢開第一款產(chǎn)品發(fā)布會(huì)的時(shí)候,還很宏大,拿到了上億融資。當(dāng)時(shí)合伙人去美國學(xué)習(xí)考察了量化基金、還有kenso 等初創(chuàng)AI。最后也基本是想把量化的技術(shù)用在一級(jí)市場服務(wù)。如果用在股票或者直接用在全網(wǎng)搜索,就是現(xiàn)在的這個(gè)深度求索了。
當(dāng)時(shí)有一段時(shí)間我也參與數(shù)據(jù)科學(xué)家、尤其是NLP工程師和相關(guān)模型設(shè)計(jì)開發(fā)的實(shí)習(xí)生。當(dāng)時(shí)就拿出七八十萬年薪、還有經(jīng)驗(yàn)弱一點(diǎn)的給到三五十萬年薪,月薪三四萬一年十六薪。
巧合的是當(dāng)時(shí)我們原本想用投入全樣本數(shù)據(jù)純機(jī)器學(xué)習(xí)這個(gè)思路,后來我的團(tuán)隊(duì)招聘進(jìn)來一位女士,思路清晰,創(chuàng)新力強(qiáng),和工程師一起碰出了規(guī)則下的機(jī)器模型訓(xùn)練體系。然后就讓產(chǎn)品進(jìn)度更快更有效地推進(jìn)發(fā)展。
可惜的是當(dāng)時(shí)下手太早,數(shù)據(jù)很貴,開發(fā)成本很高,融資耗盡,多個(gè)產(chǎn)品線頭也都斷了,只剩下個(gè)產(chǎn)業(yè)知識(shí)圖譜。
嗚呼哀哉。
>>浙江大學(xué)機(jī)器視覺專業(yè)
>> 2015 年,30 歲時(shí),推出 High-Flyer 量化對沖基金
>>賺大錢(now資產(chǎn)管理規(guī)模達(dá) 80 億美元)
>>希望開發(fā)“人類”級(jí)別的人工智能作為副業(yè),并向合作伙伴推介,但他們最初持懷疑態(tài)度
>> 2021 年購買 10,000 塊 H800 芯片,并招募其頂級(jí)對沖基金員工(他們都有豐富的經(jīng)驗(yàn),可以為基金充分利用 Nvidia GPU)
>> 2023 年推出 DeepSeek,并聘請了數(shù)十名來自中國頂尖大學(xué)(北京大學(xué)、清華大學(xué)和北航)的博士
>>為科技人才提供最高薪資,中國只有字節(jié)跳動(dòng)能與之匹敵……希望 DeepSeek 成為領(lǐng)先的“本土”公司
>>美國出口限制迫使 DeepSeek 團(tuán)隊(duì)發(fā)揮創(chuàng)造力,他們找到了新的訓(xùn)練方法,使 LLM 模型 (V3、r1) 能夠與 OpenAI、Anthropic、Gemini、Grok、LLama 等相媲美,而成本僅為其二十分之一
>>培訓(xùn)成本并不完全相同,但方法新穎,效率明顯提高(還有關(guān)于復(fù)制其他模型、他們可能無法談?wù)摰母蟮?H-100 集群和/或中共支持的問題)
>>開放來源并發(fā)布方法(r1 推理論文有 200 多位作者)
>> DeepSeek 剛剛登上 App Store 榜首
此前,“雷軍千萬年薪挖掘天才AI少女”的話題爆火。而這位讓雷軍以千萬年薪招攬的羅福莉,則是DeepSeek開源大模型DeepSeek-V2的關(guān)鍵開發(fā)者之一。
羅福莉本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語言學(xué)專業(yè)。
碩士畢業(yè)后,羅福莉先是進(jìn)入阿里達(dá)摩院做人工智能研究,從事預(yù)訓(xùn)練語言模型相關(guān)的工作,負(fù)責(zé)阿里達(dá)摩院AliceMind開源項(xiàng)目,主導(dǎo)開發(fā)了多語言預(yù)訓(xùn)練模型VECO。2022年,羅福莉加入幻方量化從事深度學(xué)習(xí)相關(guān)策略建模和算法研究,后又跳槽到DeepSeek擔(dān)任深度學(xué)習(xí)研究員,參與研發(fā)MoE大模型DeepSeek-V2。
就在DeepSeek-V3發(fā)布前幾天,小米創(chuàng)始人雷軍已開出千萬元年薪招聘羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì)。
招聘網(wǎng)站顯示,深度求索公司的北京子公司正在招人,現(xiàn)共放出了52個(gè)崗位,包括深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師以及資深ui設(shè)計(jì)師等,均為14薪。其中,薪資最高的為核心系統(tǒng)研發(fā)工程師(校招),薪資范圍為6萬元-9萬元;除此之外,大部分崗位的起薪在2萬元及以上。值得一提的是,該公司正在招聘實(shí)習(xí)生,AGI大模型實(shí)習(xí)生的工資為500元/天-1000元/天,數(shù)據(jù)百曉生實(shí)習(xí)生為500元/天-510元/天。
近一周,來自中國的深度求索(DeepSeek)全球爆紅,尤其讓美國硅谷極為震撼和恐慌。其最新發(fā)布的R1大模型不僅在性能上比肩甚至超越了OpenAI的o1,并完全開源,且以對手3%的超低成本實(shí)現(xiàn)了這一突破。
AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)接受電視媒體公開采訪時(shí)表示,中國人工智能公司DeepSeek的AI大模型性能大致與美國最好的模型相當(dāng)。過去十年來,美國可能一直在人工智能競賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”。
Meta創(chuàng)始人兼CEO扎克伯格表示,DeepSeek非常先進(jìn),并認(rèn)為中美之間的AI差距非常小。扎克伯格還表示,中國正在全力沖刺,如果將來有一個(gè)開源模型能被全世界廣泛使用,我們希望它是一個(gè)美國模型。