2026-01-06 簡訊 : DeepSeek 新訓(xùn)練方法,推動AI效率提升


頭條


DeepSeek 新訓(xùn)練方法,推動AI效率提升

https://links.tldrnewsletter.com/W5ppNq

DeepSeek發(fā)布了一篇論文,概述了一種使用名為Manifold-Constrained Hyper-Connections框架的更高效的人工智能開發(fā)方法。該技術(shù)旨在提高可擴展性,同時減少訓(xùn)練高級人工智能系統(tǒng)的計算和能源需求。該出版表明,DeepSeek即將發(fā)布一個重要模型。其R2模型預(yù)計將在二月初的春節(jié)前后發(fā)布。

NVIDIA和TSMC成為世界最有價值公司

https://sherwood.news/markets/nvidia-tsmc-rise-as-the-worlds-most-valuable-company-reportedly-asks-for/

中國公司已在2026年訂購超過200萬塊Nvidia Hopper代芯片。Nvidia擁有約70萬塊芯片庫存。每塊芯片售價約為27,000美元,如果所有報告的需求都能實現(xiàn),收入將超過540億美元。Nvidia計劃在農(nóng)歷新年假期前(2月17日開始)向發(fā)貨這些GPU。

OpenAI的音頻發(fā)展

https://techcrunch.com/2026/01/01/openai-bets-big-on-audio-as-silicon-valley-declares-war-on-screens/

OpenAI已重組內(nèi)部團(tuán)隊以推進(jìn)其音頻人工智能模型,目標(biāo)是在一年內(nèi)推出一款以音頻為主導(dǎo)的個人設(shè)備。此舉與整個行業(yè)轉(zhuǎn)向語音優(yōu)先界面的趨勢一致,Meta、Google和Tesla等公司將對話式音頻整合到日常設(shè)備中。


前沿


Claude Code的工作原理

Claude Code的工作原理以及我們可以從前沿代理架構(gòu)中學(xué)到什么。

通過有害強化學(xué)習(xí)進(jìn)行紅隊測試

https://huggingface.co/blog/georgefen/red-teaming-with-rl

這篇文章展示了如何使用惡意獎勵函數(shù)的強化學(xué)習(xí)來反向?qū)R一個2350億參數(shù)模型,使用Tinker API。攻擊者可以通過利用GRPO和低成本基礎(chǔ)設(shè)施,在不損害核心能力的情況下,誘使強大的大語言模型產(chǎn)生有害行為。


研究


MHC:流形約束超連接

https://arxiv.org/abs/2512.24880

超連接(HC)破壞了殘差連接固有的身份映射屬性,這會導(dǎo)致嚴(yán)重的訓(xùn)練不穩(wěn)定性和受限的可擴展性,并且還會帶來顯著的內(nèi)存訪問開銷。流形約束超連接(mHC)是一個通用框架,旨在解決這一問題。mHC將HC的殘差連接空間投影到特定流形上,以恢復(fù)身份映射屬性,同時結(jié)合嚴(yán)格的基礎(chǔ)設(shè)施優(yōu)化以確保效率。它適用于大規(guī)模訓(xùn)練,提供實際的性能改進(jìn)和優(yōu)越的可擴展性。

字節(jié)跳動的機器人通過語言和視頻學(xué)習(xí)

https://byte-dexter.github.io/gr-dexter/

GR-Dexter是一個全??蚣埽糜谡Z言引導(dǎo)的操作,使用具有高自由度靈巧手的雙臂機器人。它結(jié)合了新穎的硬件、用于收集示范的雙臂遙操作,以及一種混合訓(xùn)練策略,提高了在已知和未知任務(wù)上的現(xiàn)實世界魯棒性。

DeepCode:開放代理編碼

https://github.com/HKUDS/DeepCode

DeepCode是一個開源的多代理系統(tǒng),將研究論文和自然語言描述轉(zhuǎn)化為代碼,涵蓋三個領(lǐng)域:算法實現(xiàn)、前端開發(fā)和服務(wù)器端生成。該框架使用模型上下文協(xié)議(MCP)來協(xié)調(diào)專門處理文檔解析、代碼規(guī)劃和實現(xiàn)的代理,并內(nèi)置測試和文檔生成功能。


速讀


Webflow的CPO如何構(gòu)建AI首席助理

https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-webflows

Webflow的CPO Rachel Wolan開發(fā)了一個AI首席助理來管理日程安排、會議并提供坦率的反饋。構(gòu)建自己的AI軟件幫助高管了解AI的潛力,通過"構(gòu)建日"和自上而下的命令促進(jìn)組織范圍內(nèi)的采用。她使用markdown文件進(jìn)行知識管理和日歷委托,她的AI優(yōu)化時間管理和工作流程效率。

2026年AI的發(fā)展方向

https://foundationcapital.com/where-ai-is-headed-in-2026/

2026年的AI將看到初創(chuàng)公司推進(jìn)企業(yè)AI的采用,專門的本地解決方案解決了隱私和效率需求。該領(lǐng)域也將轉(zhuǎn)向捕捉?jīng)Q策過程作為數(shù)據(jù)壁壘,隨著代理獲得運營角色,AI安全將成為關(guān)鍵。SaaS現(xiàn)有企業(yè)將加強對數(shù)據(jù)訪問的控制,而AI在電子商務(wù)中的日益增長的影響可能會顛覆傳統(tǒng)發(fā)現(xiàn)方式,并導(dǎo)致新的變現(xiàn)模式,特別是影響Google等平臺。

近期出現(xiàn)了許多由AI工具自主解決的埃德加問題

https://mathstodon.xyz/@tao/115788262274999408

AI工具現(xiàn)在已經(jīng)足夠強大,能夠解決埃德加問題數(shù)據(jù)庫中列出的最低掛果問題,但這個類別包含最有可能已經(jīng)在文獻(xiàn)中被解決的問題。

軌道vs火車:真正的AI熱潮尚未開始

https://shawnharris.com/tracks-vs-trains-why-the-real-artificial-intelligence-boom-hasnt-started-yet-insights-for-2026

基礎(chǔ)設(shè)施中的"AI泡沫"是為未來融資的必要方法。

超越復(fù)制品:第一原理代理的案例

https://www.chasewhughes.com/writing/beyond-the-replica-the-case-for-first-principles-agents

真正的代理效率需要放棄人類工作流程。

新開源地圖顯示美國AI數(shù)據(jù)中心建設(shè)規(guī)模

https://interestingengineering.com/ai-robotics/mapping-hidden-us-datacenters

一個新的開源地圖詳細(xì)記錄了美國AI數(shù)據(jù)中心的快速發(fā)展。

Z.AI即將上市

https://links.tldrnewsletter.com/GjQmYa

Z.ai公司,其GLM系列大語言模型的背后,宣布它將成為首家AI原生LLM公司上市。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容