
頭條
Google推出Gemini 3 Flash
https://blog.google/products/gemini/gemini-3-flash/
Google推出了Gemini 3 Flash,這是一個快速、輕量級的模型,旨在以更低的延遲提供前沿級別的智能。它被設(shè)計用來幫助用戶快速學(xué)習(xí)、計劃和構(gòu)建各種日常任務(wù)和應(yīng)用。
Google與Meta合作削弱NVIDIA的軟件優(yōu)勢
Google和Meta正在合作一個新項目,使Google的張量處理單元更好地運行PyTorch。此舉旨在削弱Nvidia在AI計算市場長期以來的主導(dǎo)地位。TorchTPU將消除阻礙TPU芯片采用的關(guān)鍵障礙。它將使現(xiàn)有的基于PyTorch軟件構(gòu)建的基礎(chǔ)架構(gòu)完全兼容TPU。Google正在考慮開源部分軟件以加快采用速度。
Grok語音Agent API
https://links.tldrnewsletter.com/1mTsaU
xAI已向所有開發(fā)者開放了在特斯拉車輛中使用的Grok語音堆棧。該API在Big Bench Audio中排名第一,首次音頻時間低于1秒,每分鐘成本僅為0.05美元(是OpenAI實時API的一半)。
前沿
Oracle股價下跌43%,盡管報告了5230億美元的剩余履約義務(wù)
Oracle的股價從9月份的高點下跌了43%,盡管報告了5230億美元的“剩余履約義務(wù)”。其中約3000億美元來自與OpenAI的五年協(xié)議,但分析師對OpenAI(年收入僅約200億美元)能否支付感到懷疑。Nvidia擱置的1000億美元OpenAI投資(9月宣布但尚未簽署)加劇了人們對AI基礎(chǔ)設(shè)施中循環(huán)交易的焦慮。
AGI確實可能發(fā)生—從計算角度看
當(dāng)前模型嚴(yán)重低估硬件性能:DeepSeek-V3和Llama-4在訓(xùn)練期間只實現(xiàn)了約20%的FLOP利用率,推斷運行時的利用率也處于個位數(shù),因為自回歸模型受制于從內(nèi)存加載權(quán)重而不是計算。我們看到的模型也是滯后的指標(biāo),它們在上一代硬件上訓(xùn)練,這些硬件未針對現(xiàn)代集群的巨大規(guī)模和最新訓(xùn)練方法進(jìn)行優(yōu)化。
Agent攻擊:AI如何摧毀并重建市場護(hù)城河
https://www.caseyaccidental.com/p/when-agents-attack-how-ai-collapses
AI agents,如OpenAI發(fā)布的那些,通過接管發(fā)現(xiàn)、交易和供應(yīng)工作流程來威脅市場護(hù)城河,從而摧毀傳統(tǒng)的營銷漏斗。市場必須通過優(yōu)化品牌體驗、個性化互動和整合供應(yīng)來適應(yīng),以維持價值。創(chuàng)始人應(yīng)專注于高頻市場,鞏固客戶關(guān)系,并探索新的變現(xiàn)策略,如訂閱或數(shù)據(jù)許可,以保持競爭力。
研究
什么是Claude Code的計劃模式?
https://lucumr.pocoo.org/2025/12/17/what-is-plan-mode/
計劃模式是Claude Code中的一個功能,它會在用戶批準(zhǔn)計劃前暫停執(zhí)行。在Claude Code中,計劃是一個由Claude在計劃模式下寫入到Claude計劃文件夾的markdown文件。用戶可以在Claude執(zhí)行任務(wù)之前查看和編輯計劃。這個工具增加了用戶界面的復(fù)雜性,減少了魔法般的體驗。它復(fù)制了自然語言已經(jīng)能做到的事情,使用戶體驗稍微不那么自然。
使用Opal在Gemini應(yīng)用中構(gòu)建交互式迷你應(yīng)用
https://blog.google/technology/google-labs/mini-apps-opal-gemini-app-experiment/
Opal是一個構(gòu)建AI驅(qū)動迷你應(yīng)用的工具?,F(xiàn)在可以直接在Gemini網(wǎng)頁應(yīng)用中使用。用戶可以用它創(chuàng)建實驗性的Gems來解鎖更定制化的Gemini體驗。這個工具可以在Gems管理器中找到。
Chatterbox(GitHub倉庫)
https://github.com/resemble-ai/chatterbox
Chatterbox是一個開源的最先進(jìn)的文本轉(zhuǎn)語音(TTS)模型,支持多語言、情感控制和零樣本語音克隆。
速讀
Jassy任命27歲亞馬遜資深工程師領(lǐng)導(dǎo)AGI組織
https://www.theregister.com/2025/12/17/jassy_taps_peter_desantis_to_run_agi/
Peter DeSantis,AWS實用計算副總裁,將他的兩個團(tuán)隊從AWS轉(zhuǎn)移到一個名為“AGI”的單位。該單位將直接向Andy Jassy匯報,即亞馬遜的GenAI首席產(chǎn)品市場主管和CEO。AI和與AI相關(guān)的計算現(xiàn)在已成為整個亞馬遜的事情,而不僅僅是AWS的事情。該單位正在構(gòu)建非常重要的東西,因此亞馬遜將最資深的AWS領(lǐng)導(dǎo)者之一調(diào)任負(fù)責(zé)所有這些工作。
中國“曼哈頓計劃”挑戰(zhàn)西方AI芯片
中國科學(xué)家已經(jīng)建造了一臺工作的EUV光刻機原型,這是價值2.5億美元的工具,只有ASML知道如何制造,而且美國自2018年以來一直阻止將其出售給中國。一支前ASML工程師團(tuán)隊在高度保密的深圳實驗室中逆向工程了這些機器,招募人員獲得假身份和高達(dá)70萬美元的獎金。該原型尚未生產(chǎn)出工作芯片,但有消息人士預(yù)計將在2028-2030年實現(xiàn)。
你知道緩存提示或緩存token到底是什么嗎?ngrok指南
https://ngrok.com/blog/prompt-caching
緩存提示便宜10倍,速度快85%。真正被緩存的不是響應(yīng),而是注意力機制中的K和V矩陣。詳見ngrok的精確數(shù)學(xué)公式。
隨著免費計劃,OpenAI、Google在印度爭奪用戶和訓(xùn)練數(shù)據(jù)
ChatGPT在印度的日活躍用戶同比增長600%至7300萬,是其美國基地的兩倍多,因為OpenAI將其Go計劃免費提供了一年。
Opera全球推出Neon瀏覽器并提供付費早期訪問
https://www.testingcatalog.com/icymi-opera-launches-neon-browser-globally/
Opera在全球推出了其Neon瀏覽器,并提供每月19.90美元的付費早期訪問,目標(biāo)是AI高級用戶。
OpenAI正與亞馬遜就可能超過100億美元的投資進(jìn)行談判
在另一個循環(huán)交易中,OpenAI正尋求來自亞馬遜的100億美元投資,同時達(dá)成使用AWS Trainium芯片的協(xié)議。