2025-12-22 簡訊 : Google推出Gemini 3 Flash


頭條


Google推出Gemini 3 Flash

https://blog.google/products/gemini/gemini-3-flash/

Google推出了Gemini 3 Flash,這是一個快速、輕量級的模型,旨在以更低的延遲提供前沿級別的智能。它被設(shè)計用來幫助用戶快速學(xué)習(xí)、計劃和構(gòu)建各種日常任務(wù)和應(yīng)用。

Google與Meta合作削弱NVIDIA的軟件優(yōu)勢

https://www.reuters.com/business/google-works-erode-nvidias-software-advantage-with-metas-help-2025-12-17

Google和Meta正在合作一個新項目,使Google的張量處理單元更好地運行PyTorch。此舉旨在削弱Nvidia在AI計算市場長期以來的主導(dǎo)地位。TorchTPU將消除阻礙TPU芯片采用的關(guān)鍵障礙。它將使現(xiàn)有的基于PyTorch軟件構(gòu)建的基礎(chǔ)架構(gòu)完全兼容TPU。Google正在考慮開源部分軟件以加快采用速度。

Grok語音Agent API

https://links.tldrnewsletter.com/1mTsaU

xAI已向所有開發(fā)者開放了在特斯拉車輛中使用的Grok語音堆棧。該API在Big Bench Audio中排名第一,首次音頻時間低于1秒,每分鐘成本僅為0.05美元(是OpenAI實時API的一半)。


前沿


Oracle股價下跌43%,盡管報告了5230億美元的剩余履約義務(wù)

https://www.wsj.com/finance/stocks/the-squishy-number-behind-the-rise-and-fall-of-oracles-stock-45461595

Oracle的股價從9月份的高點下跌了43%,盡管報告了5230億美元的“剩余履約義務(wù)”。其中約3000億美元來自與OpenAI的五年協(xié)議,但分析師對OpenAI(年收入僅約200億美元)能否支付感到懷疑。Nvidia擱置的1000億美元OpenAI投資(9月宣布但尚未簽署)加劇了人們對AI基礎(chǔ)設(shè)施中循環(huán)交易的焦慮。

AGI確實可能發(fā)生—從計算角度看

https://danfu.org/notes/agi/

當(dāng)前模型嚴(yán)重低估硬件性能:DeepSeek-V3和Llama-4在訓(xùn)練期間只實現(xiàn)了約20%的FLOP利用率,推斷運行時的利用率也處于個位數(shù),因為自回歸模型受制于從內(nèi)存加載權(quán)重而不是計算。我們看到的模型也是滯后的指標(biāo),它們在上一代硬件上訓(xùn)練,這些硬件未針對現(xiàn)代集群的巨大規(guī)模和最新訓(xùn)練方法進(jìn)行優(yōu)化。

Agent攻擊:AI如何摧毀并重建市場護(hù)城河

https://www.caseyaccidental.com/p/when-agents-attack-how-ai-collapses

AI agents,如OpenAI發(fā)布的那些,通過接管發(fā)現(xiàn)、交易和供應(yīng)工作流程來威脅市場護(hù)城河,從而摧毀傳統(tǒng)的營銷漏斗。市場必須通過優(yōu)化品牌體驗、個性化互動和整合供應(yīng)來適應(yīng),以維持價值。創(chuàng)始人應(yīng)專注于高頻市場,鞏固客戶關(guān)系,并探索新的變現(xiàn)策略,如訂閱或數(shù)據(jù)許可,以保持競爭力。


研究


什么是Claude Code的計劃模式?

https://lucumr.pocoo.org/2025/12/17/what-is-plan-mode/

計劃模式是Claude Code中的一個功能,它會在用戶批準(zhǔn)計劃前暫停執(zhí)行。在Claude Code中,計劃是一個由Claude在計劃模式下寫入到Claude計劃文件夾的markdown文件。用戶可以在Claude執(zhí)行任務(wù)之前查看和編輯計劃。這個工具增加了用戶界面的復(fù)雜性,減少了魔法般的體驗。它復(fù)制了自然語言已經(jīng)能做到的事情,使用戶體驗稍微不那么自然。

使用Opal在Gemini應(yīng)用中構(gòu)建交互式迷你應(yīng)用

https://blog.google/technology/google-labs/mini-apps-opal-gemini-app-experiment/

Opal是一個構(gòu)建AI驅(qū)動迷你應(yīng)用的工具?,F(xiàn)在可以直接在Gemini網(wǎng)頁應(yīng)用中使用。用戶可以用它創(chuàng)建實驗性的Gems來解鎖更定制化的Gemini體驗。這個工具可以在Gems管理器中找到。

Chatterbox(GitHub倉庫)

https://github.com/resemble-ai/chatterbox

Chatterbox是一個開源的最先進(jìn)的文本轉(zhuǎn)語音(TTS)模型,支持多語言、情感控制和零樣本語音克隆。


速讀


Jassy任命27歲亞馬遜資深工程師領(lǐng)導(dǎo)AGI組織

https://www.theregister.com/2025/12/17/jassy_taps_peter_desantis_to_run_agi/

Peter DeSantis,AWS實用計算副總裁,將他的兩個團(tuán)隊從AWS轉(zhuǎn)移到一個名為“AGI”的單位。該單位將直接向Andy Jassy匯報,即亞馬遜的GenAI首席產(chǎn)品市場主管和CEO。AI和與AI相關(guān)的計算現(xiàn)在已成為整個亞馬遜的事情,而不僅僅是AWS的事情。該單位正在構(gòu)建非常重要的東西,因此亞馬遜將最資深的AWS領(lǐng)導(dǎo)者之一調(diào)任負(fù)責(zé)所有這些工作。

中國“曼哈頓計劃”挑戰(zhàn)西方AI芯片

https://www.reuters.com/world/china/how-china-built-its-manhattan-project-rival-west-ai-chips-2025-12-17

中國科學(xué)家已經(jīng)建造了一臺工作的EUV光刻機原型,這是價值2.5億美元的工具,只有ASML知道如何制造,而且美國自2018年以來一直阻止將其出售給中國。一支前ASML工程師團(tuán)隊在高度保密的深圳實驗室中逆向工程了這些機器,招募人員獲得假身份和高達(dá)70萬美元的獎金。該原型尚未生產(chǎn)出工作芯片,但有消息人士預(yù)計將在2028-2030年實現(xiàn)。

你知道緩存提示或緩存token到底是什么嗎?ngrok指南

https://ngrok.com/blog/prompt-caching

緩存提示便宜10倍,速度快85%。真正被緩存的不是響應(yīng),而是注意力機制中的K和V矩陣。詳見ngrok的精確數(shù)學(xué)公式。

隨著免費計劃,OpenAI、Google在印度爭奪用戶和訓(xùn)練數(shù)據(jù)

https://www.reuters.com/world/india/with-freebies-openai-google-vie-indian-users-training-data-2025-12-17

ChatGPT在印度的日活躍用戶同比增長600%至7300萬,是其美國基地的兩倍多,因為OpenAI將其Go計劃免費提供了一年。

Opera全球推出Neon瀏覽器并提供付費早期訪問

https://www.testingcatalog.com/icymi-opera-launches-neon-browser-globally/

Opera在全球推出了其Neon瀏覽器,并提供每月19.90美元的付費早期訪問,目標(biāo)是AI高級用戶。

OpenAI正與亞馬遜就可能超過100億美元的投資進(jìn)行談判

https://www.cnbc.com/2025/12/16/openai-in-talks-with-amazon-about-investment-could-top-10-billion.html

在另一個循環(huán)交易中,OpenAI正尋求來自亞馬遜的100億美元投資,同時達(dá)成使用AWS Trainium芯片的協(xié)議。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容