
頭條
Sakana 推出 AI 科學(xué)家
https://sakana.ai/ai-scientist/
日本 AI 公司 Sakana 發(fā)布了一套系統(tǒng),該系統(tǒng)可以自主進(jìn)行研究,提出假設(shè)、進(jìn)行實(shí)驗(yàn)、編寫(xiě)代碼,并將結(jié)果總結(jié)成有理有據(jù)的論文。該公司提供了該系統(tǒng)撰寫(xiě)的論文示例以及系統(tǒng)的開(kāi)源版本。
隨著 Alexa 10 歲生日的臨近,亞馬遜開(kāi)始著眼于生成式 AI
https://techcrunch.com/2024/08/10/as-alexa-turns-10-amazon-looks-to-generative-ai/
亞馬遜的 Alexa 部門(mén)在 2022 年虧損 100 億美元并裁員,盡管家庭普及率很高,但其虧本銷(xiāo)售策略仍不可持續(xù)。隨著人們對(duì) Siri 和 Google Assistant 等智能助手的熱情也逐漸消退,亞馬遜正依靠生成式 AI 來(lái)重振 Alexa 的功能和用戶參與度。該公司的重點(diǎn)是增強(qiáng)對(duì)話互動(dòng)并克服“智能計(jì)時(shí)器”的限制。
Replika CEO 表示,AI 的未來(lái)可能意味著與聊天機(jī)器人建立友誼和婚姻
Replika 首席執(zhí)行官 Eugenia Kuyda 最近討論了她對(duì)人類(lèi)關(guān)系中人工智能伴侶的愿景,強(qiáng)調(diào)了該應(yīng)用程序在通過(guò)頭像提供友誼、治療或浪漫方面的作用。隨著LLM的發(fā)展,Replika 旨在補(bǔ)充而不是取代人類(lèi)互動(dòng),創(chuàng)造一種新的關(guān)系類(lèi)別。盡管存在爭(zhēng)議,例如對(duì)成人內(nèi)容的臨時(shí)限制,但該應(yīng)用程序的目的仍然是改善用戶的情緒健康。 Replika 擁有數(shù)百萬(wàn)用戶群和 50-60 人的團(tuán)隊(duì),正計(jì)劃進(jìn)行重大重塑,以增強(qiáng)對(duì)話的互動(dòng)性和真實(shí)感。
研究
SWE-bench 已驗(yàn)證
https://openai.com/index/introducing-swe-bench-verified/
OpenAI 推出了 SWE-bench 的一個(gè)子集,它更簡(jiǎn)單,更符合當(dāng)今人類(lèi)和人工智能可以解決的問(wèn)題。在運(yùn)行整個(gè)原始基準(zhǔn)之前,它是一個(gè)很好的驗(yàn)證和努力基準(zhǔn)。
小而強(qiáng)大:介紹 answerai-colbert-small
https://www.answer.ai/posts/2024-08-13-small-but-mighty-colbert.html
ColBERT 是一種非常強(qiáng)大的檢索模型。這個(gè)新模型只有 3300 萬(wàn)個(gè)參數(shù),但在多個(gè)基準(zhǔn)上取得了驚人的性能。這篇文章探討了如何訓(xùn)練類(lèi)似的模型以及哪些技巧可以帶來(lái)強(qiáng)大的性能。
用于語(yǔ)義分割的對(duì)象掩碼發(fā)現(xiàn)
https://arxiv.org/abs/2408.04961v1
“惰性視覺(jué)基礎(chǔ)”是一種用于開(kāi)放詞匯語(yǔ)義分割的兩階段方法,首先在不依賴(lài)文本的情況下發(fā)現(xiàn)對(duì)象掩碼,然后分配文本標(biāo)簽。
工程
AI 工具包
https://github.com/ostris/ai-toolkit
一組用于 AI 的腳本和筆記本。它主要關(guān)注圖像合成和調(diào)整。
Flash 線性注意
https://github.com/sustcsonglin/flash-linear-attention
一組用于最先進(jìn)的線性注意模型和變體的高性能 Triton 內(nèi)核。
使用 UniBench 進(jìn)行視覺(jué)語(yǔ)言模型評(píng)估
https://github.com/facebookresearch/unibench
UniBench 是一個(gè)統(tǒng)一的框架,通過(guò)將 50 多個(gè)基準(zhǔn)組合成一個(gè)實(shí)現(xiàn)來(lái)簡(jiǎn)化視覺(jué)語(yǔ)言模型 (VLM) 的評(píng)估。它有助于評(píng)估 VLM 在從對(duì)象識(shí)別到空間感知等各種功能方面的進(jìn)展。
雜七雜八
Agent Q
MMultion 已經(jīng)訓(xùn)練了一個(gè)代理使用自我游戲來(lái)執(zhí)行網(wǎng)絡(luò)查詢(xún)。在訓(xùn)練過(guò)程中,它在各種基于網(wǎng)絡(luò)的任務(wù)(如訂餐)上的效率從 18% 提高到了 81%。它使用 MCTS 和 DPO 來(lái)改進(jìn)。斯坦福大學(xué)的研究人員也參與了這項(xiàng)工作,網(wǎng)站上有一篇論文。它似乎是基于 Salesforce Research 的 xLAM 函數(shù)調(diào)用模型構(gòu)建的。
使用點(diǎn)擊注意進(jìn)行交互式細(xì)分
https://github.com/hahamyt/clickattention
一種新的點(diǎn)擊注意算法改進(jìn)了交互式細(xì)分。這種方法擴(kuò)大了積極點(diǎn)擊的影響,并減少了點(diǎn)擊之間的干擾。
人工智能是否值得在董事會(huì)上占有一席之地?
https://www.forbes.com/sites/hessiejones/2024/08/01/does-ai-deserve-a-seat-at-the-boardroom-table/
人工智能融入公司治理,促使領(lǐng)導(dǎo)者制定強(qiáng)大的人工智能戰(zhàn)略,以進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的決策。雖然人工智能提供了寶貴的見(jiàn)解,尤其是對(duì)于LLM來(lái)說(shuō),但挑戰(zhàn)仍然存在,包括技能差距和道德問(wèn)題。人工智能和人類(lèi)判斷之間的適當(dāng)平衡對(duì)于未來(lái)的高管決策過(guò)程至關(guān)重要。
Gemini 1.5 Flash 價(jià)格下降,調(diào)整推出已完成
https://developers.googleblog.com/en/gemini-15-flash-updates-google-ai-studio-gemini-api/
Gemini 1.5 Flash 價(jià)格下降,輸入Token 成本下降 78%,輸出 Token 成本下降 71%,其 API 現(xiàn)在支持 100 多種語(yǔ)言。
即使周?chē)蠖鄶?shù)汽車(chē)都是人駕駛的,自動(dòng)駕駛汽車(chē)也有望改善交通狀況
https://www.inverse.com/tech/self-driving-cars-traffic-problem
人工智能和強(qiáng)化學(xué)習(xí)算法可以改善混合交通流——模擬表明,5% 的自動(dòng)駕駛車(chē)輛的存在可以消除交通擁堵。
預(yù)測(cè)市場(chǎng) Polymarket 與 Perplexity 合作展示新聞?wù)?/a>
Polymarket 已與人工智能搜索引擎 Perplexity 合作,將與事件相關(guān)的新聞?wù)蛿?shù)據(jù)可視化集成到其預(yù)測(cè)市場(chǎng)中。