2024-08-15 簡(jiǎn)訊 : Sakana 推出 AI 科學(xué)家


頭條


Sakana 推出 AI 科學(xué)家

https://sakana.ai/ai-scientist/

日本 AI 公司 Sakana 發(fā)布了一套系統(tǒng),該系統(tǒng)可以自主進(jìn)行研究,提出假設(shè)、進(jìn)行實(shí)驗(yàn)、編寫(xiě)代碼,并將結(jié)果總結(jié)成有理有據(jù)的論文。該公司提供了該系統(tǒng)撰寫(xiě)的論文示例以及系統(tǒng)的開(kāi)源版本。

隨著 Alexa 10 歲生日的臨近,亞馬遜開(kāi)始著眼于生成式 AI

https://techcrunch.com/2024/08/10/as-alexa-turns-10-amazon-looks-to-generative-ai/

亞馬遜的 Alexa 部門(mén)在 2022 年虧損 100 億美元并裁員,盡管家庭普及率很高,但其虧本銷(xiāo)售策略仍不可持續(xù)。隨著人們對(duì) Siri 和 Google Assistant 等智能助手的熱情也逐漸消退,亞馬遜正依靠生成式 AI 來(lái)重振 Alexa 的功能和用戶參與度。該公司的重點(diǎn)是增強(qiáng)對(duì)話互動(dòng)并克服“智能計(jì)時(shí)器”的限制。

Replika CEO 表示,AI 的未來(lái)可能意味著與聊天機(jī)器人建立友誼和婚姻

https://www.theverge.com/24216748/replika-ceo-eugenia-kuyda-ai-companion-chatbots-dating-friendship-decoder-podcast-interview

Replika 首席執(zhí)行官 Eugenia Kuyda 最近討論了她對(duì)人類(lèi)關(guān)系中人工智能伴侶的愿景,強(qiáng)調(diào)了該應(yīng)用程序在通過(guò)頭像提供友誼、治療或浪漫方面的作用。隨著LLM的發(fā)展,Replika 旨在補(bǔ)充而不是取代人類(lèi)互動(dòng),創(chuàng)造一種新的關(guān)系類(lèi)別。盡管存在爭(zhēng)議,例如對(duì)成人內(nèi)容的臨時(shí)限制,但該應(yīng)用程序的目的仍然是改善用戶的情緒健康。 Replika 擁有數(shù)百萬(wàn)用戶群和 50-60 人的團(tuán)隊(duì),正計(jì)劃進(jìn)行重大重塑,以增強(qiáng)對(duì)話的互動(dòng)性和真實(shí)感。


研究


SWE-bench 已驗(yàn)證

https://openai.com/index/introducing-swe-bench-verified/

OpenAI 推出了 SWE-bench 的一個(gè)子集,它更簡(jiǎn)單,更符合當(dāng)今人類(lèi)和人工智能可以解決的問(wèn)題。在運(yùn)行整個(gè)原始基準(zhǔn)之前,它是一個(gè)很好的驗(yàn)證和努力基準(zhǔn)。

小而強(qiáng)大:介紹 answerai-colbert-small

https://www.answer.ai/posts/2024-08-13-small-but-mighty-colbert.html

ColBERT 是一種非常強(qiáng)大的檢索模型。這個(gè)新模型只有 3300 萬(wàn)個(gè)參數(shù),但在多個(gè)基準(zhǔn)上取得了驚人的性能。這篇文章探討了如何訓(xùn)練類(lèi)似的模型以及哪些技巧可以帶來(lái)強(qiáng)大的性能。

用于語(yǔ)義分割的對(duì)象掩碼發(fā)現(xiàn)

https://arxiv.org/abs/2408.04961v1
“惰性視覺(jué)基礎(chǔ)”是一種用于開(kāi)放詞匯語(yǔ)義分割的兩階段方法,首先在不依賴(lài)文本的情況下發(fā)現(xiàn)對(duì)象掩碼,然后分配文本標(biāo)簽。


工程


AI 工具包

https://github.com/ostris/ai-toolkit

一組用于 AI 的腳本和筆記本。它主要關(guān)注圖像合成和調(diào)整。

Flash 線性注意

https://github.com/sustcsonglin/flash-linear-attention

一組用于最先進(jìn)的線性注意模型和變體的高性能 Triton 內(nèi)核。

使用 UniBench 進(jìn)行視覺(jué)語(yǔ)言模型評(píng)估

https://github.com/facebookresearch/unibench

UniBench 是一個(gè)統(tǒng)一的框架,通過(guò)將 50 多個(gè)基準(zhǔn)組合成一個(gè)實(shí)現(xiàn)來(lái)簡(jiǎn)化視覺(jué)語(yǔ)言模型 (VLM) 的評(píng)估。它有助于評(píng)估 VLM 在從對(duì)象識(shí)別到空間感知等各種功能方面的進(jìn)展。


雜七雜八


Agent Q

https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

MMultion 已經(jīng)訓(xùn)練了一個(gè)代理使用自我游戲來(lái)執(zhí)行網(wǎng)絡(luò)查詢(xún)。在訓(xùn)練過(guò)程中,它在各種基于網(wǎng)絡(luò)的任務(wù)(如訂餐)上的效率從 18% 提高到了 81%。它使用 MCTS 和 DPO 來(lái)改進(jìn)。斯坦福大學(xué)的研究人員也參與了這項(xiàng)工作,網(wǎng)站上有一篇論文。它似乎是基于 Salesforce Research 的 xLAM 函數(shù)調(diào)用模型構(gòu)建的。

使用點(diǎn)擊注意進(jìn)行交互式細(xì)分

https://github.com/hahamyt/clickattention
一種新的點(diǎn)擊注意算法改進(jìn)了交互式細(xì)分。這種方法擴(kuò)大了積極點(diǎn)擊的影響,并減少了點(diǎn)擊之間的干擾。

人工智能是否值得在董事會(huì)上占有一席之地?

https://www.forbes.com/sites/hessiejones/2024/08/01/does-ai-deserve-a-seat-at-the-boardroom-table/

人工智能融入公司治理,促使領(lǐng)導(dǎo)者制定強(qiáng)大的人工智能戰(zhàn)略,以進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的決策。雖然人工智能提供了寶貴的見(jiàn)解,尤其是對(duì)于LLM來(lái)說(shuō),但挑戰(zhàn)仍然存在,包括技能差距和道德問(wèn)題。人工智能和人類(lèi)判斷之間的適當(dāng)平衡對(duì)于未來(lái)的高管決策過(guò)程至關(guān)重要。

Gemini 1.5 Flash 價(jià)格下降,調(diào)整推出已完成

https://developers.googleblog.com/en/gemini-15-flash-updates-google-ai-studio-gemini-api/

Gemini 1.5 Flash 價(jià)格下降,輸入Token 成本下降 78%,輸出 Token 成本下降 71%,其 API 現(xiàn)在支持 100 多種語(yǔ)言。

即使周?chē)蠖鄶?shù)汽車(chē)都是人駕駛的,自動(dòng)駕駛汽車(chē)也有望改善交通狀況

https://www.inverse.com/tech/self-driving-cars-traffic-problem

人工智能和強(qiáng)化學(xué)習(xí)算法可以改善混合交通流——模擬表明,5% 的自動(dòng)駕駛車(chē)輛的存在可以消除交通擁堵。

預(yù)測(cè)市場(chǎng) Polymarket 與 Perplexity 合作展示新聞?wù)?/a>

https://techcrunch.com/2024/08/12/prediction-market-polymarket-partners-with-perplexity-to-show-news-summaries/

Polymarket 已與人工智能搜索引擎 Perplexity 合作,將與事件相關(guān)的新聞?wù)蛿?shù)據(jù)可視化集成到其預(yù)測(cè)市場(chǎng)中。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容