Google File System Big Table Map Reduce HDFS HBase Hadoop Hadoop 基于硬盤,可以處理海量數(shù)據(jù); Spark 基...
知網(wǎng) 選擇 English,論文會多很多,而且下載的事 PDF 版本 搜索 site:gov.cn 就只會顯示 ZF 網(wǎng)站的結(jié)果Github 里的搜索,一定可以學一下,比如 ...
過去十年引起廣泛關(guān)注的數(shù)據(jù)模型是 MapReduce,但 MapReduce 不是一種具有普適性的架構(gòu)。相反,MapReduce 市場已經(jīng)轉(zhuǎn)變?yōu)?HDFS 市場,并且似乎準備...
摘要 摘要注重邏輯和高度概括性,我的基本寫作思路是: 社會背景 -> 技術(shù)背景 -> 動機 -> 主要工作高度概括,并點名解決了什么問題 -> 收束,其中收束我認為可以是實驗...
動機 小論文要翻譯之后放在大論文,Latex 里面有很多內(nèi)嵌公式、圖引用等等。最后采用了 CopyTranslator,這種方式,大大減少了工作成本。CopyTranslat...
數(shù)據(jù)模型 數(shù)據(jù)模型是對現(xiàn)實世界數(shù)據(jù)特征的抽象,就是字面意思,數(shù)據(jù)建模。 實體:一個人 屬性:實體的某一特征 碼:key,也可以說是鍵 數(shù)據(jù)操作 查詢 更新(插入、刪除、修改)...
抽象語法樹 一個 SQL 提交到數(shù)據(jù)庫,首先經(jīng)過連接器將 SQL 語句交給語法分析器,生成一個抽象語法樹(AST)。 邏輯計劃 AST 經(jīng)過語義分析與優(yōu)化器,進行語義優(yōu)化,使...
忽略那些錯誤日志 CTex 很多錯誤我們忽略掉,不要強迫癥,要想到我們最初只是想要免于排版而已,不用去糾結(jié)很多細節(jié)。 中文亂碼恢復 http://www.mytju.com/...
語雀寫著寫著就會覺得排版很丑,所以總是在換編輯器。后來發(fā)現(xiàn) Markdown 復制進去自動轉(zhuǎn)換之后還挺好看的,然后實驗了幾次,為了防止自己在寫作的時候糾結(jié)各種工具,對自己約束...
數(shù)據(jù)庫的發(fā)展主要經(jīng)歷了OLTP 關(guān)系型數(shù)據(jù)庫、OLAP 數(shù)據(jù)倉庫、大數(shù)據(jù)、“云原生 + 分布式”一體化四個階段,如圖所示: 1)1960 年代 關(guān)系數(shù)據(jù)庫之父 E.F.Cod...
機器學習技術(shù)給數(shù)據(jù)庫發(fā)展帶來新的機遇。但是,由于機器學習算法在訓練數(shù)據(jù)、模型設(shè)計方面有昂貴代價,而且數(shù)據(jù)庫技術(shù)本身存在諸多問題,二者在結(jié)合過程中還面臨著很多挑戰(zhàn)。 SageD...
評測基準是衡量數(shù)據(jù)庫系統(tǒng)性能的一把尺子,引導著數(shù)據(jù)庫系統(tǒng)的發(fā)展方向。 針對 AP 數(shù)據(jù)庫,設(shè)計了 Touchstone 針對 TP 數(shù)據(jù)庫,設(shè)計了 Lauca 大規(guī)模事務負載...
[1] Kraska, Tim, Alex Beutel, Ed H. Chi, Jeffrey Dean, and Neoklis Polyzotis. "The case...
Dabble Kraska 等人提出使用機器學習模型代替?zhèn)鹘y(tǒng)的 B 樹索引,并在真實數(shù)據(jù)集上取得了不錯的效果,但其提出的模型假設(shè)工作負載是靜態(tài)的、只讀的,對于索引更新問題沒有...
數(shù)據(jù)庫 和 數(shù)倉 的本質(zhì)區(qū)別? 數(shù)據(jù)庫 Database (Oracle, Mysql, PostgreSQL)主要用于事務處理,數(shù)據(jù)倉庫 Datawarehouse (Am...