OSD-GCN

人臉聚類由于其在實踐中的廣泛應用而成為一項重要任務?;趫D的人臉聚類方法最近取得了長足的進步,并取得了最新的技術成果。學習區(qū)分節(jié)點特征是進一步提高基于圖形的面部聚類性能的關鍵。為此,大多數以前的方法都將重點放在新的虧損功能上,例如基于保證金的虧損或中心虧損。在本文中,我們提出子空間學習作為學習判別節(jié)點特征的新方法,該方法是通過新的正交子空間分解(OSD)模塊實現的。在基于圖的人臉聚類中,OSD導致了更具區(qū)分性的節(jié)點特征,可以更好地反映每對人臉之間的關系,從而提高了人臉聚類的準確性。大量的實驗表明,OSD可以以合理的幅度勝過最新的結果。

人臉聚類已經被研究了好幾年,因為它具有廣泛的應用,例如在線相冊(Zhu等人,2011),自動數據標記或數據集構建的清理(Nech&Kemelmacher-Shlizerman,2017; Guo等人。 (2016年; Zhan等人,2018年),以及人臉圖像或視頻管理Klontz&Jain(2013年)。已經提出了幾種傳統(tǒng)的人臉聚類算法并將其應用于提取的人為手工制作的或深層的人臉特征(Lloyd,1982; Shi&Malik,2000; Ester等,1996; Zhao等,2006; You等。 ,2016)。但是,這些算法通常依賴于不同的數據分布假設,這限制了它們的適用性。因此,近年來提出了一些基于圖的聚類方法(Wang et al。,2019; Yang et al。,2019; 2020; Zhang et al。,2020),這些方法沒有對數據分布進行任何假設。這些基于圖的方法在面部聚類基準上獲得了最新的最新結果。

學習判別性節(jié)點表示形式可以是進一步提高基于圖的聚類方法性能的一種方式。先前的大多數方法都提出了新的損失函數來學習判別特征,例如中心損失(Wen等人,2016)和AM-Softmax損失(Wang等人,2018b; a)。但是,這些損失函數在訓練期間直接用于神經網絡,而無需考慮過濾噪聲或學習特征的冗余信息。但是從特征中去除噪聲或冗余信息是獲得更具歧視性表示的好策略(Lin等人,2016; Chinta&Murty,2012; Shang等人,2019; Sun等人,2019),并且此過程稱為功能選擇。因此,我們提出了一種從特征選擇的角度學習判別特征的新方法。子空間學習是特征選擇的經典方法,可以有效消除冗余和噪聲。但是,以前用于特征選擇的子空間學習方法(Wang等,2015a; Shang等,2020; Wang等,2015b; Shang等,2019)不能與神經網絡或圖卷積網絡結合使用。 (GCN)和端到端訓練,因為這些方法無法通過基于梯度的算法進行優(yōu)化。因此,我們提出了一個正交子空間分解(OSD)模塊,該模塊可以與神經網絡和GCN結合使用以進行特征選擇和學習判別性節(jié)點特征。

考慮到基于圖的人臉聚類方法的優(yōu)勢,我們選擇將OSD利用到Wang等人提出的實例樞軸子圖(IPS)中。 (2019)。圍繞每個實例(數據透視)構建IPS,以描述本地上下文,每個節(jié)點都模擬一個數據透視鄰居。對于每個樞軸-鄰居對,如果鄰居節(jié)點和樞軸節(jié)點具有相同的標識,則應將它們鏈接在一起。因此,人臉聚類任務也可以看作是人臉局部圖上的預測問題,其中表示相同身份的人臉鏈接在一起。在本文中,“正”節(jié)點是指應鏈接到樞軸的鄰居節(jié)點,而“負”節(jié)點是指不應鏈接的鄰居節(jié)點。

圖1中的一個簡單示例解釋了OSD背后的主要思想:灰色和黃色點表示IPS中的輸入節(jié)點特征,其基本事實分別為正和負,并且它們位于輸入空間中。鏈接預測(LP)用于將輸入節(jié)點特征轉換為12歸一化節(jié)點特征并將其分類為兩類。 OSD的目的是學習可以分解為兩個正交子空間的新空間,并使12歸一化的節(jié)點特征(即綠點和紅點)分別位于兩個子空間中。在“兩個正交子空間”中,以一個子空間為基礎的任何基本矢量都與以另一子空間為基礎的任何基本矢量正交,并且同時,以每個子空間為基礎的基本矢量都彼此正交。其他。例如,我們假設新近學習的空間是歐幾里得空間R3,其中每個點都可以用(x,y,z)表示。直觀地,歐幾里得空間R3可以分解成兩個正交的子空間,即(x,y,0)和(0,0,z)。從OSD學習到的標準化的正負節(jié)點特征分別位于這兩個正交子空間中。通過這樣做,OSD實現了功能選擇過程。由于要求OSD將學習到的12歸一化節(jié)點特征的某些維度歸零,因此必須選擇冗余或噪聲以進行過濾,結果只能保留重要和有用的信息。當OSD執(zhí)行特征選擇時,由于損失函數(例如,具有softmax的交叉熵損失)僅在重要的維度上執(zhí)行,因此新學習的l2歸一化特征將更易于分類或緊密聚類。表示形式。此外,OSD中的正交性還引入了固定余量,以更好地區(qū)分兩種類型的節(jié)點,尤其是對于某些硬樣本。如圖1所示,學習到的12歸一化節(jié)點特征使一對節(jié)點的歐幾里得距離落入范圍[0,2],對于位于兩個子空間上的兩個節(jié)點,它們之間的距離應為,理論上約為2。

本文的主要貢獻概述如下:

? 我們提出正交子空間合成(OSD),據我們所知,它是將子空間學習和特征選擇與神經網絡相結合的第一種方法。

? 我們從理論上證明,與某些正則化項結合使用時,矩陣加法可以很好地近似于直接和。因此,我們提出了一種新的損失函數,稱為空間重建(SR)損失,該函數使OSD與圖卷積網絡(GCN)結合并以端到端的方式進行訓練。

? OSD不僅勝過設計用于學習區(qū)分特征的經典損失函數,例如中心損失(Wen等人,2016)和AM-Softmax損失(Wang等人,2018b; a),而且還超過了IJB-512,IJB-1024,IJB-1845(Whitelam等人,2017)和VoxCeleb2(Chung等人,2018)的最新結果。

2相關工作

人臉聚類。在過去的幾年中,提出了不同類型的傳統(tǒng)集群技術。由于它們對數據分布的嚴格假設,例如K均值(Lloyd,1982)和頻譜聚類(Shi&Malik,2000),其中一些并不十分適合于面部嵌入。幾種新的聚類方法試圖克服它們的缺點。朱等。 (2011年)設計了一種新的親和度度量標準,稱為秩序距離,它對噪聲和離群值更健壯。 Lin等。 (2017)提出了一種近似感知層次聚類(PAHC)方法,該方法采用線性SVM對本地正負實例進行分類。還提出了一些凝聚層次聚類(AHC)算法(例如(Zhu等人,2011; Lin等人,2017; 2018)),以解決復雜數據分布的聚類問題。詹等。 (2018)訓練了一個多層感知器(MLP)分類器,以聚集信息并發(fā)現健壯的鏈接,然后找到連接的組件以獲取最終的集群。為了學習低維嵌入和聚類分配,提出了編碼器-解碼器架構(例如(Dizaji等人,2017; Xie等人,2016; Yang等人,2017))。楊等。 (2016年)設計了一種循環(huán)范式,以聯合更新聚類和要素表示。 Shi等。 (2017)提出了一種ConPac算法,該算法通過使用循環(huán)置信度傳播進行優(yōu)化,以最大化鄰接矩陣的后驗概率。最近,Yang等。 (2019)提出了一種基于檢測-分割范式的自頂向下方法,適用于結構復雜的集群。 Wang等。 (2019)建立了IPS,并將GCN應用于預測樞軸面嵌入與其kNN鄰居之間的鏈接。楊等。 (2020)提出了一個由兩個部分組成的新的聚類框架。一個組件是估計頂點的置信度,而另一組件是估計邊緣連接性。張等。 (2020年)提出了一個由全球和本地GCN組成的兩階段GCN框架。前者對所有節(jié)點進行全局分類,而后者則對本地的低置信度節(jié)點進行分類。

用于特征選擇的子空間學習。有許多與子空間學習相關的作品,在這里,我們僅關注近年來為特征選擇而設計的作品。 Wang等。 (2015a)提出了一種基于矩陣分解的無監(jiān)督特征選擇子空間學習方法,該方法將子空間學習視為矩陣分解問題,并利用學習的特征選擇矩陣選擇重要特征。 Wang等。 (2015b)提出了一種無監(jiān)督方法,通過最小化投影誤差和冗余來獲得用于特征選擇的指標矩陣。周等。 (2016年)提出了一種全局和局部結構保留稀疏子空間學習(GLoSS)算法,該算法將幾何結構信息保留在數據中。蔡等。 (2010)通過將稀疏子空間學習與特征選擇相結合,設計了一種多集群特征選擇(MCFS)方法。 MCFS引入了頻譜分析技術,并測量了不同特征之間的相關性以進行特征選擇,從而使選定的特征可以最好地保留數據的簇結構。 Gu等。 (2011年)通過使用L2,1-范數來增強變換矩陣的行稀疏性,進一步改進了MCFS方法。 Shang等。 (2019)提出了一種用于特征選擇的局部判別稀疏子空間學習方法,旨在利用原始特征中包含的局部判別和幾何信息進行特征選擇,因為此類信息對于區(qū)分數據樣本很重要。 Shang等。 (2020)提出了一種新的算法,稱為子空間學習算法,用于通過自適應結構學習和秩近似(SLASR)進行無監(jiān)督特征選擇,該算法自適應地學習流形結構,以使保留的局部幾何結構更準確,對噪聲更魯棒。

3方法

OSD模塊的預備信息。 OSD模塊中的子空間分解由直接和實現(Kreyszig,1978)。形式上,向量空間Z是Z的兩個子空間X和Y的直接和,表示為Z = X⊕Y,如果每個z∈Z具有唯一的表示z = x + y,其中x∈X和y∈Y。我們稱Y為XinZ的代數補碼,反之亦然。直接和將兩個子空間的基礎結合起來,形成一個新的整個空間。在我們的方法中,我們假設OSD學習的l2標準化節(jié)點特征的空間是整個空間。我們的目標是學習兩個子空間,這兩個子空間的直接和是整個空間。這樣,我們還可以將兩個子空間視為從整個空間分解而來。然而,直接和不能以端到端的方式用神經網絡實現和訓練,這給學習兩個子空間帶來了困難。因此,我們提供以下定理(在附錄A中有證明),揭示了直接和與子空間矩陣加法之間的關系。 (為簡單起見,在本文中,我們將子空間的基本向量逐行組織為矩陣)。

定理1.給定V的兩個子空間V1和V2。如果V = V1 + V2,則V1∩V2= {?0}等于V是V1和V2的直接和。

上面的結果為我們的子空間分解提供了基礎,因為我們可以簡單地對兩個子空間矩陣執(zhí)行加法運算,通過引入正則化項來滿足該定理中的條件,從而近似它們的直接和,即,使兩個定理相交學習的子空間僅包含?0。實際上,如何設計正則化項來滿足此條件是一個懸而未決的問題。在這里,我們使一個子空間的基礎與另一子空間的基礎正交,因為來自兩個子空間的任何兩個向量的內積為零。通過添加將兩個子空間矩陣的乘積強制為零矩陣的正則項可以輕松實現此正交性。通過此正則項和矩陣加法,我們可以了解兩個分解子空間的基礎,并獲得整個空間的基礎。

當學習到的l2標準化節(jié)點特征在整個空間中表示時,它們中的每一個都可以唯一地分解為兩個子空間中的兩個特征向量,這直接由直接和的唯一性表示屬性決定:直接和,如果V是V1和V2的直接和,則可以通過v = v1 + v2將任何v∈V唯一分解為v1∈V1和v2∈V2。因此,特征到每個子空間的分解是唯一的,并且投影的特征彼此不相交。對于l2-歸一化的節(jié)點特征,在將其分解為位于這兩個子空間中的兩個特征向量方面,有很多選擇??紤]到OSD旨在實現特征選擇(這是將維數歸零的過程),我們可以設計一些正則化項,以使每個子空間基礎上的基本向量彼此線性獨立,并使正L2表示負子空間中的標準化節(jié)點特征為node0,反之亦然。這樣,OSD會強制過濾掉12維標準化的正負節(jié)點特征的某些維度,因此,它應該選擇重要信息以保留并歸零無用或多余的信息。例如,子空間中的十二個標準化節(jié)點特征的表示可以視為特征與子空間矩陣的乘積,它是基于特征向量的子空間基礎的線性組合。由于子空間的線性獨立特性,每個子空間的基礎僅包含零基向量和一組非零基向量。如果負節(jié)點特征所在的子空間中的歸一化正節(jié)點特征的表示為?0,則對應于非零基本向量的歸一化正節(jié)點特征的維數應等于零。1另外,如上所述,當兩種類型的l2標準化節(jié)點特征僅位于其自己的子空間類型中時,正交性在這兩種類型的l2標準化節(jié)點特征之間引入了固定的余量,從而導致對它們的區(qū)分性更高。

LP模塊。 LP模塊,表示為LP(GCN-M),是通過按照Wang等人的GCN-M堆疊四個圖卷積層(GCL)構造的GCN。 (2019),將GCL與均值聚合器結合使用。詳細地,第一個GCL在輸入節(jié)點上執(zhí)行特征X∈RN×din,而其他GCL從上一層接收已轉換的特征。將最后一個圖卷積層的輸出節(jié)點特征進行12歸一化,并形成一個矩陣Y∈RN×dout,將其饋送到分類(softmax)層進行鏈接預測。這里,N是節(jié)點數,而din和dout分別是輸入和輸出節(jié)點特征的維數。

OSD模塊。 OSD模塊(參見圖2)旨在學習兩個分解的正交子空間,這些子空間由兩個可學習的矩陣(表示為S1,S2∈Rdout×dout)實現。因此,OSD在培訓期間僅向整個框架引入了極少的額外計算開銷。我們將子空間S1和S2的每一行視為其基礎的基本向量。

通過直接和的定義,學習的l2標準化節(jié)點特征所在的原始整個空間Sori可以看作是兩個子空間S1和S2的直接和:

Sori = S1⊕S2。 (1)

要學習分解后的子空間,問題在于優(yōu)化:

Lrecon = E [(YS1⊕YS2-Y)2],(2)

其中E [·]取輸入矩陣或一批輸入矩陣的期望值或總平均值。這里,Y∈RN×dout是原始整個空間的表示,YS1∈RN×dout和YS2∈RN×dout分別是子空間S1和S2中的Y表示.2

為了實現直接和,我們嘗試將子空間矩陣加法近似為直接和,因為加法運算使梯度能夠從頂部向底部反向傳播。因此,基于定理1,我們提出以下正則化項并將其與加法運算相結合以實現直接和:

Lorth = E [(S1S2T)2] + E [(S1S1T)2] + E [(S2S2T)2]。 (3)

最小化等式的第一項。 (3)鼓勵兩個子空間彼此正交,并且這種正交性確保兩個子空間的交集只能包含零向量,這滿足定理1。將等式的第二項和第三項最小化。 (3)懲罰S1S1T和S2S2T的對角線元素和非對角線元素。懲罰非對角線元素可確保每個子空間的基本向量彼此線性獨立。懲罰對角元素會鼓勵OSD學習低階子空間矩陣,并且這樣做,兩個子空間中不會有太多非零基向量,從而避免了從Y中濾除過多信息。

而且,正如我們上面所討論的,通過引入以下正則化項,使另一個子空間上的學習節(jié)點特征的表示為?0:

Lproj-norm = || Y(+)S2 || 2 + || Y(-)S1 || 2。 (4)

在這里,在不失一般性的情況下,我們分別使用Y(+)和Y(-)分別表示正和負的l2標準化節(jié)點特征,并且還假設S1和S2是正和負節(jié)點特征的子空間, 分別。最小化(4)引導網絡學習僅分布在自己子空間中的特征,從而實現特征選擇。最后,根據第二節(jié)中的簡單示例。在圖1中,平凡的解I(即單位矩陣)是原始空間Sori的一個好的解,但不是最好的。我限制了兩個分解的子空間的搜索空間,因為它們的非對角元素的和應該為零。因此,我們建議對對角元素進行懲罰,以通過設計避免瑣碎的解決方案:

Ldiag = || Diag(Sori)|| 2,(5)

其中Diag(·)取輸入矩陣的對角元素。因此,在實際的實現中,我們可以通過將上述正則化項組合在一起,直接將兩個子空間相加,以近似得出它們的直接和,從而導致空間重構(SR)損失:

LSR = Lrecon + Lorth + Lproj-norm + Ldiag。 (6)

最后,整個框架的總損失為:

Ltotal =熵+ LSR。 (7)

在此,LEntropy指的是帶有softmax的交叉熵損失,用于對正負12個標準化節(jié)點特征進行分類。

在測試階段,不再需要兩個子空間矩陣,而僅使用LP(GCN-M),因此推理不會增加任何計算負擔。我們遵循Wang等。 (2019)通過遍歷所有實例來構造IPS。 LP(GCN-M)預測所涉及實例與其相關的樞軸節(jié)點之間鏈接的可能性。循環(huán)之后,我們相應地采用了Zhan等人的偽標簽傳播策略。 (2018)合并鏈接并形成集群。

優(yōu)化。共同訓練了OSD模塊和LP(GCN-M),并在算法1中總結了整個優(yōu)化過程。從現在開始,我們使用“ OSD-LP(GCN-M)”表示由LP組成的整個框架。 (GCN-M)和OSD模塊。

4.實驗

數據集。我們對以下數據集進行了廣泛的實驗。對于人臉聚類,我們使用CASIA-Webface(Yi等人,2014)作為我們的訓練集,該訓練集包含10,575個身份和約494,414張人臉圖像。 FaceScrub(Ng和Winkler,2014)是名人臉部數據集,總共包含106,863張臉部圖像。我們隨機選擇了517個身份,并刪除了重復項,以構建包含33607個面部圖像的子集。我們將此子集用作驗證集。具有聚類協(xié)議的IJB-B(Whitelam et al。,2017)被應用于我們的測試集。該協(xié)議有7個子任務,我們選擇了三個最大的子任務。特別是,這三個子任務分別包含來自512、1,024和1,845個身份的18,171、36,575和68,195個面部圖像,分別表示為IJB-B-512,IJB-B-1024和IJB-B-1845。對于多視圖測試,我們使用了VoxCeleb2(Chung等人,2018),該視頻具有145K的視頻,包含5,994個不同的身份。我們遵循(Wang等人,2019)中的多視圖測試的實驗設置進行公平比較,即通過選擇512和2048身份構造兩個測試集。其他數據用于訓練集。實施細節(jié)在附錄A中給出。

消融研究?,F在,我們報告關于FaceScrub的消融研究(Ng和Winkler,2014),以便全面了解OSD模塊的工作原理。

首先,我們探討了IPS的超參數如何影響OSD-LP(GCN-M)的性能,其中包括樞軸的最近鄰居(k1),每個1跳節(jié)點的最近鄰居(k2)以及鏈接的最近的鄰居,用于拾取邊緣(u)。這些超參數的具體含義和功能可以在(Wang等人,2019)中找到。不需要使用與培訓階段相同的IPS配置。因此,我們首先設置k1 = 40,僅研究不同的u和k2,我們的結果記錄在表1中。我們得出結論,對于任何固定的u,增加k2總是會導致性能提高,直到k2等于u。一旦k2大于u,就可以觀察到F度量的明顯下降。相反,在固定k2的情況下,較大的u會導致大多數情況下的BCubed F測度較低。當k2 = u = 5時,可獲得最高的BCubed F測度。然后,使用此設置,我們測試了不同k1帶來的效果。根據圖3中的結果,我們發(fā)現當k1 = 70時,F度量和NMI達到峰值。因此,從現在開始,我們將k1 = 70,k2 = 5和u = 5固定為所有以下實驗。

其次,我們將OSD模塊與另外兩個損失函數進行了比較,這兩個函數廣泛用于學習判別功能以及SR損失。詳細地,在表2的第一部分中,我們報告了LP(GCN-M)結合中心損失(Wen等,2016)和AM-softmax損失(Wang等,2018b; a)的結果。盡管中心損失和AM-softmax損失可以改善基線(即LP(GCN-M))的性能,但是OSD對LP(GCN-M)的改善要高于兩個損失函數中的任何一個(最后表2)中的行,表明OSD在幫助學習區(qū)分性表示形式方面的優(yōu)勢。表2的第二部分顯示了SR損失中不同子項組合的結果,以探討SR損失對OSD模塊的影響:一旦我們刪除了SR損失的任何子項,就可以觀察到F的下降。測量和NMI,證實了理論的正確性和SR損失的重要性。

第三,為了更好地解釋OSD學到了什么,我們將OSD學到的節(jié)點特征可視化。我們從訓練集中隨機抽取了1000個由正向或負向節(jié)點組成的樞軸節(jié)點,并使用t-SNE(Maaten&Hinton,2008)進行降維并可視化圖4中的節(jié)點特征。圖4,左),正負節(jié)點的表示沒有足夠的區(qū)別;負節(jié)點特征的分布是分散的,甚至某些正負節(jié)點特征是混合的。此類學習到的功能可能會對基于圖的面部聚類的性能產生不良影響。使用OSD-LP(GCN-M)(右圖4),盡管我們沒有專門設計懲罰或損失函數來最大化兩種類型節(jié)點之間的余量,但是學習到的節(jié)點特征之間仍然存在明顯的差距。

與最新方法的比較?,F在,我們將我們的方法與以前的方法進行比較。表3的第一部分顯示了IJB-B數據集上的一些傳統(tǒng)聚類方法。由于對功能的假設有限(AHC除外),因此大多數這些方法的性能總是比我們的方法差,并且有很大的余量。至于AHC,它在傳統(tǒng)方法中表現最佳,在測試集上達到了約79.5%F值和0.920 NMI。但是,OSD-LP(GCN-M)仍然以較大的幅度優(yōu)于AHC。

在表3的第二部分中,我們列出了近年來提出的最新方法。很明顯,就F度量和NMI分數而言,我們的方法在三個子任務上都超過了現有技術。請注意,在LP(GCN-M)上附加使用了OSD,因此OSD-LP(GCN-M)優(yōu)于GCN-M的事實(Wang等,2019)直接證明了該方法的可用性。

此外,我們關注了Wang等人。 (2019)并在使用Softmax損失訓練的ResNet-50(He et al。,2016)模型的面部嵌入上測試了OSD模塊。結果顯示在表4中,我們可以得出結論,基于不同的面部嵌入,OSD-LP(GCN-M)仍然可以勝過以前的方法,從而驗證了OSD模塊的多功能性。

多視圖測試。為了進一步驗證OSD模塊的通用性,我們遵循Wang等人的方法。 (2019),還評估了我們基于多視圖數據的模型。我們利用面部嵌入和音頻嵌入來評估視頻面部數據聚類上的OSD。根據表5和表6中的結果,盡管人臉嵌入的數據分布與音頻嵌入的分布有很大不同,但是OSD可以同時改善兩者的性能,這意味著OSD是通用模塊,并且可以工作用于不同的數據形式時效果很好。此外,OSD還通過多視圖數據的組合獲得了最新的技術成果。

5總結與展望

在這項工作中,我們提出了正交子空間分解(OSD),它實現了一種新的方法來幫助網絡通過子空間學習和特征選擇來學習判別性特征。我們還報告了廣泛的實驗,這些實驗驗證了所提出方法的有效性。而且,據我們所知,這是將子空間學習和特征選擇與神經網絡同時結合的第一項工作。最后,這項工作提供了一個新的研究方向,即如何利用特征選擇和子空間學習來鼓勵神經網絡學習更多的判別表示。

附錄

A.1定理證明1

證明。給定V的兩個子空間V1和V2。

充分性:假設V = V1 + V2且V1∩V2 = {?0}。我們將子空間視為一組向量。至于兩個集合的加法,V1 + V2 = {v1 + v2:v1∈V1,v2∈V2},這意味著V中的任何向量都是V1的向量和V2的向量的和。應該證明這個加法的唯一性。Asforavectorv∈V,weassumev1∈V1,v2∈V2,v = v1 + v2,v3∈V1,v4∈V2,v = v3 + v4。由于V1∩V2= {?0},因此v1 + v2 = v3 + v4→v1-v3 = v4-v2。由于v1-v3∈V1和v4-v2∈V2,v1-v3 = v4-v2 =?0。因此,v1 = v3和v4 = v2。

必要性:假設V是V1和V2的直接和。根據定義,V = V1 + V2成立。如果v∈V1∩V2,考慮?0∈V,則通過直接和的定義得到v +(-v)=?0,其中v∈V1和-v∈V2。如果visnota?0,則?0可以由?0+?0和v +(-v)表示,這不是唯一表示,并且違反了直接和的定義。因此,V1∩V2 = {?0}。

A.2實施細節(jié)

最初,通過使用ArcFace模型(Deng等人)獲得了CASIA-Webface(Yi等人,2014),FaceScrub(Ng&Winkler,2014)和IJB-B(Whitelam等人,2017)中人臉的嵌入。等(2019年)使用ResNet-101。該模型在MS-Celeb-1M(Guo等人,2016)和VGGFace2(Cao等人,2018)的聯合上進行了訓練。然后,我們使用(Wang等人,2019)中的方法構造實例樞軸子圖(IPS)作為整個框架的輸入,然后通過設置k1 = 80,k2 = 8和u =來遵循它們的訓練設置。 8. LP(GCN-M)與(Wang等人,2019)中GCN-M構造的鏈路預測模型相同。特別地,前三個圖卷積層的輸出特征的維數均為512,而最后一個是256。關于OSD,兩個學習的子空間矩陣的維數均為256×256。整個框架通過具有0.9動量和0.0005權重衰減的隨機梯度下降(SGD)進行優(yōu)化。我們將批次大小設置為16,并對該模型進行了3個時期的訓練。首先將學習率設置為10-3,然后在每個時期乘以0.1。最后保存的模型用于評估,我們使用的評估指標與(Wang等人,2019)中相同,即歸一化互信息(NMI)和BCubed F測度(Amigó等人)。 (2009年)。對于多視圖測試,我們使用上述相同的訓練過程,簡單地將面部嵌入與匹配的音頻嵌入連接起來,并構造IPS進行“面部+音頻”實驗。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容