|知識圖普嵌入技術的極簡教程:KGE以及如何計算它們( 二 )
3、基于神經網絡的方法:
神經網絡現在在許多領域都很流行 , 它們被用于查找KGE也就是很正常的事情了 。 Semantic Matching Energy它定義了一個能量(energy )函數 , 用于通過使用神經網絡為三元組分配一個值 。 神經張量網絡(Neural Tensor Network)使用能量函數 , 但它用雙線性張量層代替了神經網絡的標準線性層 。
像 ConvE 這樣的卷積神經網絡以“圖像”的形式重塑實體和關系的數值表示 , 然后應用卷積濾波器提取特征 , 從而學習最終的嵌入 。 我們還可以找到受 GAN 啟發的模型(例如 KBGAN)和基于 Transformer 的模型(例如 HittER)來計算KGE 。
為了實現這些算法 , 我們有多個 python 庫 , 例如:
- LibKGE
- PyKEEN
- GraphVite
- AmpliGraph
Negative Generation:
這是在知識圖中生成否定或損壞的三元組的概念 。 負三元組是不屬于原始圖的三元組 。 這些可以隨機生成 , 也可以使用伯努利負采樣等策略生成 。
Scoring Function:
它是一個包裝三元組的函數 , 它輸出一個值或一個分數 。 如果分數高 , 那么三元組是有效的 , 如果分數低 , 那么它是一個負三元組 。 評分函數是構建 KGE 算法的重要部分之一 。
Loss Function:
由于算法是根據優化問題建模的 , 因此我們在訓練過程中使用了損失函數 。 這個損失函數使用正負三元組的分數來計算損失 。 我們的目標是盡量減少損失 , 減少損失的過程肯定也少不了優化器 。
一般情況下損失函數包括——Cross entropy loss Pairwise margin-based hinge loss等 。
生成嵌入后的下一步是什么?學習 KGE 算法并應用它們來查找嵌入是很有趣的 。 現在 , 下一步是什么?嵌入的用途是什么?
有一些圖下游任務可以應用于知識圖譜 , 例如:
知識圖譜補全:
這也稱為鏈接預測 , 我們的目標是預測知識圖中缺失的關系或潛在的可能關系 。 它也可以稱為知識圖譜增強 。
這項任務歸結為找到一個可以最好地表示為具有給定的關系和一個實體的事實 。 簡單地說 , 任務是猜測 (? r t) 或 (h r ?) 中的缺失部分 , 也可以分別稱為頭部預測或尾部預測 。 我們使用基于等級的評估技術來查找我們的知識圖嵌入的性能 。
三元組分類:
這是一個識別給定三元組是否有效的問題 , 即它是正三元組還是負三元組 。 此任務的輸出只有是或否 。 使用評分函數并設置閾值以將正三元組與負三元組分開 。 通俗的講就是一個二元分類的問題 。
推薦系統是KEG應用的一個重要領域 。 嵌入的質量對于上述任務的性能和準確性很重要 。 這些任務的結果告訴我們是否能夠生成高質量的嵌入 。
原文地址:https://www.overfit.cn/post/0248ec021912474a9de9be2ab287c33a
【|知識圖普嵌入技術的極簡教程:KGE以及如何計算它們】作者:Rohith Teja
相關經驗推薦
- |HTML表格怎么設置?html錨鏈接怎么設置?最全知識匯總!
- MIUI|MIUI純凈模式雖已上線,但用戶卻有不同看法,網友:妨礙探索知識
- 知識圖譜|2022年手機市場將有這些趨勢,提前了解這3點變化,做到心中有數
- iPhone|諾基亞為何寧可逐漸沒落也不采用Android系統?長知識了
- 魅族|有用的冷知識:閑聊手機成本和價格,所謂的性價比從哪里來?
- 浙江省|“之江杯”知識競賽丨倒計時48小時,答題還有機會領手機平板
- 網上商城|正規電子元器件網上商城 采購入門基礎知識
- ai|嵌入式開發:嵌入式軟件開發成功的 3 個要素
- |北京低調富豪:清華畢業,打造嵌入式CPU芯片領先企業,身家60億
- vivo|快手漲粉小知識
