Michael Bronstein箆は、オックスフォ`ド寄僥のDeepMind縮娩AI、Twitterのグラフラ`ニング冩梢販宀です。この並は、に恷兜にdされました。また、TwitterのEmanuele Rossi箆、91篇撞APPのDaniel Justusと慌揖で鵡Pしています。
犹プ喘するエンティティの鹸jなシステムをQう謹くの鮄辰如▲禰`タはグラフとして更夛晒されます。除定、グラフ更夛晒デ`タ、蒙にグラフニュ`ラルネットワ`ク┳勹訓沓への字亠僥楼の鮄辰砲茲蝓繁櫃寄きく互まっています。
赫鰻鰻ア`キテクチャの寄何蛍は、グラフが耕協されていることを念戻としています。しかし、この協はg歓すぎることがよくあります。謹くの鮄辰任蓮∋徒となるシステムが強議であるため、グラフは扮寂とともに篁します。箭えば、ソ`シャルネットワ`クや容呪システムでは, コンテンツにしてユ`ザ`が郡鬉靴討い襪海を幣すグラフがリアルタイムで篁することがあります。恷除、この強議グラフをI尖できる赫鰻鰻ア`キテクチャが、扮寂議グラフネットワ`ク┛娚勹沓[1]など、いくつか蝕kされました。
タイムスタンプ t1 と t2で仟しいエッジを函誼することにより、繁と繁の犹プ喘のグラフが強議に篁
このブログでは、さまざまなサイズの啜張哀薀佞悗TGNの鮄辰鯡修蝓△海離ラスのモデルの處麻の}jさを{べていきます。91篇撞APPのBowインテリジェンス?プロセッシング?ユニットIPUを聞喘して、TGNを處麻することで、なぜIPUのア`キテクチャがこの}jさにIするのに恷mで、g匯のIPUプロセッサをNVIDIA A100 GPUと曳^して蓐`いのスピ`ドアップになることを幣しています。
には、2つの麼勣な更撹勣殆があります。まず、ノ`ド托めzみは、症塀のグラフニュ`ラルネットワ`クア`キテクチャを初して伏撹されます。ここでは、g蚊グラフアテンションネットワ`クとしてg廾されています [2]。さらに、意赫鰻は、光ノ`ドの狛肇のすべての犹プ喘を勣埃したメモリを隠隔します。このストレ`ジには、まばらなiみ函り/慕きzみ荷恬でアクセスされ、ゲ`ト原き指「侏ユニット┳匕蕷を聞喘して仟しい犹プ喘で厚仟されます[3]。
意赫鰻モデルア`キテクチャ:和の佩はg匯のメッセ`ジパッシングステップのある赫鰻鰻、貧の佩はグラフの光ノ`ドの弖紗メモリ
ここでは、仟しいエッジを函誼することで扮寂とともに篁するグラフに醜泣を輝てます。この魁栽、ノ`ドのメモリには、このノ`ドをタ`ゲットとするすべてのエッジと、それぞれの乱枠ノ`ドにvする秤烏が根まれています。寂俊議な篠嚥を宥じて、ノ`ドに原嚥されたメモリは、ノ`ドにvする秤烏を垓くに隠隔することもできるため、グラフアテンションネットワ`クの弖紗の蚊が音勣になります。
弌号庁グラフへの鮄
恷兜に、ウィキペディアの並とユ`ザ`の2何グラフであるJODIE Wikipediaデ`タセット[4]で意赫鰻をgYします。ここでは、ユ`ザ`と芝並の寂の光エッジは、ユ`ザ`による芝並の園鹿です。グラフは、9,227ノ`ド8,227繁のユ`ザ`と1,000周の芝並とタイムスタンプ原きの157,474エッジで更撹されています。エッジには、園鹿をh苧する172肝圷の晦鴛安遺蒙羀戰トル [5] の廣があります。
gY嶄、エッジは恷兜に俳僅されたノ`ドのセットにバッチごとに携襪気譴泙后モデルは、寔のエッジとランダムにサンプリングされた減のエッジの孚議な鱒払を聞喘して僥楼されます。編^潤惚は、ランダムにサンプリングされた減のエッジ貧で寔のエッジを紛艶する鳩楕として烏御されます。
岷湖議には、寄きいバッチサイズは容胎だけでなく僥楼にも唹譴みられています。ノ`ドのメモリとグラフの銭潤來はどちらも、頼畠なバッチがI尖されなければ厚仟されません。したがって、g匯のバッチ坪の朔のイベントは、バッチ坪の念のイベントを範紛しないため、硬い秤烏に卆贋する辛嬬來があります。g縞に、バッチサイズが寄きいとタスクの來嬬に唹譴竃ることがわかります。
さまざまなバッチサイズでトレ`ニングして10の耕協バッチサイズで編^する魁栽恣と、10の耕協バッチサイズでトレ`ニングしてさまざまなバッチサイズで編^する魁栽嘔の干或禽鴛掘/安庄一庄沿艶糸庄温デ`タでの意赫鰻の娼業
とはいえ、弌さなバッチを聞喘すると、トレ`ニング嶄および容胎嶄に互スル`プットを器撹するための互堀メモリアクセスの嶷勣來が膿距されます。そのため、寄否楚のプロセッサ坪メモリを姥えた鴛永雨では、バッチサイズが弌さい赫永雨よりもスル`プットが貧Nしています。蒙に、10のバッチサイズを聞喘すると、意赫鰻は鴛永雨で埃11蔚堀くトレ`ニングでき、200の寄きなバッチサイズでも、鴛永雨で埃3蔚堀くトレ`ニングできます。
Throughput improvement for different batch sizes when using a single IPU out of a Bow2000 IPU system compared to an NVIDIA A100 GPU.
グラフコアの鴛永雨での意赫鰻トレ`ニングのスル`プット貧Nをよりよく尖盾するために、意赫鰻の麼勣な荷恬でさまざまなハ`ドウェアプラットフォ`ムが継やした扮寂を距砲靴泙靴拭3勹扮に継やされる扮寂は、鴛永雨でより紳糞弔g佩される2つの荷恬であるアテンションモジュ`ルと赫檎雨によって媼嗤されていることがわかります。さらに、すべてのI尖を宥じて、鴛永雨は弌さなバッチサイズをはるかに紳糞弔I尖することができます。
蒙に、鴛永雨の單了來は、より弌さく、より僅頭晒されたメモリ荷恬で互まることがわかります。より匯違議には、處麻アクセスとメモリアクセスが呟嶽である魁栽、鴛永雨ア`キテクチャは赫永雨よりも寄きな單了來を幣すと潤胎原けることができます。
バッチサイズが呟なる鴛永雨および赫永雨での意赫鰻の麼勣な荷恬の扮寂曳熟
寄号庁グラフへのスケ`リング
デフォルト更撹の意赫鰻モデルは、埃260,000のパラメ`タを姥えた曳熟議X楚なものですが、モデルを寄きなグラフに癖喘する魁栽、ほとんどの鴛永雨プロセッサ坪メモリはノ`ドメモリで聞喘されます。ただし、アクセスがまばらであるため、このテンソルを翌何メモリに卞強できます。この魁栽、プロセッサ坪メモリの聞喘楕はグラフのサイズに卆贋しません。
意赫鰻ア`キテクチャを寄きなグラフでテストするために、1,550嵐繁のTwitterユ`ザ`、2|6,100嵐繁のフォロ`を根む停兆晒されたグラフにm喘します[6]。エッジには、晩原乏の728の呟なるタイムスタンプが護り輝てられますが、フォロ`がk伏したg縞の晩原にvする秤烏は戻工されません。このデ`タセットにはノ`ドまたはエッジの蒙罿贋壓しないため、モデルはグラフトポロジと扮寂議k婢に頼畠に卆贋して仟しいリンクを嚠霞します。
寄楚のデ`タにより、g匯の減のサンプルと曳熟した魁栽に屎のエッジを紛艶するタスクがg歓になりすぎるため、編^峺炎として、ランダムにサンプリングされた1,000の減のエッジの嶄から寔のエッジの峠譲剃乏了┣儻藐蕋を僉kします。さらに、デ`タセットサイズを寄きくすると、モデルの來嬬には、Lれたサイズを寄きくすることでメリットがあることがわかります。蒙協のデ`タについて、娼業とスル`プットの寂の恷癖な泣として、捻壓議なサイズ256を紛艶します。
モデルのさまざまなLれたサイズにする、1000の減のサンプル寂の峠譲剃乏了
ノ`ドメモリに翌何メモリを聞喘すると、スル`プットが埃2蛍の1に受富します。ただし、さまざまなサイズの嗾擬何蛍グラフと、意敬庄岳岳艶姻グラフのノ`ド方10蔚の栽撹デ`タセットおよびランダムな銭潤來を喘いて、スル`プットがグラフのサイズにほとんど卆贋していないことを幣しています。鴛永雨でこの返隈を聞喘すると、意赫鰻はほぼどのようなグラフサイズにでも癖喘でき、トレ`ニング嶄および容胎嶄に互いスル`プットを略隔しながら、聞喘辛嬬なホストメモリの楚で崙泙気譴襪世韻任后
さまざまなグラフサイズでLれた256のサイズの意赫鰻をトレ`ニングする縞の、サイズ256のバッチあたりの扮寂。意敬庄岳岳艶姻弌は干或禽鴛掘/安庄一庄沿艶糸庄温デ`タセットと揖じサイズ
參念にRり卦し峺姜したように、グラフC亠僥モデルをg廾するためのハ`ドウェアのxkは嶷勣ですが、^ごされがちな}です。 蒙に冩梢コミュニティでは、児Pとなるハ`ドウェアを渇鷸するクラウドコンピュ`ティングサ`ビスの辛喘來が、この泣で蒙協の仝機区々につながります。 しかし、リアルタイムのレイテンシ勣周を隔つ寄トなデ`タセットで嘛するシステムをg廾する栽、ハ`ドウェアの深]並をgに深]することができなくなります。 暴たちの冩梢によってこの嶷勣なトピックがより謹くのv伉を鹿め、グラフC亠僥アプリケ`ションのより紳糞弔淵▲襯乾螢坤爐肇路`ドウェアア`キテクチャへの祇が_かれることをっています。
[1] E. Rossi et al., (2020) arXiv:2006.10637. もご歌孚ください。
[2] P. Veli?kovi?, et al., Graph attention networks (2018) ICLR.
[3] K. Cho et al., (2014), arXiv:1409.1259.
[4] S. Kumar et al., (2019) KDD.
[5] J. W. Pennebaker et al., Linguistic inquiry and word count: LIWC 2001 (2001). Mahwah: Lawrence Erlbaum Associates 71.
[6] A. El-Kishky et al., (2022) arXiv:2205.06205.