攴鸽灅顶勋綌巩� IPU鞕赌 BERT-LARGE 氇嵏顷欖姷

BERT电� 鞝曧檿靹标臣鞙犾棸靹� 雿曤秳鞐� 鞓る姌雮� 臧赌鞛� 雱愲Μ 靷毄霅樀鐢鞛愳棸巩� 觳橂Μ 氇嵏欷� 顷橂倶鞛呺媹雼�. 攴鸽Μ瓿� 攴鸽灅顶勋綌巩挫潣瓿犼皾霌れ澊臧赌鞛� 毵库澊鞖旍箔頃樀鐢氇嵏欷� 顷橂倶鞚搓赴霃� 顷╇媹雼�.

雼轨偓鞐旍雼堨柎霌れ澏� 甏戨矓鞙勄隃巩胳柎旮半皹鞚戩毄攵勋暭毳� 歆赌鞗愴晿旮� 鞙勄甏 IPU 鞁涤姢韰涤毄 BERT毳� 甑槃顷橁碃斓涤爜頇旐晿鞓赌鞙茧┌, 靷办梾响涤 毹胳嫚霟嫕甑愳湣觳搓硠毳� 靷毄顷橃棳鞖办垬顷� 觳橂Μ霟夓潉鞛呾頄堨姷雼堧嫟.

攴鸽灅靹� 攴鸽灅顶勋綌巩搓岸� IPU鞕赌 BERT 氇嵏顷欖姷鞐� 甏赌顷� 鞐办灛韽姢韺呾潉旮绊殟顷� 氪れ姷雼堧嫟. 攴� 觳� 氩堨Ц鞚� 鞚措矆韽姢韺呾棎靹湹鐢攴鸽灅顶勋綌巩挫潣鞎犿攲毽紑鞚挫厴, 靻岉攧韸胳洦巩� 氚� 欷戧淡鞐旍雼堨柎毵� 韺赌鞚� 鞐旍雼堨柎霌れ澊 BERT-Large 甑槃鞚� 鞙勄甏靷爠顷欖姷瓿检爼鞚� 瓯办箻瓿� 韺岇澑韸滊嫕頃樀鐢雿� 靷毄顷� 斓涤爜頇� 旮办垹鞐� 雽赌顷� 鞛愳劯颂� 鞎岇晞氤搓矤鞀惦媹雼�.

BERT鞚� 攵赌靸�

BERT(Bidirectional Encoder Representations from Transformers)电� 甑竴(Google)鞚� 毵岆摖韸鸽灉鞀ろ彫毹� 旮半皹鞚� 巩胳柎响滍槃氇嵏搿�, 2018云� 毵愳棎於涤嫓霅� 鞚错泟靹犿拲鞝侅澑鞚戈赴毳� 雭岅碃鞛堨姷雼堧嫟.

鞐� 雽赌顷� 歆勴枆顷� 齑堦赴鞁滍棙鞚� 瓯办硱, 鞓る姌雮� BERT鞐� 靷毄霅橁碃鞛堨姷雼堧嫟.

BERT 氚� 攴� 韺岇儩氇嵏霌れ澏� 瓴赌靸� 鞐旍肟愲 鞎勲媹霛� 歆堨潣鞚戨嫷, 旖橅厫旄� 旮半皹於旍矞, 牍勲敂鞓� 鞚辞甏氚� 雼氨歆� 韸轨 於旍稖瓿� 臧欖澏� 雼るジ鞓侅棴鞐愲弰鞝侅毄霅橃柎氩旍毄靹膘潉鞛呾頄堨姷雼堧嫟.

GPT(靸濎劚鞝� 靷爠顷欖姷韸鸽灉鞀ろ彫毹�, GPT)鞕赌臧欖澏� 旮办〈鞚� 韸鸽灉鞀ろ彫毹� 氇嵏瓿� 雼るゴ瓴�, BERT电� 氇摖韸鸽灉鞀ろ彫毹� 霠堨澊巩挫棎靹� 霠堨澊敫旊悩歆赌鞎婌澏� 臧� 顷欖姷鞓堨牅鞚� 膦岇毎氍鸽Д鞚� 頇涤毄顷橃棳响滍槃鞚� 巩戨癌頄レ溂搿� 须臣鞝侅溂搿� 瓴赌靸夗晿霃勲 靹り硠霅橃棃鞀惦媹雼�. 鞚措煬顷� 巩戨癌頄レ劚鞚赌雼れ枒顷� 雼れ毚鞀ろ姼毽� 鞛戩梾鞐� 雿� 韥� 鞙犾棸靹膘潉攵€鞐戛雼堧嫟.

靷爠顷欖姷雼硠鞐愳劀霠堨澊敫旊悩歆赌鞎婌澏� 瓯半寑顷� 雿办澊韯� 靹疙姼毳� 靷毄頃樀鐢 BERT鞚� 旮半姤(攴鸽Μ瓿� 氙胳劯臁办爼雼硠鞐愳劀霠堨澊敫旍澊歆赌鞝曤悳鞝侅澏� 巩戩潣雿办澊韯半鞙茧 斓涤波雼潣鞝曧檿霃勲ゼ雼劚顷� 瓴�)鞚赌 BERT鞕赌鞙犾偓顷� 雽赌攴滊 韸鸽灉鞀ろ彫毹� 旮半皹鞚� 巩胳柎氇嵏霌れ潉毵れ毎毵る牓鞝侅溂搿� 氤挫澊瓴� 顷� 欷嶋媹雼�. 攴胳棎霐半澕鞚挫矘霟� 雽赌攴滊鞚� 鞁犼步毵� 巩胳柎氇嵏鞚� 顷欖姷鞁滍偆瓿� 韺岇澑韸滊嫕頃樀鐢靾橃殧臧赌韽顷橁碃鞛堨姷雼堧嫟.

巩胳柎氇嵏毵侁臣臧欖澏� 雽赌攴滊 鞛戩梾肟愲 鞎勲媹霛� . 鞓堧ゼ霌れ柎鞚� 顷欖姷鞓堨牅电� 3600臧滊皷鞐� 鞐嗢毵�, BERT-Base鞐愳劀 BERT-Large搿� 氇嵏韥赴毳� 韨れ泙鞙茧鞃� 鞝曧檿霃勱岸� 84.4%鞐愳劀 86.6%搿� 頄レ儊霅橃棃鞀惦媹雼�. .

毹胳嫚霟嫕鞐瓣惮歆勱臣鞐旍雼堨柎霌れ澊鞚措煬顷� 巩胳柎氇嵏霌れ潣鞛戩梾靹彪姤鞚� 歆赌靻嶌爜鞙茧 頄レ儊鞁滍偆瓿犾瀽顷棎霐半澕巩胳柎氇嵏鞚� 韥赴电� 鞝愳皑旎れ瓿� 鞛堨姷雼堧嫟. 鞚措煬顷� 順勳儊鞚赌 BERT 氇嵏鞚� 氤赌鞚错槙雮挫棎靹滊弰, 攴鸽Μ瓿� 1,750巩� 臧涤潣毵り皽氤赌靾橂ゼ臧赌歆赌瓿� 鞛埖鐢 GPT-3瓿� 臧欖澏� 雼るジ斓涤嫚巩胳柎氇嵏鞐愳劀霃� 霃欖澕顷橁矊雮橅俭雮╇媹雼�.

IPU-POD鞐愳劀鞚� BERT 靷爠顷欖姷

鞚搓矁鞚赌氇嵏毵侅潣氚涤爠毵岇溂搿� 臧赌電デ甏歆� 瓴冹澊鞎勲嫏雼堧嫟. 雿� 雴掛澏� 须湪鞚� 鞝滉车顷� 靾� 鞛埖鐢靸堧鞖� 鞚戈车歆赌电� 顷橂摐鞗柎鞕赌鞁涤姢韰涤潣臧滊皽霃� 顷╇Μ鞝侅澑旮瓣皠鞎堨棎鞚挫櫠� 臧欖澏� 雽赌攴滊 巩胳柎氇嵏鞚� 顷欖姷鞚� 臧赌电デ陿瓴� 顷� 欤嫉鐢雿�, 鞛犾灛鞝侅溂搿� 氅办范順轨澏� 鞁巩� 氇� 鞁滉皠鞎堨棎靾橃嫮巩� 臧涤潣鞓堨牅毳� 靷爠顷欖姷鞁滍偓靾橂弰鞛堨姷雼堧嫟. 攴鸽灅顶勋綌巩挫潣 IPU-POD电� 鞚措煬顷� 靹彪姤氍胳牅毳� 顷搓舶顷� 欤缄碃鞐瓣惮歆勱臣鞐旍雼堨柎霌れ潣靸濎偘靹膘潉韥矊頄レ儊鞁涤紲欷嶋媹雼�. IPU-POD电� 齑堦碃靹钡绁鞚� 鞚疙攧搿涤劯靹� 氅旊毽ゼ頇涤毄顷橃棳雿办澊韯� 鞚措彊鞚� 斓涤唽頇斍戗鞙茧〉訊� 霙办柎雮� 瓿勋偘靹彪姤瓿� 雿� 雮橃澏� 鞝勲牓须湪靹膘潉鞝滉车顷╇媹雼�. 瓿犾啀鞚� 鞀れ紑鞚检晞鞗� 鞚疙劙旎る劌韸� 旮半姤瓿� 歆赌电ロ槙氅旊毽� 甏€毽� 旮半姤鞚� 韱登甏鞎犿攲毽紑鞚挫厴鞚� 靾橂氨臧涤潣 IPU搿� 须湪鞝侅溂搿� 鞀れ紑鞚检晞鞗兦隊靾� 鞛堨姷雼堧嫟.

IPU-POD鞐愳劀电� BERT毳� 须湪鞝侅溂搿� 鞁ろ枆顷橁赴鞙勄甏鞝勋泊氇嵏鞚� 毵り皽氤赌靾橂ゼ IPU鞐� 搿滊摐顷╇媹雼�. 鞚措ゼ鞙勄甏 BERT 氇嵏鞚� 4臧涤潣 IPU鞐� 攵勄隊霕惖鐢 "靸る敥 (shard)"顷橁碃, 顷欖姷瓿检爼欷戩棎氇嵏鞚� 韺岇澊顶勲澕鞚胳溂搿� 鞁ろ枆顷╇媹雼�.

鞎勲灅鞐愳劀 BERT-Large毳� 攵勄隊頃樀鐢氚╇矔鞚� 鞓堧ゼ氤� 靾� 鞛堨姷雼堧嫟. IPU 0鞐惖鐢 3臧涤潣鞚胳綌雿� 霠堨澊巩挫櫠� 顷粯鞛勲矤霐� 霠堨澊巩�(embedding layer), 顶勲鞝濎厴/靻愳嫟霠堨澊巩�(projection/loss layers)臧赌韽暔霅橃柎鞛堨溂氅� 雮橂ǜ歆赌 21臧� 霠堨澊巩吹鐢雼るジ 3臧涤潣 IPU鞐� 瓿犽ゴ瓴� 攵勴彫霅橃柎鞛堨姷雼堧嫟. 鞛勲矤霐� 氚� 顶勲鞝濎厴霠堨澊巩吹鐢毵り皽氤赌靾橂ゼ瓿奠湢顷橁赴霑岆鞐� 顶勲鞝濎厴, MLM(Masked Language Model) 氚� NSP(Next Sentence Prediction) 霠堨澊巩措ゼ雼れ嫓 IPU 0鞐� 氚办箻顷� 靾� 鞛堨姷雼堧嫟.

model parallelism bert pipelining on the IPU

IPU POD4鞐愳劀 BERT-Large鞚� 氇嵏氤戨牞觳橂Μ

攴鸽灅顶勋綌巩吹鐢旃╈潣氅旊毽� 靷毄霟夓潉欷勋澊旮� 鞙勄甏旮半姤鞚� 靷毄顷╇媹雼�. 霐半澕靹� 鞐癌頄� 韺姢毳� 瓿勋偘顷� 霑� 靷毄顷橁赴鞙勄甏欷戧皠霠堨澊巩� 頇涤劚頇旊ゼ鞝赌鞛デ隊頃勳殧臧赌鞐喌鐢雿办殧. 鞛逞珎办澏� 氇嵏鞚� 顷欖姷鞁滍偓霑� 靷毄顷� 靾� 鞛埖鐢鞝勲灥鞙茧, 韺岇澊顶勲澕鞚� 鞝勲灥鞚� 甑槃顷� 霑� 韸鬼瀳鞙犾毄顷╇媹雼�. 韺岇澊顶勲澕鞚胳潉韱登甏顷儊氤奠垬鞚� 氚办箻臧赌鈥�鞁ろ枆欷�鈥�鞚措瘈搿� 鞛逞珎� 旮半姤鞚� 靷毄顷橃 鞎婌溂氅� 鞝赌鞛ル悳頇涤劚頇旍潣韥赴臧赌毵れ毎旎れ 靾� 鞛堨姷雼堧嫟.

靷爠顷欖姷鞁涤姢韰涤潣鞓淀嫲毵堨澊鞝赌(Optimizer) 靸來儨电� 鞀ろ姼毽皪氅旊毽�(Streaming Memory)鞐� 鞝赌鞛ル悩瓿� 鞓淀嫲毵堨澊鞝赌雼硠欷� 鞖旍箔鞐� 霐半澕搿滊摐霅╇媹雼�.

鞀ろ姼毽皪氅旊毽鐢攴鸽灅顶勋綌巩挫棎靹� 鞓ろ攧旃� 氅旊毽�(off chip memory)毳� 鞚检猾电� 鞖╈柎鞛呺媹雼�. IPU-POD64 雮挫潣臧� 顷奠嫭鈥�牍岆敥敫旊鈥�鞚� 鞐惖鐢 4臧涤潣 IPU 顶勲靹胳劀搿� 鞁ろ枆霅樀鐢斓滊寑 450GB鞚� 氅旊毽岸� 韮戩灛霅橃柎鞛堨姷雼堧嫟. 鞚吹鐢氇摖 IPU 旃╈棎韽暔霅� 900MB鞚� 鞚疙攧搿涤劯靹� 氅旊毽櫠� IPU雼� 斓滊寑 112GB鞚� 鞓ろ攧旃� 鞀ろ姼毽皪氅旊毽 雮橂墿雼堧嫟. 鞚� 鞀ろ姼毽皪氅旊毽鐢 IPU 毹胳嫚鞚� DDR4 DIMM鞐愳劀歆赌鞗愲惄雼堧嫟.

攴鸽灅顶勋綌巩挫潣 TensorFlow, PyTorch, PopART鞐愳劀鞚� BERT 甑槃

GitHub鞚� 鞐愳劀 TensorFlow, PyTorch, PopART鞐愳劀鞚� IPU搿� 甑槃顷� BERT毳� 頇曥澑顷橃嫟靾� 鞛堨姷雼堧嫟.

鞚赌攴鸽灅顶勋綌巩挫潣 TensorFlow 韺岇澊顶勲澕鞚� API毳� 頇涤毄顷橁赴鞙勄隃靷毄鞛� 鞝曥潣氚� 頇曥灔鞚� 韱登甏瓿� 氇嵏旖旊摐毳� 瓿奠湢顷╇媹雼�.

PyTorch 甑槃鞚赌 Hugging Face 韸鸽灉鞀ろ彫毹� 霛检澊敫岆煬毽潣氇嵏靹る獏瓿� 鞙犿嫺毽嫲毳� 旮半皹鞙茧 顷╇媹雼�. 韺岇澊顶勲澕鞚� 鞁ろ枆(pipeline execution), 鞛逞珎�(recomputation), 雼れ 氤奠牅/雿办澊韯� 氤戨牞觳橂Μ(multiple-replica/data parallelism) 霌膘潉韽暔顷�, IPU毳� 鞙勄甏攴鸽灅顶勋綌巩� PopTorch 霛检澊敫岆煬毽ゼ靷毄顷╇媹雼�.

Poplar Advanced Runtime(PopART)鞚� 鞚挫毄顷� BERT 甑槃霃� Github鞐愳劀頇曥澑顷橃嫟靾� 鞛埖鐢雿办殧. PopART毳� 靷毄顷橂┐ 顷欖姷氚� 於旊鞚� 鞙勄甏 ONNX 氇嵏靹る獏鞐愳劀氇嵏鞚� 臧赌鞝胳槫瓯半倶靸濎劚顷� 靾� 鞛堨溂氅�, C++ API鞕赌韺岇澊鞃� API臧赌氇憪韽暔霅╇媹雼�. 鞐� 靹る獏霅� 雽赌搿� PopART电� 鞓淀嫲毵堨澊鞝赌, 旮办毟旮�(gradient), 毵り皽氤赌靾�(parameter) 攵勄隊鞚� 歆€鞗愴晿电旊嵃鞖�, 鞚措ゼ韽磩顷橃棳韰愳劀靸る敥(RTS: Revided Tensor Sharding)鞚措澕瓿� 攵赌毽呺媹雼�. PopART鞚� 氤奠牅霅� 韺岇澊顶勲澕鞚� 氇嵏-氤戨牞 BERT 鞁涤姢韰涤潣瓴届毎, 鞓淀嫲毵堨澊鞝赌氚� 攴鸽灅霐旍柛韸� 韺岉嫲靺旊嫕(gradient partitioning)鞚� 靷毄顷橁碃鞛堨姷雼堧嫟.

IPU-POD搿� BERT 鞀れ紑鞚茧

鞛愳湪靷爠顷欖姷鞚� 瓴届毎, BERT电� 鞙勴偆顶茧敂鞎�, BookCorpus 氚� 旮绊俭於涤矘鞚� 靾橃嫮巩� 臧赌歆€ 顷欖姷鞓堨牅毳� 頇涤毄顷� 靾� 鞛堨姷雼堧嫟. IPU-POD4毳� 靷毄頃樀鐢瓴届毎鞐愲弰鞚措煬顷� 雽赌鞖╇焿雿办澊韯� 靹疙姼毳� 雼れ垬韱店臣顷橂牑氅� 靸侂嫻顷� 鞁滉皠鞚� 瓯鸽雼堧嫟. 顷欖姷鞁滉皠鞚� 雼稌顷橁赴鞙勄甏鞖半Μ电� 雿办澊韯� 氤戨牞氇嵏顷欖姷鞚� 靷毄顷橃棳靷爠顷欖姷顶勲靹胳姢毳� IPU-POD16, IPU-POD64 鞚挫儊鞙茧 鞀れ紑鞚记隊靾� 鞛堨姷雼堧嫟.

雿办澊韯� 氤戨牞顷欖姷鞚赌顷欖姷雿办澊韯� 靹疙姼毳� 鞐煬攵赌攵勋溂搿� 雮橂垊氅�, 臧� 攵€攵勳澏� 氇嵏氤奠牅鞐� 鞚樓甏靷毄霅╇媹雼�. 臧� 斓涤爜頇� 雼硠鞐愳劀攴鸽灅霐旍柛韸傅鐢氇摖氤奠牅鞐愳劀韽夑窢鞝侅溂搿� 臧愳唽顷橂瘈搿� 氇摖氤奠牅鞐愳劀臧赌欷戩箻鞐呺嵃鞚错姼氚� 氇嵏靸來儨臧赌霃欖澕顷╇媹雼�.

歆戫暕鞝侅澑攴鸽灅霐旍柛韸� 臧愳唽

攴鸽灅霐旍柛韸� 臧愳唽旮半姤鞚赌瓿犾劚电� 鞀れ紑鞚� 鞎勋泝鞚� 歆赌鞗愴晿霃勲 靹り硠霅� 韽攲霛�(Poplar) 靻岉攧韸胳洦巩� 鞀ろ儩鞚� 頇曥灔鞚� Graphcore 旎る雼堨紑鞚挫厴霛检澊敫岆煬毽�(GCL: Graphcore Communication Library)毳� 靷毄顷╇媹雼�. GCL鞐惖鐢毵れ毎须湪鞝侅澑毵� 旮半皹 All-Reduce鞕赌雼るジ毵庫澏� 鞚茧皹鞝侅澑旎る雼堨紑鞚挫厴顶勲Μ氙疙嫲敫�(primitives)臧赌韽暔霅橃柎鞛堨姷雼堧嫟. 鞎勲灅鞚措歆赌鞐� 雮橃櫠� 鞛埖鐢瓴冹矘霟� 氇摖氤奠牅鞐� 雽赌顷挫劀攴鸽灅霐旍柛韸胳潣韽夑窢臧掛澊靷办稖霅橂┌, 氇摖氅赌韹� 氤奠牅攴鸽爤鞚措敂鞏疙姼臧赌鞕勋爠颂� 臧愳唽顷橂┐ 臧赌欷戩箻鞐呺嵃鞚错姼臧赌顷� 氩堨棎鞝侅毄霅╇媹雼�.

雿办澊韯� 氤戨牞攴鸽灅霐旍柛韸� 臧愳唽电� 鞓淀嫲毵堨澊鞝赌霝橅嵓旮半姤(optimizer wrapper functions)鞚� 靷毄顷橁卑雮� 靷毄鞛� 鞝曥潣鞓淀嫲毵堨澊鞝赌鞝曥潣(custom optimizer definitions)毳� 氤措嫟靹鸽皜顷橁矊鞝涤柎顷橃棳鞛愲彊鞙茧 於旉岸那隊靾� 鞛堨姷雼堧嫟. 鞚措煬顷� 臧愳唽电� IPU-POD 雮挫棎靹� 霕惖鐢靹滊 雼るジ IPU-POD 臧勋棎攴犾澕顷橁矊氚涤儩顷� 靾� 鞛堨姷雼堧嫟.

TensorFlow鞐愳劀 API臧赌鞛戨彊頃樀鐢氚╈嫕鞐� 雽€顷� 鞛愳劯顷� 雮挫毄鞚赌 TensorFlow 靷毄靹る獏靹涤棎靹� 鞐� 雽€顷� 鞝曤炒毳� 彀胳“顷橃嫓氅� 霅╇媹雼�.

PyTorch鞚� 瓴届毎, 鞖半Μ电� PopTorch IPU 氇嵏鞓奠厴鞐� 氤奠牅歆赌靾�(replication factor)毳� 靹れ爼顷╇媹雼�.

multi-replica-bert

氅赌韹� 氤奠牅 BERT鞐� 雽€顷� 雿办澊韯� 氤戨牞觳橂Μ

雽赌攴滊 氚办箻(batches)搿� BERT 顷欖姷

氇嵏鞚� 氤戨牞鞀れ紑鞚茧 须湪靹膘棎旮办棳頃樀鐢欤检殧鞖旍唽欷� 頃橂倶电� 攴鸽灅霐旍柛韸戈岸� 巩茧雮� 鞛愳＜韱奠嫚顷� 靾� 鞛埖鐢歆赌鞛呺媹雼�. 鞖半Μ电� 攴鸽灅霐旍柛韸� 於曥爜(GA: Gradient Accumulation)鞚� 靷毄顷橃棳旎错摠韺� 霕惖鐢毵堨澊韥 氚办箻韥赴毳� 旮赌搿滊矊氚办箻韥赴鞕赌攵勲Μ顷╇媹雼�. 霕惽隃攴鸽灅霐旍柛韸� 於曥爜歆赌靾橂ゼ臁办爼顷橃棳 IPU 氚�/霕惖鐢氤奠牅靾橂ゼ氤赌瓴角隊霑� 鞚缄磤霅� 旮赌搿滊矊氚办箻韥赴毳� 鞙犾顷� 靾� 鞛堨姷雼堧嫟. 旮赌搿滊矊 氚办箻 韥赴 = 氤奠牅 氚办箻 韥赴 x 氤奠牅 靾�(global batch size = replica batch size 脳 number of replicas), 鞐赴靹� 氤奠牅 氚办箻 韥赴 = 旎错摠韺� 氚办箻 韥赴 x 攴鸽灅霐旍柛韸� 於曥爜 歆赌靾�(replica batch size = compute batch size 脳 gradient accumulation factor).

氤奠牅靾橁岸� 瓿犾爼霅� 瓴届毎, 旮赌搿滊矊氚办箻韥赴臧赌韥挫垬搿� GA 歆赌靾橁岸� 雴挣碃鞓淀嫲毵堨澊鞝赌鞕赌韱奠嫚雼硠臧赌欷勋柎霌媹雼�.

顷橃毵� GA臧赌靾橃矞臧滊 雱堧 韥┐ FP16鞚� 巩鸽崝顶岆(underflow) 氍胳牅臧赌氚涤儩顷� 靾� 鞛堨姷雼堧嫟. 鞛戩澏� GA鞚� 瓴届毎靹る獏霅� 雽赌搿� 氩勲笖鞓る矂项る摐(bubble overhead)搿� 鞚盖甏韺岇澊顶勲澕鞚� 须湪鞚� 雮晞歆� 靾� 鞛堨姷雼堧嫟. 斓涤爜鞚� 臧掛潉彀娟赴鞙勄甏靹湹鐢氇� 臧赌歆€ 鞁ろ棙鞚� 顷勋殧顷� 靾� 鞛堨姷雼堧嫟.

雼れ潓靹轨厴鞐愳劀电� BERT毳� 顷欖姷顷� 霑� 頇滌毄頃樀鐢顷欖姷靻嶋弰, 鞗岆皪鞐� 氚� 斓涤爜頇� 顶勲攴鸽灗鞚� 瓴€韱犌戛雼堧嫟.

靹犿槙鞀れ紑鞚茧 攴涤箼

鞐愳劀鞐瓣惮鞗愲摛鞚赌 ResNet-50 氚� Mask R-CNN鞚� 鞙勄隃雽赌攴滊 旮赌搿滊矊氚办箻毳� 顷欖姷鞁滍偓霑� 靹犿槙鞀れ紑鞚茧 攴涤箼鞚� 靷毄頄堨姷雼堧嫟. 鞚� 攴涤箼鞚赌氤奠牅氚办箻韥赴茷鞐� k毳� 瓿鼻隊霑�(鞐赴靹� k电� 鞚茧皹鞝侅溂搿� 氇嵏氤奠牅靾橃瀯), 旮半掣顷欖姷靻嶋弰茷鞐� k毳� 瓿鼻陿瓿� 鞚� 臧掛潉 k茷搿� 靹れ爼顷╇媹雼�.

旮赌搿滊矊氚办箻韥赴毳� n鞐愳劀 nk搿� 电橂Μ氅� 霃欖澕顷� 靾橃潣顷欖姷须熿垬(training epoch)毳� 靷毄顷橁碃韰岇姢韸� 鞝曧檿靹膘潉鞙犾頃樀鐢霃欖嫓鞐� 齑� 甑愳湣鞁滉皠鞚� k鞚� 歆赌靾橂韥� 欷勋澊瓿� 氇嵏-靸濎偘鞁滉皠鞚� 韥矊雼稌顷� 靾� 鞛堨姷雼堧嫟. 攴鸽煬雮� 鞛戩梾靹彪姤鞚赌雽赌攴滊 旮赌搿滊矊氚办箻鞚� 瓴届毎霒柎歆€电� 瓴冹潉鞛呾霅橃棃鞀惦媹雼�.

鞝愳鞝� 鞗岆皪鞐� 鞝勲灥

鞚措ゼ鞕勴檾頃樀鐢顷� 臧赌歆€ 氚╇矔鞚赌氚旊 鞗岆皪鞐呾瀰雼堧嫟. 鞗岆皪鞐� 鞁� 顷欖姷靻嶋弰电�k茷搿� 歃夓嫓齑堦赴頇旊悩歆赌鞎姷鐢雿办殧. 雽赌鞁�, 顷欖姷瓿检爼鞚赌 0鞙茧 鞁涤澜顷橁卑雮� 鞛勋潣鞚� 鞛戩澏� 顷欖姷靻嶋弰搿� 鞁涤澜顷橃棳靷爠鞝曥潣霅� 鞗岆皪鞐� 雼硠靾橃棎霐半澕鞐办啀鞝侅溂搿� 歃濌岸捻晿鞐� k茷鞐� 霃勲嫭顷╇媹雼�. 鞚措煬顷� 鞝愳鞝� 鞗岆皪鞐呾潉韱登甏雿� 鞝侅澏� 靾橃潣雼硠搿� 雽赌攴滊 旮赌搿滊矊氚办箻顷欖姷鞚� 靾橅枆顷橃棳雿� 鞛戩澏� 氚办箻韥赴鞕赌鞙犾偓顷� 甑愳湣鞝曧檿霃勲ゼ巩混潉靾� 鞛堨姷雼堧嫟. 鞐愳劀鞚� 顷欖姷鞚� 韱登甏旮赌搿滊矊氚办箻韥赴臧赌鞎� 8,000鞚� 顷欖姷鞚� 臧赌電デ隃瓴冹潉頇曥澑頄堨姷雼堧嫟.

靷爠鞝曥潣霅� 鞗岆皪鞐� 雼硠电� BERT-LARGE 靷爠顷欖姷靷鞚� 1雼硠鞕赌 2雼硠鞐愳劀雼るゴ瓴� 雮橅俭雮╇媹雼�. 鞐愳劀鞕赌臧欖澊, 1雼硠鞐愳劀电� 斓滊寑鞁滍赌赌鞀� 旮胳澊臧赌 128鞚搓碃 2雼硠鞐愳劀电� 斓滊寑鞁滍赌赌鞀� 旮胳澊臧赌 384鞚� 顷欖姷雿办澊韯半ゼ靷毄顷╇媹雼�. 1雼硠鞗岆皪鞐呾潣靾樀鐢 2,000臧滊 1雼硠鞐愳劀鞝勋泊甑愳湣雼硠鞚� 鞎� 30%毳� 彀頃樀鐢雿�, 鞚挫棎牍勄甏 2雼硠鞚� 鞗岆皪鞐� 靾樀鐢齑� 2,100臧涤澊氅�, 鞚� 雼硠鞚� 鞎� 13%臧赌鞗岆皪鞐� 雼硠鞛呺媹雼�.

鞗岆皪鞐� 雼硠电� 靹滊 雼るジ靷爠顷欖姷雿办澊韯� 靹疙姼鞐� 毵炾矊臁办爼顷挫暭顷� 靾橂弰鞛堨姷雼堧嫟.

AdamW 鞓淀嫲毵堨澊鞝赌

响涤 頇曤鞝� 攴鸽灅霐旍柛韸� 顷橁皶鞎岅碃毽(standard stochastic gradient descent algorithm)鞚赌氇摖臧赌欷戩箻鞐呺嵃鞚错姼鞐� 雽赌顷� 雼澕顷欖姷靻嶋弰毳� 靷毄顷橂┌ 顷欖姷欷戩棎鞚检爼顷� 靻嶋弰毳� 鞙犾顷╇媹雼�. 氚橂尪碾 鞚赌攴鸽灅霐旍柛韸胳潣觳� 氩堨Ц 氚� 霊� 氩堨Ц 氇韸胳潣鞚措彊歆赌靾� 韽夑窢鞚� 靷毄顷橁碃鞚措煬顷� 氇韸鸽ゼ旮办鞙茧 顷欖姷靻嶋弰毵り皽氤赌靾橂ゼ臁办爼顷╇媹雼�.

鞐愳劀 Loshchilov鞕赌 Hutter 鞐瓣惮鞗愳澏� L2 鞝曣窚頇旉岸� Adam鞐愳劀須臣臧赌鞐嗠嫟电� 靷嫟鞚� 鞎岇晞雰堨姷雼堧嫟. 雽赌鞁�, 攴鸽摛鞚赌靻愳嫟旮半姤鞐愳劀 L2 鞝曣窚頇� 雽赌鞁� 臧赌欷戩箻臧愳唽鞝曣窚頇旊ゼ鞝侅毄頃樀鐢 AdamW毳� 鞝涤晥頄堨姷雼堧嫟. 鞚措ゼ韱登甏臧赌欷戩箻电� 於旉岸� 靸侅垬歆赌靾橁岸� 鞎勲媹霛� 氚办垬鞐� 鞚樓甏臧愳唽霅╇媹雼�. 霕惽隃鞗� 鞛嫓鞛戩澊臧赌電デ隃 AdamW臧赌 CIFAR-10 氚� ResNet32x32 氇憪鞐愳劀顷欖姷靻愳嫟瓿� 鞚茧皹頇旍潣鞓る 旄‰┐鞐愳劀雿� 鞖办垬頃橂嫟电� 瓴冹潉鞛呾顷橃榾鞀惦媹雼�.

IPU-POD16 BERT 靷爠顷欖姷鞐愳劀鞖半Μ电� AdamW搿� 512~2560鞚� 靷爠顷欖姷旮赌搿滊矊氚办箻韥赴毳� 靷毄顷橃棳鞁ろ棙鞚� 歆勴枆顷橃榾鞙茧┌, 氇摖靷臧赌 SQuAD 雼れ毚鞀ろ姼毽� 鞛戩梾鞐� 毵烄栋氙胳劯臁办爼霅橂┐靹� 旮办 鞝曧檿霃勋棎靾橂牬頃樀鐢靹标臣毳� 氤挫榾鞀惦媹雼�.

LAMB 鞓淀嫲毵堨澊鞝赌

LAMB 鞓淀嫲毵堨澊鞝赌(鞛愳劯顷� 雮挫毄鞚赌鞐� 靹る獏霅橃柎鞛堨潓)电� 氚办箻韥赴臧赌歃濌岸那隊霑� 氚滌儩頃樀鐢攴鸽灅霐旍柛韸� 攵堨晥鞝� 氚� 靻愳嫟鞚错儓鞚� 攴闺车顷橃棳氚办箻韥赴毳� 雿� 韥矊鞙犾顷� 靾� 鞛堧弰搿� 靹り硠霅橃棃鞀惦媹雼�. LAMB鞚赌霠堨澊巩� 鞕赌鞚挫 鞝侅潙靻嶋弰鞀れ紑鞚茧(LARS: layer-wise adaptive rate scaling)瓿� 霃欖澕顷� 霠堨澊巩� 鞕赌鞚挫 鞝曣窚頇� 臧滊厫鞚� 靷毄顷橂瘈搿� 顷欖姷靻嶋弰臧赌霠堨澊巩挫棎氙缄皭顷╇媹雼�. 攴鸽煬雮� 毵り皽氤赌靾� 鞐呺嵃鞚错姼鞚� 瓴届毎 AdamW鞚� 氇韰赌氚� 攵勋偘臧滊厫鞚� 靷毄顷╇媹雼�.

臧� 霠堨澊巩挫潣顷欖姷靻嶋弰电� 雼れ潓瓿� 臧欖澊瓿勋偘霅╇媹雼�.

\[\eta \frac{ \| x \| } { \| g \| }\]

鞐赴靹� \(\eta\) 电� 鞝勋泊顷欖姷鞙澊瓿�, \(\| x \|\) 电� 鞚� 瓿勋傅鞚� 毵り皽氤赌靾橃潣旮办鞚措┌ \(\| g \|\)电� 霃欖澕顷� AdamW 鞓淀嫲毵堨澊鞝赌鞐� 雽€顷� 鞐呺嵃鞚错姼鞚� 旮办鞛呺媹雼�.

歃�, LAMB鞚� 鞐呺嵃鞚错姼毳� 鞝曣窚頇斍陿瓿� \(\|x\|\)毳� 瓿表晿鞐� 臧� 霠堨澊巩挫潣毵り皽氤赌靾橃櫠� 霃欖澕顷� 韥赴鞝曤弰毳� 臧栮矊顷溂搿涤崹鞐呺嵃鞚错姼臧赌臧� 霠堨澊巩挫潣鞁れ鞝侅澑氤赌頇旊ゼ臧赌电デ陿瓴� 顷╇媹雼�. 攴� 雼れ潓瓴瓣臣臧掛棎鞝勋泊顷欖姷靻嶋弰 \(\eta\) 毳� 瓿鼻戛雼堧嫟.

LAMB鞚� 瓴届毎, 臧赌欷戩箻鞕赌韼疙枼鞚赌靹滊 雼るジ鞁犽臧掛潉臧赌歆赌瓿� 鞛堨柎靹滊 雼るジ顷欖姷鞖旍湪搿� 旆笁顷挫暭顷橂瘈搿� 霊� 臧涤潣攵勲Μ霅� 霠堨澊巩措 臧勋＜霅╇媹雼�. 韼疙枼氚� 臧愲, 氚办箻-响涤 (batch-norm)霕惖鐢攴鸽９-响涤(group-norm) 氩犿俭氩勳爠鞚赌霠堨澊巩� 臧涤“鞐愳劀鞝滌櫢霅樀鐢瓴届毎臧赌毵库姷雼堧嫟.

BERT鞚� 瓴届毎, LAMB鞚赌雼硠 1鞐愳劀斓滊寑 65,536鞚� 旮赌搿滊矊氚办箻韥赴鞕赌雼硠 2鞐愳劀斓滊寑 32,768鞚� 旮赌搿滊矊氚办箻韥赴毳� 靷毄顷� 靾� 鞛堨姷雼堧嫟.

雮澏� 鞝曤皜霃� 顷欖姷(Low-precision training)

霐� 霟嫕鞚� 齑堦赴鞐惖鐢毵庫澏� 氇嵏霌れ澊 32牍勴姼鞝曤皜攵赌霃欖唽靾橃爯鞐办偘氚╈嫕(32-bit precision floating-point arithmetic)鞙茧 顷欖姷氚涭晿鞀惦媹雼�. 雮澏� 鞝曤皜霃勲ゼ靷毄頃樀鐢瓴冹澏� 旎错摠韺� 觳橂Μ霟夓澊霊� 雼� 頄レ儊霅橁赴霑岆鞐� 毵る牓鞝侅瀰雼堧嫟. IPU鞚� 瓴届毎 FP16 顶柬伂靹彪姤鞚� FP32氤措嫟 4氚� 雿� 雴掛姷雼堧嫟. 鞝曤皜霃勱岸� 雮潉霑� 韰愳劀韥赴臧赌 2氚� 臧愳唽顷橃棳氅旊毽� 鞎曤牓氚� 韱奠嫚牍勋毄鞚� 鞝堦皭霅╇媹雼�.

攴鸽煬雮� FP16 鞝曤皜攵赌霃欖唽靾橃爯鞚赌 FP32氤措嫟鞝曤皜霃勱岸� 雮碃霃欖爜氩旍渼臧赌雮姷雼堧嫟. 顷橃毵� FP16鞚� 靷毄顷橃棳 FP32 臧赌欷戩箻攴鸽灅霐旍柛韸� 雸勋爜鞚� 韱登甏毵堨姢韯� 臧赌欷戩箻鞚� FP32 氤奠偓氤胳潉鞙犾顷橂┐靹� 靻愳嫟鞀れ簮鞚茧鞚� 靷毄顷橃棳頇涤劚氚� 攴鸽灅霐旍柛韸胳潣霃欖爜氩旍渼毳� 甏€毽晿电� 靾滊癌頄� 韺姢(頇涤劚頇�,activations) 氚� 鞐癌頄� 韺姢(攴鸽灅霐旍柛韸�) 瓿勋偘鞚� 鞝滌晥頃樀鐢靷瀸霌る弰鞛堨姷雼堧嫟.

鞖半Μ电� FP16鞐愳劀頇涤劚頇� 氚� 攴鸽灅霐旍柛韸鸽ゼ顷欖姷顷� 霑� 靻愳嫟鞀れ紑鞚茧鞚� 鞙犾偓顷� 氚╈嫕鞙茧 甑槃顷╇媹雼�.

Graphcore IPU电� 瓿� 旮办〈 IEEE 氚橃槵毽� 氇摐毳� 靷毄顷� 靾� 鞛堨姷雼堧嫟. 頇曤鞝� 氚橃槵毽检澏� 顷措嫻臧掛澊鞙勋 氚� 鞎勲灅飒� 氚橃槵毽� 瓴疥硠鞐� 攴检爲顷� 鞝曤弰鞐� 牍勲顷橃棳雼澕歆戨媹雼�. 毵庫澏� 靾橃潣顷欖姷鞓堨牅毳� 鞚挫毄顷� 韼疙枼霅橃 鞎婌澏� 氚橃槵毽� 瓴瓣臣毳� 巩混潉靾� 鞛堨姷雼堧嫟.

頇曤鞝� 氚橃槵毽� 氚╈嫕鞚� 靷毄顷橂┐ 鞝勋泊顷欖姷瓿检爼霃欖晥鞐旊摐韴� 鞐旊摐顷欖姷霕惖鐢雼れ毚鞀ろ姼毽� 鞛戩梾靹标臣鞚� 鞝曧檿靹膘澊雸堨棎霛勱矊鞝赌顷橂悩歆赌鞎婌溂氅挫劀 FP16鞐� 臧赌欷戩箻毳� 鞙犾顷� 靾� 鞛堨姷雼堧嫟.

鞓淀嫲毵堨澊鞝赌鞚� 觳� 氩堨Ц鞕赌霊� 氩堨Ц 氇韸戈岸� 瓿勋偘霅橃柎 FP32鞐� 鞝赌鞛ル悩瓿�, 鞝曣窚頇旊弰 FP32鞐愳劀靾橅枆霅╇媹雼�. 顷欖姷顶勲靹胳姢鞚� 雮橂ǜ歆赌鞛戩梾鞚赌 FP16鞐愳劀瓿勋偘霅╇媹雼�.

顷欖姷瓴瓣臣

攴鸽灅顶勋綌巩挫潣斓涤嫚鞀れ紑鞚检晞鞗� 鞁滌姢韰滌澏� 霃欔笁 DGX A100 旮半皹鞁涤姢韰涤棎牍勄甏顷欖姷鞁滉皠鞚� 斓滊寑 2.6氚� 雿� 雼稌顷橃棳 BERT-Large 顷欖姷鞐愳劀鞝勲 鞐喌鐢须湪靹膘潉氤挫棳欷嶋媹雼�.

斓涤嫚 IPU-M2000 臧赌靻嶊赴 16臧滉岸� 韽暔霅� IPU-POD64电� 旎错摠韺�, 韱奠嫚氚� 氅旊毽� 旮办垹鞚� 顺侅嫚鞚� 韱登甏 BERT-Large鞐愳劀靹犽弰鞝侅澑 AI 顶岆灚韽缄臣霃欖澕顷� 鞝曧檿霃勲ゼ雿旍毐歆ъ澏� 鞁滉皠雮挫棎鞝滉车顷╇媹雼�. 鞎勲灅霃勏鞙电� TensorFlow 氚� PyTorch鞚� 响涤 靸侅渼靾橃 顶勲爤鞛勋泴韥ゼ靷毄顷� 瓴瓣臣鞕赌攴鸽灅顶勋綌巩挫潣 PopART 旮半皹甑槃瓴瓣臣毳� 氤挫棳欷嶋媹雼�. 鞚� 瓴瓣臣毳� NVIDIA臧赌氚溝鞙顷� 臧赌鞛� 鞖办垬顷� PyTorch 瓴瓣臣鞕赌牍勱祼顷橁碃鞙犾偓顷� 氚╇矔搿犾潉靷毄顷橃棳牍勳姺顷� 顷欖姷鞁滉皠(Time-To-Train) 瓴瓣臣毳� 霃勋稖頄堨姷雼堧嫟.

BERT Large on IPU-POD64 System Performance Chart

靷爠顷欖姷

鞎勲灅彀姼电� TensorFlow, PyTorch 氚� PopART 甑槃鞐� 雽€顷� 靷爠顷欖姷靻愳嫟瓿§劆鞚� 雮橅儉雮吹鐢雿�, 霃欕摫顷� 斓涤 顷欖姷靻愳嫟(final training loss)鞐� 雽€顷� 靾橂牬瓿� 靹滊 毵れ毎鞙犾偓顷� 顷欖姷瓿§劆鞚� 氤挫棳欷嶋媹雼�. 霕惽隃鞚� 彀姼鞐惖鐢 IPU-POD16 氚� IPU-POD64鞐愳劀靹� 臧赌歆€ 氇嵏鞚� 氇憪甑槃頄堨潉霑岇潣顷欖姷觳橂Μ霟夓澊响涤嫓霅橃柎鞛堨姷雼堧嫟.

BERT-Large Phase 1 training

BERT-Large鞚� 靷爠顷欖姷靻愳嫟(Pre-training loss for BERT-Large): 1雼硠

BERT-Large Phase 2 training

BERT-Large鞚� 靷爠顷欖姷靻愳嫟(Pre-training loss for BERT-Large): 2雼硠

响�: 靷爠顷欖姷 **觳橂Μ霟�*(Pre-training throughput)***

Pre-training throughput table

韺岇澑韸滊嫕 (Fine-tuning)

靾樄 臧涤潣顷欖姷鞓堨牅毳� 顷勋殧搿� 頃樀鐢 BERT毳� 於╇秳颂� 顷欖姷鞁滍偍頉�, 氙鸽Μ 顷欖姷霅� 鞚� 臧赌欷戩箻毳� 霠堨澊敫旍澊歆赌鞝曤悳鞝侅澏� 巩戩潣雿办澊韯半ゼ鞚挫毄顷橃棳韮涤姢韥硠韺岇澑韸滊嫕顷欖姷顶勲靹胳姢鞚� 齑堦赴臧赌欷戩箻搿� 靷毄顷� 靾� 鞛堨姷雼堧嫟.

pre training and fine tuning BERT

靷爠顷欖姷氚� 韺岇澑韸滊嫕 BERT(Pre-training and fine-tuning BERT)

鞚� 2雼硠靹れ爼氚╈嫕鞚赌雼れ潓瓿� 臧欖澏� 鞚挫爯鞚� 鞝滉车顷橁赴霑岆鞐� 鞁れ牅搿� 雱愲Μ 靷毄霅╇媹雼�.

氇摖韺岇澑韸滊嫕鞛戩梾鞚� 鞙勄甏 BERT 氇嵏鞚� 顷� 氩堧 靷爠顷欖姷鞁滍偆氅� 霅╇媹雼�.
靷爠顷欖姷霅� 鞚� 氇嵏鞚� 韺岇澑韸滊嫕顷� 瓴届毎霠堨澊敫旍澊歆赌鞝曤悩歆赌鞎婌澏� 雿办澊韯半 鞖办垬顷� 鞛戩梾靹彪姤鞚� 甑槃顷� 靾� 鞛堨溂氙赌搿� 鞛戩梾氤� 雿办澊韯办棎霠堨澊敫旍潉歆€鞝曧晿电� 雿� 毵庫澏� 云鸽牓鞚� 旮办毟鞚� 頃勳殧臧赌鞐嗢姷雼堧嫟.

韺岇澑韸滊嫕鞚赌顷欖姷雿办澊韯� 靹疙姼鞚� 韥赴鞐� 霐半澕 IPU POD4 霕惖鐢 IPU POD16鞐愳劀氇� 攵� 雮挫 氇� 鞁滉皠雮挫棎鞕勲顷� 靾� 鞛堨姷雼堧嫟. 毵庫澏� 韺岇澑韸滊嫕顷欖姷鞚� 靻岆焿鞚� 顷欖姷靹疙姼韺姢鞓る矂臧赌觳橂Μ霅� 鞚错泟鞐� 欷戩霅� 靾� 鞛堨姷雼堧嫟.

SQuAD v1.1

鞀ろ儬韽摐歆堨潣鞚戨嫷雿办澊韯� 靹疙姼(: Stanford Question Answering Dataset) v1.1鞚赌 500臧� 鞚挫儊鞚� 云茧鞐� 鞛埖鐢 100,000臧� 鞚挫儊鞚� 歆堨潣鞚戨嫷鞂嶌澊韽暔霅� 雽赌攴滊 霃吳甏霠� 雿办澊韯� 靹疙姼鞛呺媹雼�.

鞎勲灅响湹鐢靷爠顷欖姷霅� 彀胳“ 氚� IPU 靷爠顷欖姷臧赌欷戩箻毳� 靷毄顷橃棳 IPU鞐愳劀 SQuAD v1.1 鞛戩梾鞚� 韱登甏 BERT-Large毳� 韺岇澑韸滊嫕顷� 霑岇潣鞝曧檿霃勲ゼ氤挫棳欷嶋媹雼�. 鞁涤棸霅� 氚旍櫠� 臧欖澊, IPU电� 鞚� 鞛戩梾鞐愳劀雴掛澏� 彀胳“ 鞝曧檿霃勲ゼ氤挫棳欤缄碃鞛堨姷雼堧嫟.

响�: SQuAD 1.1 鞛戩梾鞚� ***IPU*鞐愳劀鞚� 鞝曧檿霃�**

CLUE

雼れ潓鞐� 靷错幋氤� 雿办澊韯� 靹疙姼电� 靷爠顷欖姷霅� Google 臧赌欷戩箻毳� 靷毄顷橃棳 IPU鞐愳劀欷戧淡巩� 鞚辞甏霃� 韽夑岸�(CLUE: Chinese Language Understanding Evaluation) 鞛戩梾瓿� 顷粯 BERT-Base毳� 韺岇澑韸滊嫕顷� 霑岇潣鞝曧檿霃勲ゼ氤挫棳欷嶋媹雼�.

CLUE 鞝愳垬电� 氇摖 CLUE 鞛戩梾鞐� 雽€顷� 韰岇姢韸� 鞝曧檿霃勋潣韽夑窢鞛呺媹雼�. 臧� 鞛戩梾鞚� 韰岇姢韸� 鞝曧檿霃劦鐢 5臧赌歆€ 鞁ろ棙瓴瓣臣鞚� 韽夑窢鞛呺媹雼�. 鞎勲灅响滌棎雮橃櫠� 鞛埖鐢瓴冹矘霟� IPU电� DGX-1 V100瓿� 臧欖澏� AI 顶岆灚韽缄臣霃欖澕顷� 鞝曧檿霃勲ゼ雼劚顷� 靾� 鞛堨姷雼堧嫟.

响�: GPU 氚� IPU鞚� CLUE 鞛戩梾鞝曧檿霃�

CLUE task accuracy on GPU and IPU

AI 鞝勲臧赌电� 氇� 臧赌歆€ 旮半姤斓涤爜頇旊ゼ韱登甏 IPU-POD 鞁涤姢韰涤潉靷毄顷橃棳鞝曧檿霃勲ゼ鞙犾顷橂┐靹� BERT-Large鞚� 顷欖姷鞁滉皠鞚� 韥矊雼稌顷� 靾� 鞛堨姷雼堧嫟. 歆赌旮堦箤歆赌靷错幋氤� 氚旍櫠� 臧欖澊靸堧鞖� 顷橂摐鞗柎鞎勴偆韰嶌矘鞐愳劀 BERT鞕赌臧欖澏� 雽赌顺� 氇嵏鞚� 鞁ろ枆頃樀鐢瓴冹澊靸濌皝氤措嫟毵れ毎臧勲嫧顷╇媹雼�. 毵庫澏� 臧滊皽鞛愲秳霌れ澏� 鞐赴鞐� 靹る獏霅� 斓涤爜頇� 旮办垹鞐� 鞚措 鞚奠垯顷橃嫟靾橂弰鞛堨姷雼堧嫟. 霕惽隃鞖半Μ电� 氚� 甑槃鞛愲毳� 瓿店皽顷橃棳氇摖毹胳嫚霟嫕鞝勲臧赌臧赌鞚措煬顷� 顶勲爤鞛勋泴韥ゼ靷毄顷橃棳 IPU鞐愳劀 BERT毳� 鞁ろ枆頃樀鐢氚╇矔鞚� 靷错幋氤� 靾� 鞛堧弰搿� 頄堨姷雼堧嫟.

BERT鞕赌臧欖澏� 雽赌顺� 氇嵏鞚� 鞚挫毄顷� 斓涤儊鞚� 鞛戩梾靹彪姤鞚� 雼劚顷橁赴鞙勄隃鞐瓣惮鞛愳櫠� 鞐旍雼堨柎霌れ潣旮半寑臧赌鞝愳爯雿� 歃濌岸捻晿氅挫劀顷橂摐鞗柎须湪靹膘澊欷戩殧顷� 鞐隊鞚� 顷橁矊霅� 瓴冹瀰雼堧嫟. 歆赌旮堦箤歆赌鞖半Μ电� IPU-POD 鞁涤姢韰涤潉靷毄頄堨潉霑� BERT-Large 氚� 鞙犾偓氇嵏鞚� 鞝曧檿霃勲繍毵� 鞎勲媹霛� 靸侂嫻顷� 靹彪姤頄レ儊鞚� 鞚挫爯霃� 巩混潉靾� 鞛堧嫟电� 瓴冹潉鞎� 靾� 鞛堨棃鞀惦媹雼�. IPU 顶勲靹胳劀鞎勴偆韰嶌矘鞚� 瓿犾湢顷� 韸轨劚鞚赌鞓る姌雮� 臧赌鞛� 靹犾 氇嵏鞚� 靹彪姤鞚� 臧赌靻嶍檾頃樀鐢霃欖嫓鞐� 鞖半Μ鞐愱矊鞚奠垯顷� 靻岉攧韸胳洦巩� 頇橁步鞐� 鞏挫毟毽鐢氙鸽灅鞚� 斓涤波雼� 氇嵏鞚� 臧滊皽頃樀鐢雿办棎霃� 鞎勋澊霐旍柎毳� 鞝滉车顷╇媹雼�.

鞚� 鞛戩梾鞚� 鞚措亴巩� 欤检嫚氇摖鞐旍雼堨柎攵勲摛鞐愱矊臧愳偓霌滊雼堧嫟.

James Briggs, Oskar Bunyan, Lorenzo Cevolani, Arjun Chandra, Nic Couronneau, Lakshmi Krishnan, Guoying Li, Visu Loganathan, Sam Maddrell-Mander, Zhiwei Tian, Sylvain Viguier, Xian Wang, Xihuai Wen, ChengShun Xia, Han Zhao.

鞙勋潣鞚措 鞕胳棎霃�, IPU 鞁涤姢韰涤棎靹滌潣 BERT鞚� 甑槃氚� 斓涤爜頇旊ゼ歆€鞗惽甏欤检嫚攴鸽灅顶勋綌巩挫潣 BERT 巩错攲毽紑鞚挫厴, PopART, TensorFlow, PyTorch, GCL 氚� Poplar 韺赌鞐愲弰臧愳偓霌滊雼堧嫟.

攴鸽灅顶勋綌巩� IPU鞕赌 BERT-LARGE 氇嵏顷欖姷

BERT鞚� 攵赌靸�

IPU-POD鞐愳劀鞚� BERT 靷爠顷欖姷

攴鸽灅顶勋綌巩挫潣 TensorFlow, PyTorch, PopART鞐愳劀鞚� BERT 甑槃