江溪中文 > 重生之AI教父 > 第163章 165. 底褲都給你看光

      第163章 165. 底褲都給你看光

          已經(jīng)成名的孟繁岐,如今在研發(fā)技術(shù)又或者是寫作論文的時候,是否具備理論解釋已經(jīng)不在考慮的范圍當(dāng)中。

          在這個比較特殊的領(lǐng)域,算法的實際效果和應(yīng)用范圍才是他關(guān)注的重點。

          雖然學(xué)界接受這一現(xiàn)象可能還需要一定的時間。

          但這已經(jīng)不是孟繁岐關(guān)心的事情了,在人工智能技術(shù)上面,他一直都是實踐派。

          結(jié)構(gòu)重參數(shù)化雖然在數(shù)學(xué)上反直覺,但實際的效果確實相當(dāng)驚艷。

          它的主要提升來自兩方面,一當(dāng)然是分支合并帶來的提升,原本復(fù)雜的支路在推理的時候被合并了起來,節(jié)約了計算量。

          二卻是來自一般人想不到的性能提升。

          結(jié)構(gòu)的重參數(shù)化,既然可以合并復(fù)雜分支,那為什么不在訓(xùn)練的時候,把分支設(shè)計得更加復(fù)雜一點呢?

          反正最后都可以合并起來。

          遵循這個思路,重參數(shù)化還允許相同的最終結(jié)構(gòu),通過復(fù)雜訓(xùn)練的方式獲得更高的性能。

          作為最終的結(jié)果,重參數(shù)化在輕量級網(wǎng)絡(luò)上,大概取得了1.8倍左右的速度提升。

          這個數(shù)字看起來沒有先前8-9倍那么夸張,但這是在已經(jīng)優(yōu)化的高速網(wǎng)絡(luò)上取得的結(jié)果。

          在已經(jīng)優(yōu)化得很好的結(jié)果之上,繼續(xù)優(yōu)化的難度當(dāng)然是更大的,同樣是一秒鐘的速度提升,后面的那一秒含金量當(dāng)然不可與前面的同日而語。

          就像是百米長跑,原本只能30秒跑完,提升一秒沒什么大不了的。

          可若是你能跑到10秒左右,再快一秒那可就不得了了,博爾特看了都得給你跪下。

          博爾特跪不跪下不知道,馬斯克確實是差點跪下了。

          他上次與孟繁岐的溝通,一定程度上算是雞同鴨講。

          從相當(dāng)程度上,他只是在單純客觀地分析一個現(xiàn)實情況,那就是目前的模型計算量,對特斯拉來說很難負擔(dān)。