江溪中文 > 重生之AI教父 > 378. 繪圖AI的三種形式

      378. 繪圖AI的三種形式

          【377是當(dāng)選的內(nèi)容肯定是出不來了,378前半部分和諧了,不能寫,我把后半部分放免費(fèi)章節(jié)在這里吧。】

          不論大家的觀點(diǎn)如何離譜,對于AI領(lǐng)域的關(guān)注隨著大選節(jié)節(jié)攀升也是不爭的事實(shí)。

          這種熱度在孟繁岐宣布即將發(fā)布真正的,能夠根據(jù)文本繪圖的人工智能后,來到了一個(gè)新的巔峰。

          因?yàn)榻咏肽曛埃戏贬懦龅脑囉冒姹綜lip就已經(jīng)展現(xiàn)了相當(dāng)出色的繪圖能力和多模態(tài)理解能力。

          好到大家都以為這東西是專門為了AI繪圖而研發(fā)的。

          結(jié)果沒想到,僅僅只是加入了圖像和文本之間的對應(yīng)關(guān)系,模型就很快自發(fā)的擁有了如此之強(qiáng)的圖像生成能力。

          而且半年前就已經(jīng)那么驚人了,現(xiàn)在那還得了?

          對于萬眾期待的AI繪圖,內(nèi)部的研發(fā)其實(shí)并不順利,這點(diǎn)從發(fā)布時(shí)間上就能夠看出。

          孟繁岐也猶豫了相當(dāng)一段時(shí)間,應(yīng)該具體選擇怎樣的路線。

          前世最為著名的AI圖像生成器,主要是StableDiffusion,Midjourney和DALLE三個(gè)。

          其中SD擴(kuò)散模型是基于Clip的文本生成圖像模型,它的方式是從有噪聲的情況開始,逐漸改善圖像,直到完全沒有噪聲,逐步接近所提供的文本描述。

          它的訓(xùn)練方式也已經(jīng)經(jīng)過了多次的研究打磨,先采樣一張圖片,并隨著時(shí)間的推移逐漸增加噪聲,直到數(shù)據(jù)無法被識別。隨后讓模型嘗試將圖像回退到原始形式,在此過程中學(xué)習(xí)如何生成圖片或其他數(shù)據(jù)。

          這種路線如其名字stable一樣,非常穩(wěn)定,不過倘若想要生成非常高質(zhì)量的圖像,計(jì)算消耗非常之大。

          技術(shù)上已經(jīng)達(dá)成,但在成本上,似乎目前不是很適合投入市場。

          前世的Midjourney則比較擅長各種藝術(shù)化的風(fēng)格,生成的圖像常有非常精美的結(jié)果。

          隱姓埋名,一舉奪得繪畫大賽金獎(jiǎng)的那副【太空歌劇院】便是Midjourney的作品。

          按理來說,這個(gè)路線更具美感,既能夠起到震撼宣傳的效果,又能吸引大量用戶,應(yīng)該是上上之選。

          不過對比開源的擴(kuò)散模型辦法,Midjourney使用的是公共平臺機(jī)器人來處理用戶的請求。