江溪中文 > 重生之AI教父 > 378. 繪圖AI的三種形式

      378. 繪圖AI的三種形式

          【377是當選的內容肯定是出不來了,378前半部分和諧了,不能寫,我把后半部分放免費章節在這里吧。】

          不論大家的觀點如何離譜,對于AI領域的關注隨著大選節節攀升也是不爭的事實。

          這種熱度在孟繁岐宣布即將發布真正的,能夠根據文本繪圖的人工智能后,來到了一個新的巔峰。

          因為接近半年之前,孟繁岐放出的試用版本Clip就已經展現了相當出色的繪圖能力和多模態理解能力。

          好到大家都以為這東西是專門為了AI繪圖而研發的。

          結果沒想到,僅僅只是加入了圖像和文本之間的對應關系,模型就很快自發的擁有了如此之強的圖像生成能力。

          而且半年前就已經那么驚人了,現在那還得了?

          對于萬眾期待的AI繪圖,內部的研發其實并不順利,這點從發布時間上就能夠看出。

          孟繁岐也猶豫了相當一段時間,應該具體選擇怎樣的路線。

          前世最為著名的AI圖像生成器,主要是StableDiffusion,Midjourney和DALLE三個。

          其中SD擴散模型是基于Clip的文本生成圖像模型,它的方式是從有噪聲的情況開始,逐漸改善圖像,直到完全沒有噪聲,逐步接近所提供的文本描述。

          它的訓練方式也已經經過了多次的研究打磨,先采樣一張圖片,并隨著時間的推移逐漸增加噪聲,直到數據無法被識別。隨后讓模型嘗試將圖像回退到原始形式,在此過程中學習如何生成圖片或其他數據。

          這種路線如其名字stable一樣,非常穩定,不過倘若想要生成非常高質量的圖像,計算消耗非常之大。

          技術上已經達成,但在成本上,似乎目前不是很適合投入市場。

          前世的Midjourney則比較擅長各種藝術化的風格,生成的圖像常有非常精美的結果。

          隱姓埋名,一舉奪得繪畫大賽金獎的那副【太空歌劇院】便是Midjourney的作品。

          按理來說,這個路線更具美感,既能夠起到震撼宣傳的效果,又能吸引大量用戶,應該是上上之選。

          不過對比開源的擴散模型辦法,Midjourney使用的是公共平臺機器人來處理用戶的請求。