人工智慧畫畫 [AI 畫家(文字轉圖片/草稿轉圖片) GITHUB]

人工智慧畫畫 [AI 畫家(文字轉圖片/草稿轉圖片) GITHUB]

人工智慧畫畫 [AI 畫家(文字轉圖片/草稿轉圖片) GITHUB]


1. Latent Diffusion

Stable Diffusion 是 Stability AI 和 Runway 合作的研究成果,基於計算機視覺頂會 CVPR 2022 的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》。

根據官方的描述,Stable Diffusion 僅僅需要幾秒就能根據文本生成高分辨的圖像。

開源位址1:https://github.com/CompVis/stable-diffusion
開源位址2:https://github.com/CompVis/latent-diffusion


2. PI-REC

這個開源專案不是根據文字生成圖片描述,但是也非常有趣。 你畫一幅肖像畫的時候需要怎麼做?

一般先勾勒出輪廓,然後再給輪廓中的區域上色,比如頭髮是黑的,眼睛是黑的,臉是黃色的。 當完成了輪廓的勾勒和上色,也基本完成了一副肖像畫。

基於這個想法,PI-REC 模擬了人畫畫的過程,使用 PI-REC 時 你只需要勾勒輪廓+上色,AI 就根據你畫的輪廓和上色的結果生成一張高清的肖像畫。

開源專案:https://github.com/youyuge34/PI-REC#jump_zh


3. Disco Diffusion

Disco Diffusion
這個開源專案也推薦過一次,文本生成圖像的效果堪稱 Bug 級別,並且提供了 Notebook 方便你快速體驗。

開源位址:https://github.com/alembics/disco-diffusion


4. DALLE

DALLE
本開源專案基於論文《Zero-Shot Text-to-Image Generation》,也是一個使用文本來生成圖片的開源專案。 來看看這個開源專案的效果:

開源位址1:https://github.com/lucidrains/DALLE2-pytorch
開源位址2:https://github.com/openai/DALL-E
開源位址3:https://github.com/borisdayma/dalle-mini

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *