創作靈感來源於我小時候的一個經歷:大概5歲的時候,我在花園裏發現了一只小刺猬,特別喜歡,於是我強行收養了它一段時間,後來我帶它去麥田裏玩耍的時候,它悄悄跑掉了,先呈現下最終效果圖:
生成步驟
故事創意: 可以是一個角色、一個場景、一個情感或任何能激發創造力的元素。例如,構思了一個場景:「小女孩波妞在花園裏發現了一只小刺猬」。
使用GPT拓展故事場景: 擁有了初始創意後,轉向GPT來豐富這個故事。我們可以和GPT討論這個場景/角色的細節,比如小姑娘的外形,小刺猬的特點等,結合我們自己的預期來明確角色的典型特征,然後GPT可以繼續幫助我們構建故事的背景,提供人物對話,甚至構思可能的情節發展。
使用GPT生成DALL-E提示: 利用GPT提供的場景描述,我們接著建立一個DALL-E提示,用於生成對應的繪本插畫。
使用DALL-E生成插畫: DALL-E可以將自然語言提示轉化為一幅繪本插畫。DALL-E的強大能力可以捕捉我們透過文字所描述的細節,並將其具象化。
透過繪圖軟體進行編輯 :給插畫添加故事場景文字說明。
經驗總結
風格一致性: 保持整個故事中插畫的風格一致是個很大的挑戰,尤其是當每幅影像都是獨立生成時。
細節問題導致的生成品質不一: DALL-E在處理復雜指令時無法精確控制影像中的所有細節,導致結果與預期有所偏差,細節不夠時候,生成的影像很容易不符合預期,需要多次修改提示語,一步步試驗總結才得到了滿意的結果。
故事與影像的整合: 故事情節可能需要根據生成的影像進行調整,或者反過來,這可能會影響故事的連貫性和流暢性。
其他: 能明顯感覺到 DALL-E 在風格多樣化的影像方面表現不如 Midjourney ,但是影像細節完成方面要比 Midjourney 好一些,DALL-E 太ZZ正確了,只要提示語帶著黑眼睛和黑頭發的特征,就很容易生成黑皮膚非裔小女孩。