【DALL·E】如何用 OpenAI 生成照片？DALL·E 終極教學

DALL·E 是 OpenAI 開發的 AI 繪圖模型，專門用於生成 AI 圖像以填補 ChatGPT 中只能輸入及生成文字的限制。 DALL·E 能夠通過文字指令的描述來生成、編輯並修改各種圖像。本文將帶您深入了解 DALL·E 的功能和應用，介紹 DALL·E 背後的運作原理及各種常見問題。

DALL·E 是甚麼？和 ChatGPT 有分別嗎？

DALL·E 採用了和 ChatGPT 一樣 Transformer 神經網絡算法作為該 AI 繪圖工具的核心結構。這種架構下的機器學習（Machine Learning）將用家輸入的文字描述進行分析和編碼，然後生成對應的圖像。不同於 ChatGPT 只處理文本的限制，DALL·E 的 Transformer 結構透過特定的訓練理解文字和圖像之間的關連來實現文字到圖像的轉換和生成。除了生成圖像外，用家可以在 DALL·E 裏上傳圖像，DALL·E 可以根據輸入的指令（prompt）生成超出原本圖像邊界的繪圖，甚至可以在圖像中添加陰影和修改細節。

DALL·E 發展史：從第1代到第2代

DALL·E 1 模型利用 Discree Variational Auto-Encoder （dVAE）以生成 256×256 的圖像。dVAE 從 VQ-VAE（Vector Quantization Variational Auto-Encoder）進化而成，是生成模型（Generative Models）在利用離散潛在表示（Discrete Latent Representations)上的一大改進。原生的VQ-VAE通過結合VAE框架及向量量化（Vector Quantization）來解決後驅崩潰（Posterior collapse）等問題，並可以更有效地利用潛在空間（Latent Space）來捕捉有較意義的特徵。

source : Van den Oord et al. 2017

dVAE通過對編碼和解碼過程進行了改進，並引入更複雜的方法來編碼圖像和生成離散表示來改進模型。DALL·E1的模型訓練步驟為

其後在預測過程中，dVAE通過學習的編碼本預測 Image Token，然後使用dVAE解碼器解碼Image Token，並使用CLIP模型評級器選擇最佳圖像。

Source: vaclavkosar.com

CLIP 是一個由 OpenAI 推出的模型，其功用為將圖像和文本編碼成相似的嵌入向量。該模型的訓練數據集來自 WebImageText，數據包含從互聯網獲取的各種圖像和其相關標題文本，總數約 4億條。CLIP 模型使用對比學習（Constrative Learning）進行訓練，通過最大化相對應圖像和文本之間的餘弦相似度（Cosine Similarity）來編碼圖像和文本的嵌入向量。

Source: vaclavkosar.com

在 DALL·E 2 的模型訓練中，首先模型會為文本直接生成一個 CLIP 模型的文本嵌入，接著將文本嵌入生成為圖像嵌入，最後擴散解碼器（Diffusion Decoder）通過圖像嵌入生成圖像。此方法可以在保留文本嵌入中的風格和語義的情況下變化圖像。

Source: vaclavkosar.com

比較 DALL·E 1 及 DALL·E 2 生成圖像

Source: https://simplified.com/blog/ai-text-to-image/DALL·E-1-vs-DALL·E-2/

DALL·E 功能概覽

DALL·E 的主要功能分為兩個部分，以文字生成圖像（Generate）及上傳並編輯圖像（Edit）、填補空白（Out-painting）和重製變化版（Variations）。相較於其他的AI繪圖工具，DALL·E 的界面亦相對比較簡單易用，用家可以較易上手。以下Preface為你詳細介紹DALL·E的主要功能：

1. 文字生成圖像（Generate）

與其他AI繪圖工具一樣，DALL·E的第一個功能為以文字生成圖像。用家只需要在輸入欄輸入指令（Prompt），DALL·E便可以為你生成對應的AI圖像。你亦可以使用「Surpries Me」來指示DALL·E生成隨機的指令。按下「Generate」後AI會根據指令生成六張圖像，按下其中一張你便可以得到一張1024x1024像素的圖像。要得到更細膩的圖像你便需要輸入更詳盡的指令，Preface為你解構AI繪圖指令技巧。

2. 重製變化版（Variations）

當你使用文字生成圖像後，你可以選擇任何一像圖像並重製變化版。按下界面上的「Variations」按鍵後，DALL·E會根據你的選項再生成五張額外的圖像變化。除了使用由AI為你生成的圖像重製變化版外，你亦可以上傳自選的圖像進行變化重製。首先在界面上選擇「Upload an image to edit」，上傳後選擇「Generate Varations」，DALL·E便會為你生成自選圖像的變化版。要注意的是，用家並不可以使用額外的文字指令來指示DALL·E如何為你的圖像重製變化。

3. 編輯圖像（Edit）

雖然重製變化版並不能夠使用文字指令，DALL·E的編輯圖像功能容許用家並用文字指令。上傳圖片後選擇「Edit Image」並選擇橡膠圖案「Eraser」，輸入指令指示你希望DALL·E如何重製你擦去的空白位，AI便可以為你生成不同變化的圖像細節。以下為Dallery.Gallery的重製示範。

Photo:

4. 填補空白（Out-painting）

DALL·E不單可以為你生成圖像內的空白位變化版外，其一功能「填補空白」可以生成圖像以外的圖像填充。

Photo:

source: Zapier

如何開始使用 DALL·E？

步驟 1:

您需要有 OpenAI 的帳户來使用 DALL·E。 Preface 爲你介紹如何在香港地區開設OpenAI帳户。

步驟 2:

進入 DALL·E 的網站（https://labs.openai.com/）並根據本文上述的功能概覽簡介開始使用 DALL·E。

步驟 3:

現時 DALL·E 並未有提供免費試用，想使用 DALL·E 的用家需要購買 credit 來生成圖像。

DALL·E 收費

現時 DALL·E 收費為每 115 credit 約 15美元。 DALL·E 會根據圖像的解像度來決定圖像生成需要使用的 credit 數量。以下為各解像度的美元收費

DALL·E 常見問題

Q1: DALL·E 有使用限制嗎？

A1:

Q2: DALL·E 是免費的嗎？

A2:

DALL·E 只爲在 2023年4月6日前創建的帳户提供每月免費 credit。每月的免費 credit 都會在該月後失效。除此以外，新用家需要購買 credit 使用 DALL·E。

AIGenerative AIImage GenerationDALL·EDall EOpenAIAI/MLMachine LearningTransformer

Just Start 啟動香港．重新學習｜AI 時代．為何每一位香港人都應該「主修 AI」？｜領袖的全城推動．AI 實踐之旅

在全球 AI 化的關鍵轉折點，率先公開表態「決心投入 AI 學習」的，不是科技公司工程師，而是來自金融、教育、創科與專業服務等不同領域的企業領袖與行業決策者。他們深知 AI 將重塑商業競爭力與整個城市的未來，因此選擇以行動示範——主動學習、主動轉型、主動擁抱新科技。作為香港推動 AI 教育的先行者，Preface 積極聯繫大型企業、學校及社會機構，邀請他們成為推動 AI 素養（AI Literacy）的「首批示範者」。透過跨界合作，我們希望讓領袖們以身作則，向全港學生與大眾展示。

Poe APP、Website全中文使用教學、優缺點及收費 |和 ChatGPT 有何分別?

眾多基於AI語言模型所開發的應用之中，Poe為何能脫穎而出受到大眾的青睞呢？如果你還不知道Poe，並且躍躍欲試，那麼本文亦會提供詳細的教程，讓你了解Poe的優缺點，並知曉如何透過Poe使用並體驗最新的AI語言模型。

OpenAI's 5 Steps Towards Artificial General Intelligence (AGI)

We first provided an overview of how OpenAI, the leading AI organisation that created ChatGPT, envisions a progression towards AGI through five distinct stages: Conversational AI, focused on language understanding and generation; Reasoning AI, enabling complex problem-solving and decision-making; Autonomous AI, acting independently within environments; Innovator AI, driving new discoveries and technologies; and Organisational AI, capable of coordinating and optimising complex systems.

商湯科技粵語版 AI「商量 SenseChat」下載教學｜主打香港市場的 AI App｜實測比較 ChatGPT｜TechBites

商湯科技近日推出「商量」SenseChat AI，主打粵語能力和香港在地化體驗。到底 SenseChat App 如何下載，與 ChatGPT 比較起來又有甚麼過人之處？讓 Preface TechBites 為你仔細分析！

OpenAI 限制中國、香港地區 ChatGPT API｜個人、企業用戶處理懶人包｜TechBites

OpenAI 旗下的 ChatGPT 一直未正式登陸中國及香港，近日更有不同用戶收到 OpenAI 的電郵通知，表示由7月9日起會封鎖「不支援國家和地區」的 API 使用權，意味著不能直接使用 ChatGPT 之餘，亦不能使用 API 進行開發。到底今次禁令影響有多深遠？讓 Preface TechBites 與你跟進今次事件！

Company

Kids

Adults

Corporates & Schools

Lifestyle

Privacy Terms Shop G07, G/F - 2/F Tower 535, 535 Jaffe Road, Causeway Bay, HK hello@preface.ai

Kids

Adults

Corporates

Lifestyle

About Us

Blog

Sign In

【DALL·E】如何用 OpenAI 生成照片？DALL·E 終極教學

DALL·E 是甚麼？和 ChatGPT 有分別嗎？

DALL·E 發展史：從第1代到第2代