← 補充單元 相關等級:L2
🎨
工具 · 圖像

Gemini 圖片生成實戰

好的 Prompt 不是天賦,是工程

模糊指令 vs 結構化 Prompt

同一主題,Prompt 的品質決定了圖片的品質。看看差距有多大:

❌ 模糊指令 模糊Prompt結果

「畫一張 AI 幫助人類工作的圖」
風格隨機,每次結果都不同

✅ 結構化 Prompt 結構化Prompt結果

指定主體、風格、光線、比例
穩定複現,符合預期


三層構建法:逐層加上去

What(主體)→ How(技術參數)→ Meta(風格),三層堆疊,精準度逐步提升。

同一場景——科學家在實驗室——三種 Prompt 深度的效果:


鏡頭語言:同場景,不同焦段

焦段不同,畫面說的故事就不同。固定場景:Engineer writing on whiteboard in office


光線控制:同場景,不同光線

光線決定情緒。固定場景:Portrait of a CEO at a desk, 85mm lens, f/2.8


風格控制:同主題,七種風格

主題固定:「工程師在白板前討論架構」,只換風格前綴,呈現完全不同的視覺語言。


風格一致性:為什麼要固定風格前綴

沒有固定風格前綴,三張圖三種樣子,放在同一份簡報裡觀感零散。

做法:建立一個「風格前綴模板」,每次只換主體內容:

[Style prefix]: cinematic shot, professional photography,
                dramatic side lighting, film grain
[Subject]:      (每次換這裡)
[Technical]:    85mm lens, f/2.8, shallow DOF

Image Grounding:真實場景 vs 泛用生成

需要特定地點或物件時,不描述「一個歌劇院」,而是給 AI 參考圖片。

❌ 沒有 Grounding 無Grounding

「A beautiful opera house by the harbor at sunset」
AI 生一個通用歌劇院,形狀細節全不對

✅ 有 Grounding 有Grounding

提供參考圖 + 描述
保留真實特徵,加上你想要的光線/氛圍


概念視覺化:從抽象到具體

簡報最常見的需求:把一個抽象概念(AI 協作、創新、數據)變成一張圖。


三層構建法 Prompt 模板

可以直接複製,替換括號內的部分:

[Style]: Professional, clean, modern illustration
         (可換: cinematic / flat design / watercolor)

[Subject]: (概念的視覺比喻)
           例: interlocking gears representing system integration

[Technical]: high resolution, white background,
             16:9 aspect ratio, no text in image

[Mood]: (可選) corporate, innovative, collaborative

L2「AI 個人助手與自動化」課程中,會有 Gemini Prompt 工程實作工作坊,從三層構建法到風格前綴模板,每個學員建立自己的「配圖 Prompt 庫」。