Gemini 圖片生成實戰
好的 Prompt 不是天賦,是工程
模糊指令 vs 結構化 Prompt
同一主題,Prompt 的品質決定了圖片的品質。看看差距有多大:
「畫一張 AI 幫助人類工作的圖」
風格隨機,每次結果都不同
指定主體、風格、光線、比例
穩定複現,符合預期
三層構建法:逐層加上去
What(主體)→ How(技術參數)→ Meta(風格),三層堆疊,精準度逐步提升。
同一場景——科學家在實驗室——三種 Prompt 深度的效果:
A scientist examining samples in a laboratory
隨機角度、隨機光線
+ 85mm lens, f/2.8, shallow depth of field
主體清晰,背景虛化
+ cinematic lighting, professional photography
完全不同的視覺質感
鏡頭語言:同場景,不同焦段
焦段不同,畫面說的故事就不同。固定場景:Engineer writing on whiteboard in office
寬廣視角,透視變形
強調空間與環境
自然視角,接近人眼
適合情境記錄
主體突出,背景壓縮
商業人像首選
強烈背景模糊
戲劇性壓縮效果
光線控制:同場景,不同光線
光線決定情緒。固定場景:Portrait of a CEO at a desk, 85mm lens, f/2.8
柔和散射光
友善、商業、無陰影
黃金時段側光
溫暖、有故事感
戲劇性側光
強勢、有力、高端感
霓虹/攝影棚光
科技感、現代、個性
風格控制:同主題,七種風格
主題固定:「工程師在白板前討論架構」,只換風格前綴,呈現完全不同的視覺語言。
cinematic shot, dramatic side lighting, film grain
professional photography, natural lighting
3D cartoon style, vibrant colors, Pixar-like
watercolor illustration, soft brushstrokes
flat design illustration, minimal, vector-style
infographic style, clean icons, diagram
風格一致性:為什麼要固定風格前綴
沒有固定風格前綴,三張圖三種樣子,放在同一份簡報裡觀感零散。
Style prefix 一致
整份視覺有整體感
做法:建立一個「風格前綴模板」,每次只換主體內容:
[Style prefix]: cinematic shot, professional photography,
dramatic side lighting, film grain
[Subject]: (每次換這裡)
[Technical]: 85mm lens, f/2.8, shallow DOF
Image Grounding:真實場景 vs 泛用生成
需要特定地點或物件時,不描述「一個歌劇院」,而是給 AI 參考圖片。
「A beautiful opera house by the harbor at sunset」
AI 生一個通用歌劇院,形狀細節全不對
提供參考圖 + 描述
保留真實特徵,加上你想要的光線/氛圍
概念視覺化:從抽象到具體
簡報最常見的需求:把一個抽象概念(AI 協作、創新、數據)變成一張圖。
人手 + 機器手握手
flat design, blue and white
光點串連成流動路徑
data stream visualization
燈泡爆發光芒
lightbulb with energy burst
齒輪嚙合運作
interlocking gears, clean icons
三層構建法 Prompt 模板
可以直接複製,替換括號內的部分:
[Style]: Professional, clean, modern illustration
(可換: cinematic / flat design / watercolor)
[Subject]: (概念的視覺比喻)
例: interlocking gears representing system integration
[Technical]: high resolution, white background,
16:9 aspect ratio, no text in image
[Mood]: (可選) corporate, innovative, collaborative
L2「AI 個人助手與自動化」課程中,會有 Gemini Prompt 工程實作工作坊,從三層構建法到風格前綴模板,每個學員建立自己的「配圖 Prompt 庫」。