Vibe Coding — Stage 1 · 用 AI
M1-2

Vibe Coding 實戰課 — Stage 1 · 用 AI

把作品變成
AI 助手

從聊天到封裝、從文字到圖像 — AI 的產出超乎你想像

M1-2 3 小時 6 輪循環 帶走 AI 助手

按 → 或空白鍵開始

M1-1 回顧:你已經會的事

Prompt 四要素

角色、任務、格式、限制
結構化指令產出高品質作品

介面判斷力

首屏、配色、字級、CTA
從「能用」升級到「好用」

迭代修正

描述問題 → AI 修正
反覆對話到滿意為止

M1-1 的問題:每次使用都要重新描述需求
M1-2 的目標:把指令封裝成可重複調用的 AI 助手

六輪循環,逐層遞進

Round 1
自由發揮建 GPT
Round 2
四要素改寫
Round 3
Gem 平台差異
Round 4
行銷圖文
Round 5
裝潢應用
Round 6
三平台對比

今天的升級路線
聊天 → 封裝助手 → 跨平台 → 圖文生成 → 圖片理解 → 全面對比

ROUND 1 · 0:00–0:25

自由發揮
直接建一個 GPT

不給指引,憑直覺填 Instructions,看會發生什麼

什麼是「建立 GPT」

ChatGPT 允許你建立客製化的 AI 助手
設定好 Instructions,每次開啟就自動套用

每次聊天

打開 ChatGPT → 重新描述需求
每次對話都從零開始
風格、規則、知識無法延續

建立 GPT

打開 GPT → 直接開始問
Instructions 自動載入
風格、規則、知識持續生效

從「每次手動下指令」→「預設好一次,重複使用」

操作指令

1
打開 ChatGPT → 建立 GPT

側欄 → Explore GPTs → Create

2
憑直覺填寫 Instructions

不給任何指引 — 你現在想到什麼就寫什麼

3
用三個問題測試你的 GPT

記錄回答的品質、風格、一致性

10 min
操作時間

你可能會寫出這樣的 Instructions

常見的直覺寫法
你是一個好用的助手
你是一個萬能的 AI
請用中文回答
幫我解決問題
問題

這些 Instructions 等於沒寫
AI 的預設行為就是「用中文回答」「幫你解決問題」
你的 GPT 跟直接聊天沒有任何差別

觀察:GPT 跟直接聊天差異不大

風格不穩定

每次回答語氣不同
沒有一致的人格

回答太通用

沒有領域專業性
像在問搜尋引擎

不知道你是誰

沒有上下文
每次都要重新解釋背景

學到的概念:System Prompt

GPT 的 Instructions 就是 System Prompt
它決定 AI 在這個對話中「扮演什麼角色」

模糊的 System Prompt

你是一個好用的助手

AI 沒有方向
產出隨機、不可預測

結構化的 System Prompt

你是英日翻譯專家。使用者輸入中文,你同時給出英文和日文翻譯。格式用表格

角色、任務、格式
M1-1 學的四要素直接搬進來

M1-1 的四要素 → GPT 的 Instructions

M1-1
Prompt 四要素
M1-2
GPT Instructions
關鍵認知

M1-1 你學的是「每次寫一次指令」
M1-2 是「寫一次,永久生效」
知識沒有變,只是從一次性變成可重複調用

Round 1 小結

Instructions 太模糊 = 沒寫

GPT 的價值取決於 Instructions 的品質
下一輪:用 M1-1 的四要素改寫,讓 GPT 真正有用

ROUND 2 · 0:25–0:50

四要素改寫
讓 GPT 真正有用

把 M1-1 的 Prompt 結構搬進 Instructions

操作步驟

1
用四要素改寫 Instructions

角色 + 任務 + 格式 + 限制,寫進 GPT 設定

2
上傳知識庫(1-2 個檔案)

產品規格、FAQ、個人簡歷 — 讓 GPT 有專屬知識

3
同樣三問再測 → 並排對比

Round 1 的三個問題再問一次,看差異

10 min
操作時間

Instructions 改寫範例:翻譯助手

結構化 Instructions
【角色】你是精通中英日三語的專業翻譯
回答風格簡潔、準確,不加不必要的解釋

【任務】使用者輸入中文時,同時給出英文和日文翻譯
如果原文有歧義,列出不同翻譯版本並標注情境

【格式】用表格呈現,欄位:原文 / 英文 / 日文
每個翻譯附上使用情境(正式/口語/書面)

【限制】不翻譯超過 500 字的段落
遇到專有名詞保留原文並加括號說明

改寫前後的回答差異

Round 1 — 自由發揮

問:翻譯「這個案子需要加班」

This project requires overtime work.

只有英文、沒有日文、沒有情境

Round 2 — 四要素

同一個問題,自動表格輸出

原文|英文|日文
加班(正式)|overtime work|残業
加班(口語)|work late|残業する

雙語 + 表格 + 情境,一次到位

觀察:回答穩定、一致、有風格

穩定

問十次,十次格式都一樣
不再隨機變換回答方式

一致

語氣、深度、範圍都有規範
像在跟同一個人說話

有風格

知識庫讓 GPT 有專屬知識
回答帶有你的領域背景

升級:Conversation Starters + 開場白

使用者第一次打開你的 GPT 時
看到什麼決定了他會不會繼續用

1
設定 Conversation Starters

3-4 個常見問題,讓使用者一鍵開始

2
寫好開場白

GPT 第一句話要告訴使用者:我是誰、我能幫你什麼

3
讓隔壁同學試用

「第一次用的人 30 秒內知道怎麼開始嗎?」

經典範例:高品質社群 GPT

chatgpt.com/g/translator-pro
Translator Pro

精通 12 種語言的專業翻譯助手
自動偵測語言、表格輸出、附帶使用情境

翻譯這段會議紀錄 商業書信中翻英 日文敬語怎麼用

好的 GPT 開場設計:名稱清楚 + 一句話說明能力 + 3 個 Starter 引導操作

經典範例:程式碼審查 GPT

chatgpt.com/g/code-reviewer
Code Reviewer

資深工程師視角的程式碼審查
找出安全漏洞、效能瓶頸、可讀性問題

審查這段 Python 找出安全問題 優化效能

專業 GPT 的 Instructions 包含審查框架、嚴重等級分類、輸出格式
不是「幫我看程式碼」這麼簡單

概念引出:Onboarding 設計

使用者體驗從「打開那一秒」就開始
不是從「輸入第一個問題」才開始

名稱

一看就知道這個 GPT 做什麼
不用猜

開場白

自我介紹 + 能力範圍
降低使用門檻

Starters

常見問題一鍵發送
不需要想怎麼開口

互測:讓隔壁同學用你的 GPT

1
分享 GPT 連結給隔壁同學

GPT 設定 → Share → Copy Link

2
觀察對方的使用過程

有沒有卡住?有沒有問「這要怎麼用」?

3
收集反饋,微調 Instructions

哪些地方不清楚 → 回去補充說明

Round 2 小結

四要素不只是 Prompt 技巧
是 AI 助手的設計方法

寫一次好的 Instructions,之後每次使用都自動套用
從「重複勞動」變成「一次封裝、永久調用」

ROUND 3 · 0:50–1:10

同一個需求
換到 Gemini Gem

平台不同,規則不同,產出不同

什麼是 Gemini 的 Gem

Google 的版本 — 功能類似 GPT,但規則不同

ChatGPT GPT
  • Instructions(System Prompt)
  • 可上傳知識庫檔案
  • Conversation Starters
  • 可分享連結
  • 啟用 Image Generation 能力後
    可在 GPT 內生成/編輯圖
Gemini Gem
  • System Instructions
  • 知識庫上傳方式不同
  • 沒有 Conversation Starters
  • 可分享連結
  • Gemini 2.5 圖像能力
    適合圖文對話式迭代

操作:用同樣的 Instructions 建 Gem

1
打開 Gemini → 建立 Gem

gemini.google.com → Gem Manager → New Gem

2
複製 GPT 的 Instructions 到 Gem

直接貼上 Round 2 寫好的四要素結構

3
同樣三問再測 → 跟 GPT 並排比較

觀察回答風格、格式、完整度的差異

10 min
操作時間

注意:Instructions 通用,但功能不同

差異在平台各自支援的功能,不在文字語法

Conversation Starters

GPT 有引導按鈕
Gem 沒有,要寫在 Instructions 裡

知識庫上傳

GPT 直接上傳檔案
Gem 透過 Google Drive 整合

圖片生成

GPT 啟用 Image Generation
Gemini 2.5 圖文迭代
Imagen 是專門模型補充

觀察:同一個 Prompt,不同平台的回答

ChatGPT GPT
格式穩定、遵從度高
知識庫整合完整
Gemini Gem
回答更發散、風格不同
多模態能力更強

差異不是「誰比較好」
而是「不同平台有不同的行為模式」

概念引出:平台鎖定 vs 可攜性

你的知識和邏輯是你的
平台只是載體

平台鎖定

只用一個平台
被迫接受它的限制
平台改版就要重來

可攜性思維

Instructions 存成文字檔
隨時搬到任何平台
知識資產永遠在自己手上

可攜性的實踐方法

1
Instructions 存成獨立文字檔

不只存在 GPT 裡 — 本地備份一份

2
知識庫檔案統一管理

不只上傳到 GPT — 雲端硬碟也存一份

3
定期測試跨平台相容性

同一個 Instructions 在 GPT / Gem / Claude 都跑一次

Round 3 小結

平台會變,你的知識不會變

把 Instructions 和知識庫當成自己的資產管理
平台只是執行環境,不是知識的歸宿

學習最快的方法
— 反向拆解別人的 GPT / Gem

1. 找到好用的 GPT / Gem

社群推薦、GPT Store
排行榜、朋友分享

2. 用 Prompt 套出邏輯

「你的角色設定是什麼?」
「你遵循哪些規則?」

3. 整理 Instructions 結構

角色 → 任務 → 格式
→ 限制 → 知識庫範圍

4. 改成自己的版本

角色換你的場景
任務換你的需求

實作:講師帶你拆解一個 GPT

1
講師挑一個公開 GPT,大家一起用

正常使用 3-5 次,觀察它的回答模式和風格

2
大家一起下 Prompt 套出設計邏輯

「你是怎麼被設計的?」「你的指令有哪些規則?」

3
整理出它的 Instructions 結構

角色 → 任務 → 格式 → 限制 → 比對你在 R2 學的四要素

4
每人改成自己的版本

換場景、換需求 → 你就有一個新的 AI 助手

ROUND 4 · 1:10–1:35

Gemini Gem
圖文一起出

行銷素材生成 — 文案 + 配圖同步產出

操作:建立行銷助手 Gem

1
進入 Round 3 的 Gem 或新建「行銷助手 Gem」

System Instructions:「你是社群行銷專家,每次回覆包含文案+配圖」

2
輸入行銷需求

「幫我做一張咖啡店新品上市的 IG 貼文,要有拿鐵的照片和文案」

3
Gem 同時產出文案 + 配圖

Imagen 自動生成圖片,不需要分兩步

迭代:一步步調整到滿意

初版圖文
換日系風格
加上價格標籤
改直式
IG Story
關鍵觀察

在 Gem 裡面,圖文一起出 → 不用分兩步
每次迭代都是「文案+圖片」同步更新

三平台的圖文生成能力

ChatGPT GPT

GPT 內生成/編輯圖

啟用 Image Generation 能力
可在 GPT 內完成圖像產出

同一助手完成

Gemini Gem

圖文對話式迭代

Gemini 2.5 圖像能力
適合邊聊邊修圖

多模態主線

Claude Project

純文字,不生圖

文案品質最精準

需搭配其他工具

Imagen 可作為 Google 專門生圖模型補充
不要把它當成 Gem 的唯一機制

注意:AI 生圖的中文字問題

已知問題

Gemini 生圖的中文字經常出現錯字、亂碼、筆畫缺失
這是目前所有 AI 生圖模型的共同限制

AI 生圖的文字

中文字筆畫錯誤

字體不一致

排列位置偏移

→ 不可直接使用

正確做法

AI 生成圖片底圖

文字部分人工後製

用 Canva 或設計工具疊加

→ 圖片 AI 做,文字你加

經典範例:Gem 生成的行銷素材

Gem 產出初稿
圖片區
標題區
新品拿鐵
午後咖啡提案
春季限定風味
人工檢查點

圖片構圖可作為初稿
中文標題改用 Canva 疊字
價格、日期、CTA 由人確認

限制點:AI 圖內中文字
容易錯字、變形或位置偏移

使用建議

先把圖片底圖跑出來,再人工處理文字與關鍵資訊

概念引出:多模態 AI(Multimodal)

同一個 AI 能同時處理文字 + 圖片
這叫做多模態能力

文字 → 文字

翻譯、寫文案、寫程式
M1-1 就在做這件事

文字 → 圖片

描述需求 → AI 生成圖片
Round 4 剛體驗過

圖片 → 文字

上傳圖片 → AI 理解分析
Round 5 要體驗的

Round 4 小結

AI 的產出不只文字 — 圖文一體是趨勢

Gemini 的 Gem 讓文案和配圖同步產出
但 AI 生圖的文字仍需人工修正 — 這是目前的能力邊界

ROUND 5 · 1:35–2:00

圖片理解
室內裝潢應用

上傳平面圖 → AI 分析 → 產出風格渲染示意圖

操作:建立室內設計助手 Gem

1
新建 Gem →「室內設計助手」

System Instructions:分析空間配置,生成風格渲染示意圖

2
上傳室內平面圖

「這是 30 坪公寓客廳平面圖,生成北歐風格 3D 渲染示意圖」

3
Gem 分析平面圖 → 產出設計說明 + 示意圖

迭代:「改工業風」「加落地窗自然光」「沙發換 L 型」

室內設計 Gem 的 Instructions

System Instructions
你是室內設計顧問

使用者上傳平面圖或室內照片時:
1. 分析空間配置(坪數、動線、採光)
2. 提出設計建議(配色、家具配置、材質)
3. 生成該空間的風格渲染示意圖

每次回覆包含:設計說明 + 渲染圖
使用者可指定風格:北歐/工業/日式/現代簡約

注意:這裡同時用到了「圖片輸入」和「圖片輸出」
AI 理解你的圖 → 產出新的圖

迭代流程:從平面圖到多風格渲染

上傳平面圖
北歐風渲染
改工業風
加自然光
Gem 的記憶在這裡發揮作用

第二張圖不用重新描述風格偏好
Gem 記得你上一輪選的風格 — 回扣 Round 3 的平台差異

觀察:AI 理解圖片的能力

圖片輸入 + 圖片輸出

上傳平面圖(輸入)
產出渲染圖(輸出)
完整的多模態循環

對話記憶生效

第二張圖自動套用
你偏好的風格設定
不需重新描述

溝通示意足夠

跟客戶溝通方向
比口頭描述清楚 10 倍
但不等於施工圖

注意:複雜輸入讓 AI 理解錯誤

問題情況

平面圖標注太多文字

尺寸線密密麻麻

多個房間同時呈現

→ Gemini 理解錯誤,渲染失真

解決方法

簡化平面圖(去除多餘標注)

分區上傳(一次一個空間)

用文字補充 AI 看不懂的部分

→ 複雜輸入要分區處理

注意:AI 渲染的比例失真

已知限制

AI 生成的 3D 渲染可能出現比例失真
窗戶大小不對、家具比例失調、空間深度不準確

AI 生圖用於溝通示意,不用於施工
作為「跟客戶溝通的方向」非常夠用

經典範例:平面圖 → 風格渲染

BEFORE — 平面圖
客廳
廚房
玄關
沙發

30 坪客廳平面圖
標注動線和傢俱位置

AFTER — Gem 渲染
比例需確認

北歐風格 3D 示意
配色、材質、光線一目瞭然

3 組 before → after 對比,讓客戶 10 秒看懂設計方向
過去需要設計師畫 3 天的示意圖,現在 3 分鐘

概念引出:AI = 初稿生成器

AI 不取代專業
但大幅降低溝通成本

AI 擅長

快速產出初稿
視覺化抽象概念
多風格快速切換

AI 不擅長

精確尺寸和比例
材質物理特性
施工細節規範

最佳定位

溝通示意用途
初期方向探索
客戶提案輔助

Round 5 小結

圖片輸入 + 圖片輸出 = 完整的多模態循環

AI 理解你的圖、產出新的圖、記住你的偏好
定位是「溝通加速器」,不是「專業工具替代品」

ROUND 6 · 2:00–2:15

跨平台實作
並排對比

沒有「最好的」— 只有「最適合這個場景的」

操作:三平台做同一件事

每人選一個場景(行銷 or 裝潢)→ 三平台並排

1
ChatGPT GPT

同樣需求 → 啟用 Image Generation 後產圖

2
Gemini Gem

Round 4/5 的結果 → Gemini 2.5 圖文迭代

3
Claude Project

同樣需求 → 純文字分析,無圖

五個比較維度

文字品質

準確度
深度
風格一致性

圖片品質

細節
風格
可用性

圖文整合

一步 or 兩步
配合度

迭代效率

修改速度
理解精準度

記憶延續

跨輪次
偏好保留

學員自己填:三平台並排對比

維度 ChatGPT GPT Gemini Gem Claude Project
文字品質 ___ ___ ___
圖片品質 ___ ___ ___
圖文整合度 ___ ___ ___
迭代效率 ___ ___ ___
記憶延續 ___ ___ ___

用你自己的實測結果填寫
每個人的結論可能不同 — 這正是重點

結論:場景決定平台選擇

行銷圖文

推薦 Gemini Gem
圖文一體,迭代快速
一步產出完整素材

深度文案

推薦 Claude Project
文字品質最精準
長文案邏輯清晰

平衡通用

推薦 ChatGPT GPT
功能最全面
生態系最完整

Stage 2 用 AI 寫程式碼時 → Claude 會是主力
工具選擇永遠跟著需求走

GPT / Gem 還能做什麼

客服助手

上傳產品 FAQ
自動回答常見問題

翻譯助手

設定翻譯風格
保留專有名詞不翻

會議摘要

上傳會議逐字稿
自動產出重點和待辦

論文寫作

上傳文獻 → 整理摘要
生成大綱 → 輔助撰稿

案例:Gem 輔助論文寫作

定義問題
上傳文獻
生成整理
核對引用
改寫成自己的文字

Gem 幫你做

整理數十篇文獻成表格
生成大綱和初步草稿
提供研究方法建議

你自己做

核心分析和論證
引用人工核對
改寫保持原創性

核心原則

Gem 是思路助攻和資料整理工具,最終文字仍需人工撰寫

記憶機制總整理

M1-1
聊天記錄
M1-2
Instructions
M1-3
GAS Script
M1-1
每次重新描述
記憶靠對話歷史
M1-2
寫一次,持續生效
記憶靠 Instructions
M1-3
時間到自動執行
記憶靠程式碼

升級線:從手動到自動

M1-1 / M1-2

手動觸發 AI

你問它才動
你打開 GPT/Gem 才開始工作
離開對話就停了

M1-3

自動化

時間到了自動動
表單送出自動回覆
你不在電腦前也在跑

M1-2 注意事項總覽

1
Instructions 太模糊

System Prompt 需要結構 — 四要素直接搬進來

2
ChatGPT 格式貼 Gemini 不通用

平台差異 + 可攜性 — 知識是你的,平台只是載體

3
Gemini 中文字生圖有錯字

AI 生圖的文字還需人工檢查和修正

4
複雜平面圖 AI 理解錯誤

複雜輸入要簡化或分區處理

5
3D 渲染比例失真

AI = 溝通示意,不是精確設計工具

帶走清單

本堂定位 體驗最小的自動化 — 用 Gem / GPT 做「複製流程」

不只學了什麼,是想法怎麼變了
從「把 AI 當答題工具」→ 設計成協作角色

從「先叫它試試看」
好助手要先定型
從「講清楚就好了」
角色比指令更穩
從「模型都差不多」
平台有各自脾氣
從「圖好看靠運氣」
審美要先被說清
從「我不懂怎麼畫」
場景才是生成語言
從「選最強的就好」
工具要按任務配對

課後操作

實踐任務

在工作場景中選一個需求,建立你的專屬 AI 助手
寫好 Instructions + 設定 Conversation Starters + 上傳知識庫

記錄要求

記錄你的 Instructions(存成文字檔備份)
下堂課會用到這些素材作為自動化操作的基礎

下一堂課 — M1-3

你建了 AI 助手
但每次都要手動打開

下一堂課的主題:讓 AI 在時間到了自動執行任務

GAS 自動化 觸發器 AI 幫你寫程式

M1-2 完成

1 / 59
章節