目录

  1. 🚀 初体验:多模态智能的新纪元
  2. 01. 💻 AI Coding 能力展示
    1. 🟢 示例 1:复刻 Windows 画图工具
    2. 🟢 示例 2:Web 版视频剪辑软件 (Capcut Clone)
    3. 🟢 示例 3:UI 还原与交互实现
  3. 02. 🎓 辅助学习与教育
    1. 📘 示例 1:交互式数学解题动画
  4. 03. 🎨 广告与创意设计
    1. 🖌️ 示例 1:深圳手帐风旅游指南
    2. 🥮 示例 2:月饼制作工序
    3. 🍗 示例 3:宫保鸡丁制作流程
  5. 04. 👁️ 极致图像生成
    1. 📸 示例 1:超写实人像 (iPhone 17 Pro 风格)

🚀 初体验:多模态智能的新纪元

Google 自两年前推出 Gemini 初代以来,始终致力于无缝整合跨文字、图像、影片、音讯和程式码等多种模态的大模型。本月 18 号,Google 正式发布了全新 Gemini 3

Sam Altman X Comment

如果说 Gemini 1 在原生多模态和长脉络视窗上取得了突破,Gemini 2 为代理能力奠定了基础,那么 Gemini 3 Pro 则在推理、数学、图像、视频、代码、工具使用、事实性及长上下文等领域实现了全面刷新。

其表现远超 Gemini 2.5 Pro,并在多项评测中力压同代竞争对手(如 GPT-5.1、Claude 4.5),堪称 当代最强

💡 核心进化
短短两年内,AI 已从单纯地阅读文字和图像,进化到能深度理解语境。Gemini 3 最令人惊叹的进化在于它能 “读懂空气” —— 更擅长厘清请求背后的深层脉络与意图,让用户无需费力编写提示词即可获得精准结果。

Gemini 3 Benchmark Table

周末在 AI Studio 上体验了一番,感受颇深。Gemini 3 在前端代码生成能力上实现了质的飞跃。对于前端开发而言,转型的紧迫感前所未有。只需简短的自然语言,它就能一键生成完整、美观且可交互的前端界面。

🔥 社区共识:这将压缩 80% 的日常重复性工作量。


01. 💻 AI Coding 能力展示

🟢 示例 1:复刻 Windows 画图工具

PROMPT 指令:
设计一个类似 windows 操作系统里的画图工具,web版,可以使用任意库实现。

🟢 示例 2:Web 版视频剪辑软件 (Capcut Clone)

PROMPT 指令:
设计并开发一个类似 Capcut 视频剪辑软件的 web 版,UI 可以参考截图,支持快速导素材、顺畅剪时间线(必须支持拖动预览)、基本调音调色、添加字幕、导出清晰视频,还需要具备你认为剪辑软件具备的其他基础功能,可以使用任意库来实现。

🟢 示例 3:UI 还原与交互实现

PROMPT 指令:
把下面这张图还原成 html,支持按钮点击并跳转新页面,可以使用任意库实现。

原始 UI 设计图 还原后交互效果

02. 🎓 辅助学习与教育

📘 示例 1:交互式数学解题动画

PROMPT 指令:
截图的是一道小学三年级的数学题,做一个网页,解题步骤能通过动画效果分步骤展示,且可交互操作。


03. 🎨 广告与创意设计

🖌️ 示例 1:深圳手帐风旅游指南

PROMPT: 生成一张中国深圳的旅游指南,要求手帐形式,画面纯简体中文,字体要清晰。

🥮 示例 2:月饼制作工序

PROMPT: 制作一张图表,展示如何制作月饼,画面纯简体中文,字体要清晰。

🍗 示例 3:宫保鸡丁制作流程

PROMPT: 生成一张宫保鸡丁如何制作的图表,漫画手绘风格,画面纯简体中文,字体要保证清晰。


04. 👁️ 极致图像生成

📸 示例 1:超写实人像 (iPhone 17 Pro 风格)

PROMPT 指令:
埃隆·马斯克与照片中的人物肩并肩站在一起。两人都位于画面中心附近,直视镜头。自然柔和的光线突出了清晰的细节和微妙的阴影,营造出轻松友好的氛围,埃隆脸上带着自然的微笑。背景是干净现代的室内环境,景深适中,散景柔和。高分辨率人像摄影风格,面部特征精准,皮肤纹理逼真,肤色自然,比例协调。照片使用 iPhone 17 Pro 的人像模式拍摄。细节丰富,专业级品质,无任何失真、伪影或视觉瑕疵。


Generated with Gemini 3 Experience © 2025