小虎演示跨模型工作流:GPT 生圖 + Gemini 3.1 Pro 转 3D 互动內容

鏈新聞abmedia

中文 AI 观察家 xiaohu 5 月 10 日分享一个结合 GPT 与 Gemini 3.1 Pro 的工作流示例:先用 GPT 生成图像、再用 Gemini 3.1 Pro 把图像转换为 3D 互动内容、可把任何知识主题做成可旋转、可操作的科学应用。xiaohu 推文展示的示例包括 3D 行星展示、互动科学模型等、是「跨模型工作流」(multi-model workflow)的具体实践。

工作流结构:GPT 生图 → Gemini 3.1 Pro 3D 化

整个工作流的两阶段设计:

阶段一:用 GPT(GPT-image-1 或 ChatGPT 内建的图像生成)产出主题图像、提供视觉基础

阶段二:把图像输入 Gemini 3.1 Pro、由 Gemini 把 2D 图像转换为 3D 互动内容

输出形式:可在浏览器内旋转、缩放、互动的 3D 物件

适用场景:科学教育、产品展示、知识互动内容

「跨模型工作流」是 2026 年 AI 应用层的关键趋势之一—单一模型不再是万能工具、开发者把不同模型最强的部分串接起来、做出单一模型做不到的应用。

具体展示:3D 行星、互动科学内容、机器人工具售货网站

xiaohu 同步发布的多个示例:

3D 行星展示:可旋转的太阳系或单一行星模型

互动科学内容:把抽象知识做成 3D 可视化、适合教育用途

机器人工具售货机未来网站:用 GPT 生图加上 Tripo 3D 平台、做出展示型网页

这些示例的共同特征是「视觉生成 + 互动转换」—GPT 负责创意视觉、Gemini 或其他 3D 工具负责把静态图像转成可操作的互动形式。每一段单独拿出来都不算新,但串接后的最终体验比任何单一工具强。

意义:跨模型工作流逐渐成为主流开发模式

对开发者的具体启示:

选对工具比选最强模型重要—GPT 强的视觉、Gemini 强的多模态理解、Claude 强的长 context、各有各的甜蜜点

模型 API 整合成本下降、串接多个模型在实作层级变得可行

新型应用很可能是「多模型 pipeline」、不是「最强单一模型」的延伸

本案的价值不在技术突破、而在工作流设计的模板

后续可追踪的具体事件:Gemini 3.1 Pro 的 3D 生成能力是否被 Google 在后续活动正式公告为产品功能、跨模型工作流是否在 LangChain/LlamaIndex 等框架中取得预设模板支持、以及商业化案例(如教育、电商、行销)的具体采用示例。

这篇文章 xiaohu 示范跨模型工作流:GPT 生图 + Gemini 3.1 Pro 转 3D 互动内容 最早出现在 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

阿里云今日推出团队代币计划,包含 10+ 个模型

Beating称,阿里云今天推出其团队代币计划,为 10+ 大型语言模型提供订阅,包括 Qwen 3.6、Kimi-K2.6、GLM-5.1 和 Wan 2.7。用户可以为代码生成、图像合成和其他任务在模型之间灵活切换。 团队版本通过企业管理功能区别于个人计划。管理员可以管理座位分配、跟踪使用情况,并在三个层级中设置预算控制:Standard、Premium 和 Elite。该平台包含多租户隔离以及企业级数据隐私保护,并与主要 AI 工具兼容,包括 Claude Code 和 Cursor。

GateNews5小时前

东莞将在 2025 年生产全球一半的 AI 眼镜

根据研究机构 Omdia 的数据,2025 年,东莞本地公司共出货超过 400 万副 AI 眼镜,占全球 870 万副总量的近一半。该广东城市按出货量在全球排名第一,同时全球 AI 眼镜出货量较前一年增长 322%。 东莞的市场地位与政府支持 东莞在 AI 眼镜制造方面的领先地位,既体现了其既有的电子产业基础,也反映了近期的政策举措。东莞近期推出了一系列措施,支持 XR 智能终端,覆盖技术、企业发展、应用和资金等领域。 东莞市常务副市长曾建鹏将该市的实力归因于其已建立的电子供应链,该供应链既服务于代工制造商,也服务于本地品牌。 制造生态系统:中小型生产商 东莞 AI 眼镜热潮由中国珠江三角洲地区更广泛的一组 6 到 8 家中小型制造商共同推动。许多公司采用“双模式”策略:一方面以自有品牌销售低成本产品;另一方面承接代工业务,为面向商用与消费市场的原始设计制造(ODM)客户提供服务。该模式在实现销量增长的同时,也有助于分散财务风险。 较低的研发成本支撑了这一制造模式。根据行业参与者的说法,公司可用少于 1,000 万元人民币(约 141 万美元)的成本打造新款 AI 眼镜,并且每 6 个

Crypto Frontier7小时前

UXLINK 集成 Origins Network 的 AI 计算基础设施,用于 Web3 扩容

据 UXLINK 于 5 月 11 日发布的官方公告,这一 Web3 社交协议宣布与 Origins Network 达成战略合作,旨在将去中心化的 AI 计算基础设施整合到其生态系统中。该合作旨在通过引入 Origins Network 的模块化区块链基础设施来增强 UXLINK 的平台,提高面向 AI 驱动的去中心化应用的计算能力。 此次整合将利用 Origins Network 的 Proof-of-Computation 机制以及去中心化 GPU 计算,以提升 AI 模型训练、数据处理和交易效率,同时降低运营成本。支持社交去中心化交易所交易、流动性质押以及 AI 驱动应用的 UXLINK 平台,将通过此次合作获得更好的可扩展性和跨链功能。

GateNews11小时前

腾讯云在上线当天为 50,000 名用户提供 Ryt Bank 的 AI 银行业务

据腾讯云称,5月11日,该公司与马来西亚的数字银行 Ryt Bank 达成合作,使用腾讯云 Chat 为其由 AI 驱动的对话式银行服务提供实时消息支持。该系统在上线当天无宕机运行,处理了 50,000 名活跃用户,使客户能够用通俗语言发出支付指令,而无需浏览应用菜单。Ryt Bank 在超过七个月内已覆盖 120 万用户。

GateNews13小时前

Reactor 发布实时世界模型演示,获得 780 万次浏览

据 Beating 称,Reactor 于今天推出其实时世界模型演示,使用户能够通过基于云的 AI 处理生成交互式 3D 场景。该模型运行在公司全球低延迟云基础设施上,无需本地硬件。在一段演示视频中,红色跑车穿行于外星沙漠景观之中,AI 在实时渲染地形物理效果与远处的行星物体的同时,还跟踪玩家的操控,吸引了超过 780 万次观看。

GateNews13小时前

Minara 今日推出首个 Hyperliquid HIP-4 预测市场 AI Copilot

据 BlockBeats,Minara AI 于今日(5 月 11 日)推出 AI Prediction Copilot,成为首个与 Hyperliquid 的 HIP-4 市场集成的预测市场 AI 工具。该系统分析 BTC 的短期趋势、支撑与阻力位,以及市场定价偏差,以提供 YES/NO 交易建议。Copilot 会实时输出 AI 概率、市场隐含概率、优势值以及预期收益。

GateNews14小时前
评论
0/400
暂无评论