AIGC多模态技术应用实战

课程

课程机构讲师考试资讯

暂无好友砍价，快去帮他砍价吧！

好友砍价详情

邀请好友砍价

课程详情

AIGC多模态技术应用实战

AIGC多模态技术应用实战

在学
105
课时数
203
浏览量
1223

主讲人：

祝众众

加入学习

收藏

分享

分享到：

第零章课程资料

第一章大模型与 AIGC 概述

第一章-大模型与AIGC概述

开始学习

1.1大模型的定义

开始学习

1.2大模型的特征与应用

开始学习

2 大模型的前世今生

开始学习

3 大模型爆火的原因

开始学习

4.1 ChatGPT工作机制与训练流程

开始学习

4.2 自监督预训练解读

开始学习

4.3 有监督微调介绍

开始学习

4.4 奖励建模与强化学习

开始学习

4.5 token是什么

开始学习

5 AIGC简介

开始学习

第二章提示词工程

免费第二章-提示工程

开始学习

1.1 提示是什么

开始学习

1.2 提示的发展历程

开始学习

1.3 提示工程是什么

开始学习

1.4 提示词编写原则与策略介绍

开始学习

2.1 原则与策略1：编写清晰的提示

开始学习

2.2 原则与策略2：提供参考示例

开始学习

2.3 原则与策略3：让模型一步步思考

开始学习

2.4 原则与策略4：调用外部工具

开始学习

2.5 原则与策略5：将复杂任务分解成子任务

开始学习

2.6 原则与策略6：采用系统的提示框架

开始学习

2.7 原则与策略7：用结构化方式进行提示

开始学习

2.8 自动生成Prompt

开始学习

3 总结

开始学习

第三章从文本到视觉的创作革命

免费第三章-文生图与文生视频的理论基础

开始学习

1 视觉创作的变革

开始学习

2.1 文生图技术的概念与应用场景

开始学习

2.2 文生图技术概述

开始学习

2.3 拟合分布与图像生成

开始学习

2.4 生成对抗网络GAN

开始学习

2.5 自回归模型

开始学习

2.6 扩散模型

开始学习

2.7 文本和图像特征处理：CLIP模型-1

开始学习

2.7 文本和图像特征处理：CLIP模型-2

开始学习

2.9 图像生成的可控条件

开始学习

3.1 从图像到视频的迁移

开始学习

3.2 视频生成里程碑：Sora

开始学习

3.3 AI文生视频技术分析

开始学习

3.4 AI视频生成的挑战与展望

开始学习

4 小结

开始学习

第四章 AI绘画应用实战

免费第四章-AI绘画应用实战

开始学习

1.1 AI绘画平台

开始学习

1.2 绘画提示词的重要性

开始学习

1.3 提示词编写技巧

开始学习

1.4 AI绘画的专业背景优势

开始学习

1.5 适应界面变化

开始学习

2.1 提示词公式绘画演示

开始学习

2.2 文化相关图像生成

开始学习

2.3 风景相关图像生成

开始学习

2.4 美术相关图像生成

开始学习

2.5 海报素材相关图像生成

开始学习

2.6 微观图像生成

开始学习

2.7 人像写真图像生成

开始学习

2.8 产品展示设计图像生成

开始学习

2.9 作业布置

开始学习

3.1 图生图的概念

开始学习

3.2 图生图使用技巧

开始学习

3.3 智能参考

开始学习

3.4 人物特征参考

开始学习

3.5 图像特征参考

开始学习

4.1 一键做同款

开始学习

4.2 图片反推提示词

开始学习

4.3 主体一致性的概念

开始学习

4.4 主体一致性提示词技巧

开始学习

4.5 AI绘画小结

开始学习

5.1 图像生成编辑与局部重绘

开始学习

5.2 其他图像编辑功能

开始学习

5.3 智能画布介绍

开始学习

5.4 智能画布图片融合

开始学习

5.5 智能画布图片叠加

开始学习

5.6 智能画布图文创

开始学习

5.7 智能画布广告设计

开始学习

5.8 图像编辑模型SeedEdit

开始学习

5.9 指令修图使用介绍

开始学习

5.10 课后练习

开始学习

6.1 AI绘画的中文文字错误

开始学习

6.2 WordArt锦书模型（拓展）

开始学习

6.3 WordArt锦书模型试用

开始学习

6.4 艺术字海报设计提示词模版

开始学习

7.1 画质增强与修复技术

开始学习

7.2 开源的图像修复工具

开始学习

7.3 商用的图像修复工具

开始学习

8.1 AI虚拟试衣

开始学习

8.2 虚拟试衣模型

开始学习

8.3 开源的虚拟试衣模型使用

开始学习

8.4 商用的虚拟试衣平台

开始学习

9 小结

开始学习

第五章 AI视频生成应用实战

免费第五章-AI视频生成应用实战

开始学习

1.1 AI时代的视频生成

开始学习

1.2 AI视频生成平台选择

开始学习

2.1 提示词公式

开始学习

2.2 提示词优化和注意事项

开始学习

2.3 利用大模型生成提示词

开始学习

3.1 文生视频概述及使用

开始学习

3.2 视频延长和对口型

开始学习

3.3 文生视频实例

开始学习

4.1 图生视频概述

开始学习

4.2 图生视频实例

开始学习

4.3 首尾帧视频生成实例

开始学习

4.4 图生视频的运动笔刷功能

开始学习

5.1 AI短片制作流程

开始学习

5.2 AI短片故事分镜设计

开始学习

5.2 其他图像编辑功能

开始学习

5.3 AI短片剪辑

开始学习

6 开源视频生成模型

开始学习

第六章 AI语音技术应用实战

第六章-AI语音交互技术应用

开始学习

1 语音交互技术概述

开始学习

2.1 语音交互与语音信号处理

开始学习

2.2 语音识别技术发展

开始学习

2.3 SenseVoice语音识别模型

开始学习

2.4 SenseVoice模型结构

开始学习

3.1 SenseVoice模型使用

开始学习

3.2 本地部署SenseVoice模型（拓展）

开始学习

3.3 语音识别的开源模型和商业软件

开始学习

4.1 语音合成概述

开始学习

4.2 Cosyvoice语音生成模型

开始学习

4.3 Cosyvoice结果演示

开始学习

4.4 Cosyvoice模型使用

开始学习

4.5 Cosyvoice本地部署说明（拓展）

开始学习

4.6 语音合成的开源模型与商业软件

开始学习

5.1 语音克隆概述

开始学习

5.2 F5-TTS语音克隆模型

开始学习

5.3 F5-TTS基本语音克隆

开始学习

5.4 基于F5-TTS的多类型语音与对话功能

开始学习

5.5 云服务器部署F5-TTS

开始学习

5.6 合法使用AI语音克隆

开始学习

6.1 语音降噪的概念与原理

开始学习

6.2 FRCRN语音降噪模型

开始学习

6.3 FRCRN语音降噪使用

开始学习

6.4 EResNet说话人确认模型

开始学习

6.5 EResNet模型使用

开始学习

6.6 ERes2Net-Large说话人识别模型

开始学习

6.7 说话人识别模型使用

开始学习

6.8 MossFormer语音分离

开始学习

6.9 ClearVoice-Studio语音工具

开始学习

7 小结

开始学习

第七章虚拟数字人技术应用实战

免费第七章-AI虚拟数字人技术应用

开始学习

1.1 DeepSeek的颠覆性意义

开始学习

1.1 虚拟数字人的概念和组成

开始学习

1.2 虚拟数字人应用场景

开始学习

1.3 虚拟数字人发展现状

开始学习

2.1 AI虚拟数字人关键技术

开始学习

2.2 Talking-Head技术方向

开始学习

2.3 基于图片的数字人模型—EMO

开始学习

2.4 EMO及其他模型使用效果

开始学习

2.5 基于视频底板的数字人模型—MuseTalk

开始学习

2.6 MuseTalk使用介绍

开始学习

3.1 实战1：数字人制作准备工作

开始学习

3.2实战1：克隆语音

开始学习

3.3 实战1：数字人视频生成

开始学习

3.4 实战2：数字人微课视频资料准备

开始学习

3.5 实战2：批量语音克隆与数字视频生成

开始学习

3.6 实战2：数字人微课视频剪辑

开始学习

4.1 百度云曦灵数字人微课视频

开始学习

4.2 其他数字人商业平台介绍

开始学习

5 小结

开始学习

第八章多模态 Agent

免费第八章-多模态Agent实战：海报设计大师

开始学习

1 背景与目标

开始学习

2.1节日祝福海报制作流程分析

开始学习

2.2 开始节点设置

开始学习

2.3 文生图提示词优化

开始学习

2.4 图像生成节点-01

开始学习

2.4 图像生成节点-02

开始学习

2.5 智能画板编辑

开始学习

2.6 create holiday_poster工作流测试

开始学习

2.7 节日祝福海报智能体搭建与测试

开始学习

2.9 节日祝福海报优化思路

开始学习

2.10 豆包图像生成大模型节点

开始学习

3.1 直播课宣传海报制作流程分析

开始学习

3.2 course图像流开始节点

开始学习

3.3 人像抠图

开始学习

3.4 双人画板主体

开始学习

3.5 双人画板补充

开始学习

3.6 双人画板微调

开始学习

3.7 单人画板技巧以及course图像流发布

开始学习

4.1 人物信息知识库管理

开始学习

4.2 create course poster工作流开始节...

开始学习

4.3 知识库信息检索

开始学习

4.4 处理人物和二维码信息!

开始学习

第九章特别内容:DeepSeek 大模型技术应用

免费 DeepSeek—大模型的颠覆性创新

开始学习

1.1 DeepSeek的颠覆性意义

开始学习

1.2 DeepSeek的发展来源

开始学习

1.3.1 DeepSeek-V3基础架构创新

开始学习

1.3.2 DeepSeek-V3训练过程

开始学习

1.4.1 DeepSeek-R1模型概述

开始学习

1.4.2 DeepSeek-R1训练过程

开始学习

2.1.1 模型选择

开始学习

2.1.2 DeepSeek官方使用途径

开始学习

2.1.3 DeepSeek第三方平台

开始学习

2.2.1 Deep提示词库

开始学习

2.2.2.DeepSeek 提示词特点

开始学习

2.2.3 任务需求与提示语策略

开始学习

2.2.4 RTGO提示词技巧

开始学习

2.2.5 CO-STAR提示语框架

开始学习

2.3.1 Deepseek 内容创作

开始学习

2.3.2 Deepseek 商业策划与营销文案

开始学习

2.3.3 DeepSeek 数学计算与推理

开始学习

2.3.4 DeepSeek 摘要总结与翻译

开始学习

2.3.5 DeepSeek 日常生活助手

开始学习

2.3.6 DeepSeek 教育、金融及职场应用

开始学习

2.11 优化版本工作流测试

开始学习

第十章教学智能体搭建技术（加餐）

1.1 教学智能体搭建技术（加餐）

开始学习

【课程描述】

《AIGC多模态技术应用实战》课程旨在帮助学员全面掌握AIGC技术在多模态领域的应用，包括文本、视觉、音频和虚拟数字人等多个方面。课程内容涵盖大模型与AIGC的基础知识、提示词工程、AI绘画、AI视频生成、AI语音技术、虚拟数字人技术以及多模态Agent的实战应用。通过理论学习与实践操作相结合的方式，学员将能够运用AIGC技术进行多模态内容创作，提升内容创作的效率和质量。

【课程目标】

通过本课程，学员将掌握AIGC技术在多模态领域的应用，熟悉大模型与AIGC的基础知识。掌握提示词工程的技巧，能够进行AI绘画、AI视频生成、AI语音技术和虚拟数字人技术的实战应用，提升多模态内容创作的能力

【课程大纲】

1、大模型与 AIGC 概述

2、提示词工程

3、从文本到视觉的创作革命

4、AI绘画应用实战

5、AI视频生成应用实战

6、AI语音技术应用实战

7、虚拟数字人技术应用实战

8、多模态 Agent

9、特别内容:DeepSeek 大模型技术应用

写点评

讲师信息

: 祝众众

祝众众，现任企业高级培训讲师、技术专家。在信息技术领域拥有多年工作经验，专注于人工智能、信创、网络、...

云课堂业务公开课班级课程

资讯中心企业动态常见问题培训动态课程活动

就业培训签约成功在线实习就业培训

关于我们课程合作购买须知关于宏方

公众号二维码

扫描二维码

关注公众号

Copyright © 2003-2026 GuangZhou HongFang Network Technology Co., Ltd. All Rights Reserved. 广州市宏方网络科技有限公司

QQ在线咨询

徐老师

15913149905

孙老师

18122444293
扫一扫关注官方微博
扫一扫关注官方微信