暂无好友砍价,快去帮他砍价吧!
好友砍价详情
邀请好友砍价

AIGC多模态技术应用实战

AIGC多模态技术应用实战
在学
104
课时数
203
浏览量
1120
主讲人:
祝众众
分享

分享到:

第零章 课程资料
第一章 大模型与 AIGC 概述
第一章-大模型与AIGC概述
1.1大模型的定义
1.2大模型的特征与应用
2 大模型的前世今生
3 大模型爆火的原因
4.1 ChatGPT工作机制与训练流程
4.2 自监督预训练解读
4.3 有监督微调介绍
4.4 奖励建模与强化学习
4.5 token是什么
5 AIGC简介
第二章 提示词工程
免费 第二章-提示工程
1.1 提示是什么
1.2 提示的发展历程
1.3 提示工程是什么
1.4 提示词编写原则与策略介绍
2.1 原则与策略1:编写清晰的提示
2.2 原则与策略2:提供参考示例
2.3 原则与策略3:让模型一步步思考
2.4 原则与策略4:调用外部工具
2.5 原则与策略5:将复杂任务分解成子任务
2.6 原则与策略6:采用系统的提示框架
2.7 原则与策略7:用结构化方式进行提示
2.8 自动生成Prompt
3 总结
第三章 从文本到视觉的创作革命
免费 第三章-文生图与文生视频的理论基础
1 视觉创作的变革
2.1 文生图技术的概念与应用场景
2.2 文生图技术概述
2.3 拟合分布与图像生成
2.4 生成对抗网络GAN
2.5 自回归模型
2.6 扩散模型
2.7 文本和图像特征处理:CLIP模型-1
2.7 文本和图像特征处理:CLIP模型-2
2.9 图像生成的可控条件
3.1 从图像到视频的迁移
3.2 视频生成里程碑:Sora
3.3 AI文生视频技术分析
3.4 AI视频生成的挑战与展望
4 小结
第四章 AI绘画应用实战
免费 第四章-AI绘画应用实战
1.1 AI绘画平台
1.2 绘画提示词的重要性
1.3 提示词编写技巧
1.4 AI绘画的专业背景优势
1.5 适应界面变化
2.1 提示词公式绘画演示
2.2 文化相关图像生成
2.3 风景相关图像生成
2.4 美术相关图像生成
2.5 海报素材相关图像生成
2.6 微观图像生成
2.7 人像写真图像生成
2.8 产品展示设计图像生成
2.9 作业布置
3.1 图生图的概念
3.2 图生图使用技巧
3.3 智能参考
3.4 人物特征参考
3.5 图像特征参考
4.1 一键做同款
4.2 图片反推提示词
4.3 主体一致性的概念
4.4 主体一致性提示词技巧
4.5 AI绘画小结
5.1 图像生成编辑与局部重绘
5.2 其他图像编辑功能
5.3 智能画布介绍
5.4 智能画布图片融合
5.5 智能画布图片叠加
5.6 智能画布图文创
5.7 智能画布广告设计
5.8 图像编辑模型SeedEdit
5.9 指令修图使用介绍
5.10 课后练习
6.1 AI绘画的中文文字错误
6.2 WordArt锦书模型(拓展)
6.3 WordArt锦书模型试用
6.4 艺术字海报设计提示词模版
7.1 画质增强与修复技术
7.2 开源的图像修复工具
7.3 商用的图像修复工具
8.1 AI虚拟试衣
8.2 虚拟试衣模型
8.3 开源的虚拟试衣模型使用
8.4 商用的虚拟试衣平台
9 小结
第五章 AI视频生成应用实战
免费 第五章-AI视频生成应用实战
1.1 AI时代的视频生成
1.2 AI视频生成平台选择
2.1 提示词公式
2.2 提示词优化和注意事项
2.3 利用大模型生成提示词
3.1 文生视频概述及使用
3.2 视频延长和对口型
3.3 文生视频实例
4.1 图生视频概述
4.2 图生视频实例
4.3 首尾帧视频生成实例
4.4 图生视频的运动笔刷功能
5.1 AI短片制作流程
5.2 AI短片故事分镜设计
5.2 其他图像编辑功能
5.3 AI短片剪辑
6 开源视频生成模型
第六章 AI语音技术应用实战
第六章-AI语音交互技术应用
1 语音交互技术概述
2.1 语音交互与语音信号处理
2.2 语音识别技术发展
2.3 SenseVoice语音识别模型
2.4 SenseVoice模型结构
3.1 SenseVoice模型使用
3.2 本地部署SenseVoice模型(拓展)
3.3 语音识别的开源模型和商业软件
4.1 语音合成概述
4.2 Cosyvoice语音生成模型
4.3 Cosyvoice结果演示
4.4 Cosyvoice模型使用
4.5 Cosyvoice本地部署说明(拓展)
4.6 语音合成的开源模型与商业软件
5.1 语音克隆概述
5.2 F5-TTS语音克隆模型
5.3 F5-TTS基本语音克隆
5.4 基于F5-TTS的多类型语音与对话功能
5.5 云服务器部署F5-TTS
5.6 合法使用AI语音克隆
6.1 语音降噪的概念与原理
6.2 FRCRN语音降噪模型
6.3 FRCRN语音降噪使用
6.4 EResNet说话人确认模型
6.5 EResNet模型使用
6.6 ERes2Net-Large说话人识别模型
6.7 说话人识别模型使用
6.8 MossFormer语音分离
6.9 ClearVoice-Studio语音工具
7 小结
第七章 虚拟数字人技术应用实战
免费 第七章-AI虚拟数字人技术应用
1.1 DeepSeek的颠覆性意义
1.1 虚拟数字人的概念和组成
1.2 虚拟数字人应用场景
1.3 虚拟数字人发展现状
2.1 AI虚拟数字人关键技术
2.2 Talking-Head技术方向
2.3 基于图片的数字人模型—EMO
2.4 EMO及其他模型使用效果
2.5 基于视频底板的数字人模型—MuseTalk
2.6 MuseTalk使用介绍
3.1 实战1:数字人制作准备工作
3.2实战1:克隆语音
3.3 实战1:数字人视频生成
3.4 实战2:数字人微课视频资料准备
3.5 实战2:批量语音克隆与数字视频生成
3.6 实战2:数字人微课视频剪辑
4.1 百度云曦灵数字人微课视频
4.2 其他数字人商业平台介绍
5 小结
第八章 多模态 Agent
免费 第八章-多模态Agent实战:海报设计大师
1 背景与目标
2.1节日祝福海报制作流程分析
2.2 开始节点设置
2.3 文生图提示词优化
2.4 图像生成节点-01
2.4 图像生成节点-02
2.5 智能画板编辑
2.6 create holiday_poster工作流测试
2.7 节日祝福海报智能体搭建与测试
2.9 节日祝福海报优化思路
2.10 豆包图像生成大模型节点
3.1 直播课宣传海报制作流程分析
3.2 course图像流开始节点
3.3 人像抠图
3.4 双人画板主体
3.5 双人画板补充
3.6 双人画板微调
3.7 单人画板技巧以及course图像流发布
4.1 人物信息知识库管理
4.2 create course poster工作流开始节...
4.3 知识库信息检索
4.4 处理人物和二维码信息!
第九章 特别内容:DeepSeek 大模型技术应用
免费 DeepSeek—大模型的颠覆性创新
1.1 DeepSeek的颠覆性意义
1.2 DeepSeek的发展来源
1.3.1 DeepSeek-V3基础架构创新
1.3.2 DeepSeek-V3训练过程
1.4.1 DeepSeek-R1模型概述
1.4.2 DeepSeek-R1训练过程
2.1.1 模型选择
2.1.2 DeepSeek官方使用途径
2.1.3 DeepSeek第三方平台
2.2.1 Deep提示词库
2.2.2.DeepSeek 提示词特点
2.2.3 任务需求与提示语策略
2.2.4 RTGO提示词技巧
2.2.5 CO-STAR提示语框架
2.3.1 Deepseek 内容创作
2.3.2 Deepseek 商业策划与营销文案
2.3.3 DeepSeek 数学计算与推理
2.3.4 DeepSeek 摘要总结与翻译
2.3.5 DeepSeek 日常生活助手
2.3.6 DeepSeek 教育、金融及职场应用
2.11 优化版本工作流测试
第十章 教学智能体搭建技术(加餐)
1.1 教学智能体搭建技术(加餐)

讲师信息

祝众众

祝众众

祝众众,现任企业高级培训讲师、技术专家。在信息技术领域拥有多年工作经验,专注于人工智能、信创、网络、...
S-RAG Bot
公众号二维码
扫描二维码
关注公众号