★AIGC的应用领域日益广泛,而在图像生成领域,扩散模型则是AIGC技术的一个重要应用。
★本书以扩散模型理论知识为切入点,由浅入深地介绍了扩散模型的相关知识,并以大量生动有趣的实战案例帮助读者理解扩散模型的相关细节。
★本书既适合所有对扩散模型感兴趣的AI研究人员、相关科研人员以及在工作中有绘图需求的从业人员阅读,也可以作为计算机等相关专业学生的参考书。
◎内容简介:
全书共8章,详细介绍了扩散模型的原理,以及扩散模型退化、采样、DDIM反转等重要概念与方法,此外还介绍了Stable Diffusion、ControlNet与音频扩散模型等内容。最后,附录提供由扩散模型生成的高质量图像集以及Hugging Face社区的相关资源。
◎专业书评:
本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。
——周明,澜舟科技创始人兼CEO,创新工场首席科学家,CCF副理事长
受非平衡热力学的启发,扩散模型以良好的数学解释性及可控的生成多样性迅速成为AIGC领域一颗耀眼的新星。本书从“一滴墨水”开始,由浅入深,从理论到实践“扩散”出了图像、文本与音频的AIGC蓝图,并为读者保留了精华,去除了“噪声”,还原出了知识体系最真实的“分布”。
——杨耀东,北京大学人工智能研究院研究员
人工智能扩散模型在近几年取得了令人目不暇接的惊艳成果,可以有效解决视觉内容生成的瓶颈问题。仔细阅读本书,你既可以对扩散模型背后的原理有较为深刻的理解,也可以依此动手进行实践,从而牢固掌握扩散模型,为进一步创新或深度应用打下坚实基础。本书值得推荐!
——钟声,声网CTO
纵观人类历史,机遇永远属于抢先一步占据未来高度的人。我们每一个人都有必要去探究人工智能的奥秘,以便在即将到来的变革大潮中争得一席之地。
——马伯庸,作家
《扩散模型从原理到实战》以Hugging Face的扩散模型(Diffusion Model)课程为基础,通过理论和实例相结合的方式,为读者构建了一个完整的学习框架。无论你是新手还是经验丰富的从业者,这本以实战为导向的图书都能够帮助你更好地理解和应用扩散模型。
——王铁震,Hugging Face中国地区负责人,高级工程师
随着Stable Diffusion和Midjourney的推出,文生图形式的AI绘画火爆异常,很多游戏的角色设计、网上店铺的页面设计都用到了AI绘画工具。本书系统地梳理了AI绘画背后的一系列原理细节,且有代码实战,我非常推荐大家阅读本书!
——July,七月在线创始人,CEO
李忻玮,硕士毕业于美国常春藤盟校之一的哥伦比亚大学数据科学专业,现任声网人工智能算法工程师;主要研究方向是生成式人工智能、计算机视觉、自然语言处理、提示工程等。
苏步升,扩散模型算法工程师,AIGC创业者,Hugging Face中国社区本地化工作组成员。
徐浩然,毕业于中国海洋大学电子信息工程专业,现任声网音频算法工程师,从事扬声器声学设计、音频增强算法、音频质量评估算法等研究工作。
余海铭,本科毕业于暨南大学,硕士毕业于加州大学尔湾分校;先后在中国科学院深圳先进技术研究院、爱奇艺、美团等单位工作;主要研究方向是图像识别、图像生成、多模态及自动驾驶等领域。
扩散模型从最初的简单图像生成模型,逐步发展到替代原有的图像生成模型,直到如今开启AI作画的时代,发展速度可谓惊人。因为本书主要介绍扩散模型的2D图像生成任务,所以本节仅介绍与2D图像生成相关的扩散模型的发展历程,具体如下。·开始扩散:基础扩散模型的提出与改进。·加速生成:采样器。·刷新纪录:基于显式分类器引导的扩散模型。·引爆网络:基于CLIP(ContrastiveLanguage-ImagePretraining,对比语言-图像预处理)的多模态图像生成。·再次“出圈”:大模型的“再学习”方法——DreamBooth、LoRA和ControlNet。·开启AI作画时代:众多商业公司提出成熟的图像生成解决方案。
——引自章节:1.2 扩散模型的发展 5
迄今最权威的艾森豪威尔传记。美国历史上唯一成为总统的五星上将。他造就了战争,战争造就了他。——《时代》杂志作为一个曾经亲身经历战争的士兵,作为一个曾亲眼目睹了它...
“逆境能激发出我们最好的一面,日常生活却将我们扼杀。”但他还是会活下去,他要比自己的时代活得更久。★“当世最伟大的作家之一”理查德·弗兰纳根重磅代表作,斩获布克...
电磁兼容技术系列EMC 设计分析方法与风险评估技术 本书特色 本书基于EMC测试原理,解读一种产品EMC设计的分析方法(包括产品机械架构设计、 滤波设计、 PC...
“图像小说之父”威尔·艾斯纳的集大成作;图像小说宇宙的原点,掀起图形叙事的革命;一个街区的传记,素描其在百年内的诞生、成长、死亡与重生;解剖城市角落,拨动街道神...
《MATLAB/Simulink建模与仿真实例精讲》可作为广大在校本科生和研究生的学习用书,也可以作为广大科研人员、学者、工程技术人员的参考用书。全书共分9章。...
【日】矢野香日本NHK知名主持人在NHK主持新闻报道节目的17年中,曾创下收视率突破20%的纪录。风靡日本的“正统派演讲”指导第一人以“说话者的印象形成”研究获...
作者只会开自动档车,却喜欢驾车远行,只会简单英语,却喜欢出国旅行,只写过几篇游记,从没想过拥有一本自己的书。其实旅行只需要一点勇气加一本好书!作为第一个敞开国门...
债法总论 内容简介 民法为众法之基。私法固不待论,欲治公法者,亦应对于民法有相当了解,而后可得其真谛。民法中尤以债法为*重要部分,而债之通则实为债法理论之总汇。...
只要一想到人是会死的,活着就会变得分外轻松。明天是另一个早晨,明天是未来的事。二十七岁的姚瑶用文字记录下二十七件发生在“今天”的事情,关于眼前与远方,孤独与消解...
李重光,山东栖霞县人。生于1929年农历正月初一。1955年毕业于中央音乐学院作曲系。毕业后留校校任教,从事基本乐理、视唱练耳的教学与研究工作及儿童音乐创作。主...
《用户体验百家谈》是一本汇聚了用户体验行业百家争鸣的智慧合集,它代表UXPA中国发展10年在推动行业研究与论文方面的成果。读者既可以从书中看到行业未来发展的方向...
桑达克于1964年以《野兽国》一书获凯迪克金奖;1970年获安徒生插画奖;为表彰他的整体创作,1983年美国图书馆协会颁发其罗兰英格斯怀尔德奖;1996年获美国...
朋友以上、戀人未滿純愛小說就從這裡開始……小葉日本台、桂綸鎂、蔡智恆、劉黎兒、藤井樹深情推薦(劉黎兒、蔡智恆特別撰文)吉卜力工作室經典青春動畫《海潮之聲》改編自...
当今世界是一个全球化的世界,世界各地的人们成功地突破了地域的隔阂。然而,我们生活的世界,是从何时进入全球化的?在《公元1000年:全球化的开端》一书中,著名汉学...
Theworldhasreachedanunprecedentedleveloftechnologicaladvancement.Therecentdiscov...
高含水率淤泥的固结特性与改良技术 本书特色 高含水率淤泥是沿海地区吹填造陆和内河湖泊清淤过程中的重要产物,《高含水率淤泥的固结特性与改良技术》针对其含水率极高的...
边坡工程处治技术 内容简介 边坡是工程中*常见的工程形式,边坡工程中遇到的滑坡问题是全球性三大地质灾害之一。边坡处治,在公路、铁道、水利、市政、土建、水运、矿山...
沧月,取“沧海月明珠有泪,蓝田日暖玉生烟”之意。2001年底开始在网络发表作品,先以武侠成名,后转入奇幻领域。2002年开始为畅销杂志写文。2004年获得《古今...
职场打工人没听久坐10小时,肩颈疼痛难忍;工作聊天爱跷二郎腿,酸爽又怕脊椎变形;孩子学业压力大,还没长高先驼背了;宅家一个月,膀大腰圆还驼……“久坐”是很多现代...
额窦 节选 bsp; 由复旦大学附属眼耳鼻喉科医院余洪猛博士和同济大学附属东方医院赵长青教授牵头、国内一流专家学者参与翻译的《额窦》一书即将付梓。这无疑将对推...