EN
app.sagaraexchange.com

适合夫妻二人观看的影片《怦然心动》清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

适合夫妻二人观看的影片《怦然心动》
适合夫妻二人观看的影片《怦然心动》隶属于弗吉尼亚州导弹防御倡导联盟(missile Defense Advocacy Alliance)的以色列导弹专家塔尔·因巴尔(Tal Inbar)指出,2014年,以色列曾在防空拦截弹用完的前几天寻求与哈马斯停火。因巴尔说,拦截弹库存水平在以色列是一个高度敏感的话题,但这一次“也可能成为停火的一个因素”。在贾墨的提醒下,王禹开始警惕起来。通过天眼查,他发现自己名下也有三家深圳的市场主体,注册时间均集中于2020年12月21日—22日,分别为颂乐源深圳建材有限公司(法定代表人)、深圳市宝安区威鼎特信息咨询部(经营者)、荣仁正深圳信息咨询有限公司(监事)。工商信息显示,该三家主体均处于存续状态且被列入经营异常。适合夫妻二人观看的影片《怦然心动》zjzjzjzjzjy.gov.cn经过广泛审议,赛事干事认定,虽然皮亚斯特里明显存在问题,但其行驶速度并未妨碍角田裕毅与其保持安全距离。当时的情况使得角田裕毅超越皮亚斯特里的行为没有正当理由。主要国际机构纷纷上调了有关中国经济增长的预期。国际货币基金组织对中国2025年增速较去年10月的预测值高出0.1个百分点;摩根士丹利分别将中国今明两年的经济增速上调0.3个百分点和0.2个百分点;高盛上调了今年二季度和下半年的中国环比GDP增速预测,并将2025年全年GDP增速预测上调0.6个百分点。
20251207 🔞 适合夫妻二人观看的影片《怦然心动》“对手们经常要求裁判检查他的身份证明,因为他们认为他已经超龄了。实际上,怀森只是身高较高,他在比赛中表现很出色。怀森和他的父亲付出了很多努力。刚开始时,他的左脚几乎不会踢球,但通过大量练习,他最终提高了左脚技术。有一次,在他作为少年队队员的最后一天,我们缺少一名门将,我问:‘谁愿意上场?’ 怀森举手自告奋勇,他担任门将让我们以3-2战胜了埃斯特波纳。那场比赛,他做出了几次精彩的扑救。”xjxjxj55.gov.cn机制创新,让顶层设计与问计于民相结合。从“十四五”规划编制工作首次通过互联网向全社会广泛征求意见和建议,到党的二十大第一次将党的全国代表大会相关工作面向全党全社会公开征求意见,再到此次“十五五”规划编制工作开展网络征求意见,网络问政已成为中国式民主的亮丽名片,更加多样化、机制化、常态化的民意吸纳渠道日益成熟。犹记得5年前,内蒙古网民“云帆”建议的“互助性养老”,最终被党中央采纳写入“十四五”规划文件。来自四面八方的金点子,通过网络从基层直达中央,让“民有所呼”转化为“政有所为”,生动验证了全过程人民民主是最广泛、最真实、最管用的民主。
适合夫妻二人观看的影片《怦然心动》
📸 唐杰记者 梁怡 摄
20251207 👄 适合夫妻二人观看的影片《怦然心动》(六)支持赋能新型工业化应用示范。促进人工智能技术在制造业细分领域的创新应用,推进人工智能供给与制造需求深层对接。征集一批人工智能大模型制造业细分领域的示范应用及解决方案,鼓励形成典型应用、推广案例,每年择优评选不超过5个实现首次应用的优秀方案并给予奖励,奖励金额不超过500万元。(责任单位:市经信局)xjxjxj55.gov.cn套用这几年的时髦词,老沈媳妇文秀是这家团购自提站点的“主理人”。就像中国家庭传统的女性角色,她勤劳能干,承包了家里的一切大小事务,让老沈过着衣来伸手、饭来张口的幸福日子。几乎是理所当然的,她经营起了站点的生意。
适合夫妻二人观看的影片《怦然心动》
📸 赵云明记者 王彭森 摄
🔞 确实有几场比赛我们没能守住比分,但我们清楚自己的实力。有时这关乎专注力。现在赛季接近尾声,我们必须全神贯注,才能踢出一场精彩的比赛。zjzjzjzjzjy.gov.cn
扫一扫在手机打开当前页