GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
2023-06-16 22:59:23    程序员客栈


(资料图片)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词:

下一篇: 最后一页
上一篇: 法国企业家中文接受采访:中国依然是全球经济最重要动力 全球时讯

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型

法国企业家中文接受采访:中国依然是全球经济最重要动力 全球时讯

杭州亚运村内部功能区首次公开亮相-焦点速递

重庆举行茶博会 赋能茶行业发展新机遇

土豆有什么快速去皮的方法 今日报

世界焦点!山西襄汾春秋墓葬出土楚式青铜器映射晋楚争霸

中消协:盲盒商品须明码标价、明示抽取概率等关键信息-焦点要闻

【环球报资讯】100个真实有效的实名认证_查找身份证号码和真实姓名

华为余承东:未来能活下来的主力车厂是少数 活下来的一定会成为巨头

重庆首条"高速公路+光伏"分布式光伏发电项目7个点位全部并网发电

今日大学专科和大专的区别_大学专科和大专一样吗

[周评]东北:辽宁地区一些企业水泥价格已跌破200元/吨(6.12-6.16)_每日讯息

2023粤港澳车展:新款揽胜星脉售价56.8万起_每日简讯

贾玲宣布减肥100斤,近照颜值逆天,我却笑不出来…

当前热议!宝宝补铁吃什么颗粒好_宝宝补铁吃什么

备受鼓舞 丨 拉塞特受邀参加全国现代设施农业建设推进会

男子小复式中大乐透1044万 奖金还没想好怎么花_重点聚焦

日本众议院未通过针对岸田内阁的不信任案|聚焦

当前资讯!《逆水寒手游》庄园建造玩法详情 庄园建造攻略

世界快看点丨新零售+新能源 解码安步汽车数字化突围

世界观热点:今日欧元/美元汇率走势图分析(6月16日)

东晶电子6月16日盘中涨幅达5% 全球看热讯

爱没有遗弃我你的爱会将我灌醉是什么歌名_爱没有遗弃我你的爱会将我灌醉 环球今热点

天天热讯:31省新增确诊39例(31省新增确诊49例)

让世界充满爱歌曲原版_让世界充满爱原唱歌词

终圆梦!杰夫-格林身穿纪念版T恤 印有自己&小乔丹&史密斯的头像-环球新动态

熊猫京京短片2 天天时讯

全球短讯!杭州亚运会奖牌和推广歌曲发布

选秀专家:勇士与独行侠正探索向下交易 或退出本次选秀

7年前,因“爷孙恋”走红的两人,现状如何?少女已失去纯真笑容

学无止境!“高龄高知”老年人如何养老?探访高校家属院_天天新消息

淄博市6000多名五级人大代表每人帮扶5户左右困难群众

突然关门、办卡跑路?济南出手了

每日视点!suck什么意思_suck

天天热推荐:蝗虫内部结构示意图 蝗虫结构示意图

【环球新要闻】布林肯即将访华,美国两大杀招配合,耶伦率先出拳:不许中国借钱