链资讯 链资讯
Ctrl+D收藏链资讯
首页 > Pol币 > 正文

DEEP:Stable Diffusion 团队放大招!新绘画模型直出 AI 海报,像素级生成_PFL价格

作者:

时间:

来源:量子位

开源AI绘画扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloydIF,一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。

以及准确理解空间关系。

耐克Web3平台.SWOOSH“OurForce1”FirstAccess销售时间将延长:5月17日消息,耐克旗下 Web3 可穿戴设备平台 .Swoosh 宣布由于技术问题,其数字运动鞋系列Our Force 1的 First Access 销售延长至北京时间 5 月 18 日 14:59,原定于 5 月 18 日 00:00 的 General Access 销售将被推迟。.Swoosh 称,此前英国和其他欧洲国家 / 地区的许多 .SWOOSH 会员都遇到了 2FA 和电话验证问题,当前该问题已解决。此外,.Swoosh 在其博客文章中强调 Our Force 1不支持任何加密货币支付。[2023/5/17 15:08:00]

BendDAO上Ape Staking服务已质押149万枚APE:金色财经报道,据BendDAO网站数据显示,BendDAO上的Ape Staking服务已质押149万枚APE。据悉,BendDAO在12月7日上线Ape Staking服务,支持BAYC/MAYC生息。[2022/12/12 21:39:36]

网友表示,这可是个大事,之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

使用DeepFloydIF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

跨链基础设施Celer Network基于StarkEx推出新版本Layer2.finance:4月28日消息,跨链基础设施 Celer Network 基于 StarkEx 推出新版本 Layer2.finance,该版本的 Layer2.finance 与已 Compound 集成,未来将扩展到其他协议和区块链。Layer2.finance 旨在通过 Layer2 解决方案将低参与 Layer1 上 DeFi 的成本。[2022/4/28 2:35:49]

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

动态 | Bitstamp暂停美元/欧元交易对:Bitstamp在推特表示:“我们目前遇到一些小的性能问题。美元/欧元交易已经停止,其他交易对仍可进行交易。我们的团队正在努力尽快解决这个问题,会及时通知最新情况。”[2019/7/17]

目前DeepFloydIF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

有需求的小伙伴可以抓紧反馈起来了。

动态 | StackOverflow调查报告:80%的组织目前没有使用区块链:据cointelegraph报道,开发者社区网站StackOverflow对近9万名开发者进行了调查,4月9日公布的结果显示,80%的组织目前没有使用区块链。此外,12.7%的组织将区块链用于非货币应用程序;4%用于加密货币相关应用程序,2.1%接受加密作为支付,1.3%正在实现自己的加密货币。StackOverflow还声称,印度的开发人员最有可能说他们的组织正在使用区块链技术。[2019/4/11]

像素级图像生成

DeepFloydIF仍然基于扩散模型,但与之前的StableDiffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出,使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致,语言模型理解文本后先生成64×64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上,通过把指定图像缩小回64×64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外,DeepFloydIF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩:

https://huggingface.co/spaces/DeepFloyd/IF

代码:

https://github.com/deep-floyd/IF

StableVicuna在线试玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

标签:DEEPPFLTABMEMEdeepbrain-chainPFL价格Ouro Stablecoinmeme币有哪些

Pol币热门资讯
NFT:不翻车不嫌累,月成本仅200元:AI主播攻占直播间_LABS

来源:深响,作者:祖杨 图片来源:由无界AI工具生成你能想象吗?上百平米的直播基地里,工位上空无一人,桌面上数十台电脑屏幕里的AI主播正不知疲倦、神采奕奕地直播着,他们的神态与真人无异.

比特币:DeFi挖矿、杠杆交易?揭秘亿万富翁和大佬们的链上活动_ORDI

加密研究员Hoeem最近总结了一些加密亿万富翁和交易大佬在链上的活动,涉及杠杆交易、DeFi挖矿等。相关加密资产包括$GMX、$ARB、$SOLID、$EQUAL、$SNEK、$TRX等.

MEM:MEME币实操指南:如何用工具找到下一个爆发的迷因币?_DEFI

作者:serp1337.eth?|NFTDegenMeme无疑是近日最热板块,以PEPE、WOJAK为首的Meme币轮番暴涨,但对于多数加密人士而言,每次都是后知后觉.

LDO:LDO遭多家机构抛售?一览四月份部分VC和聪明钱的链上活动_ITA

原文作者:ThorHartvigsen,加密?KOL原文编译:Felix,PANews四月份,部分?VC?和聪明钱有一些大的投资组合变化.

STA:通过代码识别DeFi中的套利机会_FLO

概述 去中心化金融是一种创建于区块链上的金融,它不依赖券商、交易所或银行等金融机构提供金融工具,而是利用区块链上的智能合约进行金融活动.

SWAP:比特幣減半開始倒計時 就在1年後_TOKE

比特币每四年减半,基本决定了加密货币市场荣枯周期。下一次发生在区块840,000的比特币减半,距离今天还有366天.