开云·体育平台(开云kaiyun)(中国)官网入口登录天然对花朵的相识不太准确-波胆·足球
AI 生图开云·体育平台(开云kaiyun)(中国)官网入口登录,然则莫得 AI 味,可能么?
一款全新、可剪辑、相片级的 AI 生图模子 FLUX.1 Krea [ dev ] 现已发布,可在 Krea Edit 上免费试用。
官方先容该模子"莫得 AI 感,莫得过曝的高光,只消天然细节。"
主打一个信得过。
新模子是 Krea 1 的开源权再版块,它被考试的磋磨是生成更信得过、更各种化的图像,这些图像不包含文生图生成中常见的过度迷漫纹理。
咱们实测了这款模子,望望底下这张拼图,可以猜一下哪张是 FLUX.1 Krea [ dev ] 生成的。
谜底立时揭晓 ~
模子进展
为了测试 FLUX.1 Krea [ dev ] 是否"莫得 AI 感",咱们将从光学信得过性、纹理一语气性、语义一致性、透视、动态暗昧等方面最先,并与信得过的照相图片进行对比。
沿途来看一下。
光学信得过性
AI 作图容易出现"塑料感"或死白过曝的问题,难以分辩不同的材质。
咱们先在图虫网找到了一些主体为不同材料的照相图片,并把柄图片的内容建立请示词,把请示词输入 FLUX.1 Krea [ dev ] 进行文生图,考证模子是否相识物理光学规则。
There is a row of stainless steel pipes neatly arranged at the bottom, and three horizontally placed stainless steel pipes at the top, with the pipe openings facing outward at a 45 ° angle to the right.
刚刚的那张拼图等于由以上的请示词生成的,正确谜底是下图,猜对了么?
FLUX.1 Krea [ dev ] 会一次性输出 4 张图(对,像豆包一样),咱们挑选了相对信得过的那张当作展示。
可以看到,FLUX.1 Krea [ dev ] 在原有请示词的基础上,主动添加了锈点的特色——这照实让材料看上去愈加信得过。
但也并非十全十好意思,举例下图中圈出来的部分,仍存在一些难以解说的结构。
The water is calm, a gentle and transparent blue with a few waves.
相通的,上图为信得过照相,下图为 FLUX.1 Krea [ dev ] 的最优输出。
可以看到,FLUX.1 Krea [ dev ] 关于波澜的至友趣比简短,看起来有些重迭、失真,网状波纹光看起来不像是在水底,反而像是浮在水面上。
纹理一语气与语义相识
AI 容易出现常见的重迭图案或断裂,关于复杂的信得过纹理,能否天然过渡成了一个贫困。
为此,咱们以真挚面料和植物为例,测试一下 FLUX.1 Krea [ dev ] 对微不雅结构的相识智商。
以下拼图的上图均为信得过照相,下图为 FLUX.1 Krea [ dev ] 的最优输出。
Texture of green twill stitch knitted fabric, top view, the fabric is slightly uneven.
就微不雅结构的一语气性而言,FLUX.1 Krea [ dev ] 的输出并无显著问题。
但关于 uneven(不屈整)的呈现照旧相比规则,且似乎并不成相识 twill(斜纹针)的含义。
There are some water droplets on the back of the Plumeria rubra leaves.
上图为鸡蛋花(Plumeria rubra,华南常见树种)叶子的后面,有水珠。
把柄输出规模可以看出,FLUX.1 Krea [ dev ] 难以掌捏准确的植物类型,致使没能很好地相识 back(后面)的条款。
(以下是这次输出的全部四张图片,均出现相通问题。)
就材质而言,水珠的成果也有些" AI 味",过于均匀、单调。
透视与动态暗昧
生成多物体交错场景可以测试文生图模子对空间关系的相识,照旧仅能粗陋拼接考试样本。
而生成通顺物体可以考证模子对本事维度的模拟智商(搜检暗昧主见是否适当物理规则)。
There is a blanket on the grass, with three books stacked on top of it, and a lilac flower in front of it partially blocking the books.
可以看到,天然对花朵的相识不太准确,但合座的拟真进展还算可以,致使能够作念到让远景和布景王人呈现出暗昧的成果(浅景深)。
乍一看没什么大问题。
A silver car was driving from left to right at about 70 miles per hour, with the city receding behind it.
且不说傍边不分的问题(并不是全部输出王人傍边不分,但这张图成果相对信得过),FLUX.1 Krea [ dev ] 的输出很丢丑出画面主体通顺的趋势。
布景的暗昧莫得主见性,更像是散光,轮胎上有反光这点也很奇怪(吧?)。
物理规则
通过输入一些"反知识"的、逻辑矛盾的内容,可以判断模子是否优先盲从物理规则,照旧单纯拟合数据。
At noon, the sun was so strong that an oak tree cast no shadow at all in the sun.
可以看出,即使请示词为 cast no shadow at all(透彻莫得影子),FLUX.1 Krea [ dev ] 能够盲从物理规则,保持影子的存在。
但若是请示词为"鱼在天上飞"这类幻思性相比强的文本,输出将有所不同:
The weather was sunny, the sky was blue, and some goldfish were swimming above the city.
天然金鱼像贴图一样,但可以看出,在这种时候 FLUX.1 Krea [ dev ] 就会跳出既有的物理规则,生成的图片也穷乏信得过感。
毕竟原本等于不可能的事。
其它玩法
把柄页面上已有的功能,似乎还可以作念出一些别的尝试。
比如可以采选作图的立场(image style),或对原有图像进行诊治(image prompt):
还可以诊治生成图片的比例:
咱们试着用奥特曼的一张相片当作参考,请示词为"被好意思元包围","心绪自信"。
珍惜到在网页内还可以诊治参考比例。
默许参考为 0.4,咱们使用了 0.5 当作尝试,立场参考亦然 0.5,输出规模如下:
相比大的问题是它似乎无法很好地把东说念主物特征抓出来,呈现出来的规模让东说念主透彻认不出这是谁。
采选了油画立场当作参考,却让画面显得很脏。
是以鄙人一次测试中,咱们取消了参考立场,把参考图像的比例诊治至最大(1),请示词交流。
输出的规模如下:
把请示词中的" The person in the photo "改成" Samuel Harris Altman ",规模也并莫得多大改造:
由此能够可以得出,FLUX.1 Krea [ dev ] 并莫得认识识别出东说念主物特色。
(它的数据库里可能也莫得奥特曼。)
一个"有主见"的文生图模子
粗陋回来,它在光影和天然细节上作念得照实很可以,属于乍一望望不出什么大问题的水平,但关于形象的把捏、本事和空间结构的相识上还有待普及。
仍是会和大大批的 AI 作图用具一样,出现较多的重迭,骨子情况每每会愈加复杂。
当请示词相比明确是某扶持物或者某个具体个体的时候,它并没认识很好地生成准确内容,哪怕有图像参考亦然如斯。
不外嘛,若是" AI 味"指的只是是光影和材料的质感,我思它照实作念到了。
官方对 FLUX.1 Krea [ dev ] 的先容是:一个"有主见"的文生图模子。
FLUX.1 Krea [ dev ] 在东说念主类偏好评估中仍越过了以往的开源文生图模子,并与 FLUX1.1 [ Pro ] 等闭源责罚有缱绻进展非常。
此外,它在架构上与 FLUX.1 [ dev ] 生态系统兼容,并可当作纯简直基础模子,用于下贱期骗的定制。
天然在先容说是免费试用,但一个账号每天也有固定额度。关联词,把柄咱们的实测体会,似乎不是由图片数量决定的。
这点也激勉了部分网友的发火:因为一次性默许输出 4 张图,可能会"滥用"额度。
不外,趁着它还有免费额度,随机也值得一试。
(PS:可以径直用邮箱注册新账号,额度就更多了,嘻嘻)
参考贯穿:
[ 1 ] https://x.com/bfl_ml/status/1950920537741336801
[ 2 ] https://x.com/krea_ai/status/1928218053893828931
[ 3 ] https://x.com/roileean/status/1951314395578925061
一键三连「点赞」「转发」「防御心」
接待在挑剔区留住你的思法!
— 完 —
� � 8 月 7 日周四,下昼 14 点,量子位 AI 沙龙邀请了来自模子厂商、IDE、零代码平台、Agent 等居品代表,一同聊聊 AI Coding 将怎么重构开荒?
� � � � 接待线下参会!来和百度文心快码、智谱、Kimi、硅心科技、海新智能、CREAO、IDEA靠近面交流 � �
一键善良 � � 点亮星标
科技前沿进展逐日见开云·体育平台(开云kaiyun)(中国)官网入口登录