
文本到图像的人工智能程序并不新鲜。 事实上,像DALL-E这样的现有神经网络已经给我们留下了深刻印象,它们能够根据简短的描述性句子生成简单逼真的图像。
但本周我被介绍给图像. 开发商谷歌Imagen是一个与DALL-E和LDM类似的人工智能。 然而,Brain Team的Imagen的目标是使用同样的简短描述性句子方法生成更准确、更逼真的图像。
这种句子的一个例子是--根据Imagen网站上的演示--"一只戴着牛仔帽、穿着黑色皮夹克的毛茸茸的熊猫在山顶上骑着自行车的照片"。 这个句子很拗口,但人工智能可以根据自己的标准识别出每一个项目。
然后,人工智能将句子的每个片段作为可消化的信息块进行分析,并尝试生成与该句子尽可能密切相关的图像。 Imagen能够以惊人的速度和准确的结果完成这些工作,除非出现一些不可思议或奇怪的地方。
酸酸乳网速加速软件
如果您亲自查看过Imagen或其他神经网络,那么您可能会注意到它们绝大多数都集中在少数几个特定的主题上。 例如,DALL-E喜欢根据钟表或马桶等日常生活用品生成图像。 Imagen,至少目前看来,似乎把可爱的动物放在了图像生成功能的首位。 但这其实是有原因的。
谷歌的大脑团队并没有回避Imagen相对无害的事实。 作为冗长的免责声明的一部分,该团队非常清楚神经网络可能被用于生成有害内容,如种族成见或推崇有毒意识形态。 Imagen甚至使用了一个已知包含此类不当内容的数据集。
Brain团队指出:"我们对训练数据的子集进行了过滤,以去除噪音和不良内容,如色情图像和有毒语言,""我们还使用了LAION-400M数据集,众所周知,该数据集包含广泛的不良内容,包括色情图像、种族主义污言秽语和有害的社会成见。
"Imagen依赖于在未经整理的网络规模数据上训练的文本编码器,因此继承了大型语言模型的社会偏见和局限性"。
这也是谷歌大脑团队不打算将Imagen公之于众的原因,至少在开发出进一步的 "保障措施 "以防止人工智能被用于邪恶目的之前是如此。 因此,网站上的预览仅限于几个精心挑选的变量。
最终,这是一个正确的决定。 过去曾有过将人工智能程序释放给网络公众的例子......结果却极不理想。 您可能还记得微软Tay是一个人工智能Twitter账户,大约五年前被引入社交媒体平台。
Tay是微软的一次大胆尝试。 其目的是观察人工智能在社交媒体环境中如何与真人互动。 然而,在几个小时内,Tay就从一个健康的聊天机器人的反犹言论的传播者。 据微软称,尽管该机器人经过了 "建模、清洗和过滤"(谢谢、边缘).
鉴于Tay等人工智能开创的先例,不难理解为什么Imagen受到了控制。 显然,即使是广泛的过滤也可能是不够的。
酸酸乳网速加速软件
虽然《Imagen》给我留下了深刻印象,而且我在混合和匹配句子以创造各种奇异图片的过程中获得了很多乐趣,但我绝对不会认为它具有压倒性的说服力。 至少目前还没有。
通常情况下,Imagen公司会给出一些令人捧腹的结果。 尤其是动物,经常出现各种古怪的比例。 一只浣熊长着硕大的脑袋,或者像人类一样粗壮的手臂紧紧抓住自行车的车把,这些都是很常见的景象。 虽然非常有趣,但这些奇特的结果与逼真的效果融合在一起,往往会产生令人不安的不可思议的结果。
实际上,生成油画的选项更有说服力,Imagen在这里制作的大部分作品在学校项目中都不会显得突兀。 我的意思是以最好的方式。 事实证明,波斯猫弹奏吉他的画面比现实中的照片更有说服力。
如前所述,Imagen很可能不会在短期内公开发布。 或者说,永远不会。 人工智能程序和神经网络产生不良内容的风险仍然太大。 不过现在,对于那些想花点时间生成滑板下山的戴牛仔帽的滑稽动物的人来说,Imagen只是一个有趣的小玩意儿,我已经很满足了。
逛国外网站加速软件
注册后可收到来自科技界的每日突发新闻、评论、意见、分析、交易和更多信息。
Rhys是TechRadar Gaming的硬件撰稿人,加入TechRadar团队已有两年多时间。 Rhys对所有游戏都情有独钟,包括从三A大片到隐藏的独立游戏。 对Rhys来说,工作的亮点是能够测试一流的游戏硬件,从控制器、头盔到VR等。 当他不上班的时候,你通常会发现他正在登录《最终幻想14》和《盗贼之海》。 或者在《马里奥派对超级明星》(Mario Party Superstars)中大比分落后。