上周,全球人工智能领域的发展又迎来了一波新浪潮。先是GPT-4的更新备受关注,被认为是目前最先进的自然语言处理技术之一;随后,微软又抛出一张“王炸”Microsoft 365 Copilot,这款使用GPT-4技术的办公软件,什么word秒变PPT信手拈来,是手残党的福音。
Copilot也可能是某些岗位的噩梦(图源网络)
可以预见:在不久的未来,各行各业的工作流程、岗位职责、人员规模等等,都将随之产生翻天覆地的变化。怎么“驯服”AI工具为己所用的课题,才刚刚开始。
MJ和SD又出新版本
上周六刚结束的轩宝爸爸《AI创作绘画课》,晓栋老师教大家训练Midjourney和Stable Diffusion软件(简称MJ和SD,下同),来制作AI绘画作品,出图效率令人惊叹。这两款软件都是利用机器学习算法,来自动生成图像、画作和插画等艺术品。
火星时代《AI创作绘画课》直播间截图
上周,Midjourney推出了V5新版本,拥有更加广泛的风格种类、高于旧版本2倍以上的图像分辨率,并且在相同文字条件下,做图细节更加优秀;比如,在某些指令条件下,它在每只手上做了五个手指,而非增加一百个连牙。并且开发人员还声称V5版本“极大地加强了对角色面部细节的处理”。
图源网络
MJ真的能画好手了?有图为证:
MJ V5做出的AI情侣,手的细节已经有明显改善
Stable Diffusion也在上周推出Stable Diffusion Reimagine,新工具只需用户上传图像这样一个简单动作,就可以无限制地生成多个组合变体,而无需额外的追加提示。比如下面这张SD官网晒出的卧室图,只有左上角是原图,其他都是软件受原始图片“启发”,自动“构想”的新作品。
图源网络:Reimagine官方出图
反对AI喂图的工具来啦
创作者们要如何避免自己的作品,成为生成式AI绘图工具的“饲料”?芝加哥大学的研究人员和一些艺术家合作开发了一个免费工具Glaze。
它相当于给作品加了一道“保护伞”,还可以设置“保护伞”的强度值,强度越高,保护越强。等于是在不影响创作观感前提下,给作品设置了一道防止喂图的“密钥”。以此来保护创作者的独特风格和作品,免于被人工智能算法复制,保障了他们的知识产权。
Glaze网址:https://glaze.cs.uchicago.edu/faq.html#faq
Glaze适用Windows和macOS 13.0+,同时支持Intel和Apple Silicon Mac。该软件可根据自定义EULA获得,目前尚处在测试阶段。
RODIN:3D模型一键生成
用一张2D图生成3D图像模型,需要几步?在微软亚洲研究院新推出的3D数据训练扩散模型RODIN中,只需要几个按钮、几秒钟即可完成。
工作原理和训练过程在此不作赘述。RODIN能实现的效果是:只使用一张2D图像,甚至一句话文字描述,就能创建逼真的3D头像。
截图来源:https://3d-avatar-diffusion.microsoft.com
后续,该团队计划采用RODIN模型来创建更多的3D场景,这些场景将包括花草树木、建筑、汽车家居等多种元素。他们的终极目标是通过使用一个模型来生成3D万物,从而实现更高效的3D设计和创作。
能做CG动画的AI工具
WonderStudio是一个功能强大的AI工具,它可以用于视频编辑、音频处理、图像设计、文字排版等多种创作领域。最厉害的是,它可以自动分析并捕捉真人表演,将其转变为CG角色,并为其制作动画,甚至自动将灯光和CG角色匹配到实拍场景中去。
WonderStudio操作演示(图源网络)
这意味着,你只需拥有一部相机甚至手机,就能做CG大片。那些复杂的制作工序、昂贵的硬件,在WonderStudio里似乎正在变得无足轻重。
目前,只有少数邀请用户才能使用Beta版。但不得不说,加入AI的制作软件,效率和效果都太逆天了。
国产开源50亿参数新模型
在AI绘画领域,一个比较公认的难点是,如何更好去提升AI绘画模型的可控性,让它生成的图像,更加符合人类提出的要求。近日,来自阿里巴巴和蚂蚁集团的研究者们公布了名为Composer的大型可控扩散模型,大约包含50 亿个参数,训练样本包含文本和图像,样本数量多达数十亿。
项目地址:https://github.com/damo-vilab/composer
Composer能实现的效果,可以让使用者更加灵活地利用文本描述、深度图和草图、颜色直方图等作为命令组合,在有限的语言命令下,产出更加大量的、符合人类审美及需要的新图像。项目地址在上面,大家可以去github自行体会。
版权声明 | 文章整理自网络,仅供学习参考,版权归属原作所有
如有问题,请及时与我们联系,我们将第一时间做出处理