5 个最佳开源 AI 图像生成器
互联网上有数十种免费和开源的人工智能文本到图像生成器,专门用于特定类型的图像。因此,我们筛选了一堆,找到了您现在可以尝试的最佳开源人工智能文本到图像生成器。
1 Craiyon

Craiyon 是最容易访问的开源 AI 图像生成器之一。它基于 DALL-E Mini,虽然您可以克隆 Github 存储库并将模型本地安装在计算机上,但 Craiyon 似乎已经放弃了这种方法,转而采用其网站。
官方 Github 存储库自 2022 年 6 月以来一直没有更新,但最新模型仍然可以在 Craiyon 官方网站上免费获得。也没有 Android 或 iOS 应用程序。
在功能方面,您将看到 AI 图像生成器所期望的所有常用选项。输入提示并获取图像后,您可以使用高档功能来获取更高分辨率的副本。有三种风格可供选择:艺术、照片和绘画。如果您希望模型来决定,您也可以选择“无”选项。

此外,“专家模式”允许您包含否定词,告诉模型避免特定项目。还有一个提示预测功能,它使用 ChatGPT 帮助用户编写尽可能最好、最详细的提示。最后,人工智能驱动的删除背景功能可以帮助您节省从图像中裁剪背景的时间和精力。
这就是 Craiyon 所做的一切。它不是最复杂的人工智能图像生成模型,但如果您不想要详细或真实的东西,它作为基本模型效果很好。
该模型可以免费使用,但免费用户在一分钟内一次只能使用九张免费图像。您可以订阅他们的支持者或专业级别(价格分别为每月 5 美元和 20 美元,按年计费),以获得无广告或水印、更快的生成速度以及将生成的图像保密的选项。自定义订阅层还允许自定义模型、集成、专用支持和专用服务器。
2 Stable Diffusion 1.5
Stable Diffusion 可能是最流行的开源文本到图像生成模型之一。它还为其他模型提供动力,包括下面提到的三个图像生成器。它于 2022 年发布,此后已有多次实现。

我不会向您介绍该模型如何工作的过多技术细节(您可以查看他们的官方 Github 存储库),但该模型即使对于完全的初学者来说也很容易安装并且运行良好只要您拥有至少 4GB 内存的专用 GPU。您还可以在线访问 Stable Diffusion,如果您想在 Mac 上运行 Stable Diffusion,我们可以为您提供帮助。
有几个检查点(考虑它们的版本)可用于稳定扩散。虽然我们测试了 1.5 版,但 2.1 版也在积极开发中,并且更加精确。

运行模型也相当容易。我们使用 AUTOMATIC1111 Stable Diffusion Web 用户界面对其进行了测试,所有控件和参数都运行良好。由于模型训练所用的 LAION-5B 数据库,它也完全符合 NSFW 标准(请注意,尽管它并不完美)。虽然生成时间本身会根据您的硬件而有所不同,但即使有基本的提示,您也可以期望您的图像是详细且真实的。
3 DreamShaper
DreamShaper 是一种基于稳定扩散的图像生成模型。它的目的是作为 MidJourney 的开源替代品,并专注于生成图像中的真实感,尽管它可以通过一些调整来处理动漫和绘画风格。
该模型比稳定扩散功能更强大,允许用户对最终输出有更大的自由度,从闪电改进到更宽松的 NSFW 限制。运行模型也很容易,可以在线下载预训练版本以供本地访问,并且可以通过许多网站(包括 Sinkin.ai、RandomSeed 和 Mage.space)(需要基本订阅)来运行模型GPU 加速。

您现在可能已经猜到,与稳定扩散相比,DreamShaper 生成的图像往往看起来更真实。即使您在两个模型上运行相同的提示,DreamShaper 模型也可能会更加真实、详细且光线更好。
对于肖像或人物来说尤其如此,我发现与相同的提示相比,稳定扩散缺乏一些。如果您的图像变得过于真实,可以使用以下四种方法来识别人工智能生成的图像。
您也不需要庞大的 PC 来运行该模型。我的 GTX 1650Ti 配备 4GB VRAM 完美运行该模型。生成时间有点长,但这似乎并不影响实际输出。也就是说,您可能需要具有更多 VRAM 的 GPU 才能运行基于稳定扩散 XL 模型的 DreamShaper XL。
4 InvokeAI
Invoke AI是另一种基于Stable Diffusion的AI图像生成模型,有基于Stable Diffusion XL的XL版本。它还拥有自己的网络和命令行用户界面,这意味着您不必使用稳定扩散网络用户界面之类的东西。

该模型侧重于让用户根据其知识产权通过定制工作流程创建视觉效果。 InvokeAI 是用于训练自定义模型和处理知识产权的最佳开源 AI 图像生成模型之一。
其官方 Github 存储库列出了两种安装方法:通过 InvokeAI 的安装程序安装或使用 PyPI(如果您熟悉终端和 Python 并且需要对随模型安装的包进行更多控制)。
然而,额外的控制确实带来了一些限制,最明显的是更严格的硬件要求。 InvokeAI 建议使用至少具有 4GB 内存的专用 GPU,建议使用 6 到 8GB 来运行 XL 变体。 VRAM 要求适用于 AMD 和 Nvidia GPU。您还需要至少 12GB 的 RAM 和 12GB 的可用磁盘空间用于模型、其依赖项和 Python。

虽然文档不推荐 Nvidia 的 GTX 10 系列和 16 系列 GPU,因为它们缺乏视频内存,但提供的安装程序确实运行得很好。虽然您的情况可能会有所不同,但如果您使用的是低端 GPU,则需要等待更长的时间才能看到提示转换为图像。最后,如果您使用的是 Windows,则只能使用 Nvidia GPU,因为目前不支持 AMD GPU。
对于图像生成部分,模型更倾向于艺术风格而不是照片写实主义。当然,您可以在数据集上训练模型,并让它生成更接近您想要的图像,即使这涉及逼真的图像,特别是如果您在产品设计、建筑或零售空间工作。然而,需要记住的一件重要事情是,InvokeAI 主要是一个图像生成引擎,这意味着您可能必须使用自己的模型才能获得最佳结果(可以通过 Web 界面中提供的模型管理器轻松找到)作为默认值模型与稳定扩散本身非常相似。
5 Openjourney
Openjourney 是一个免费的开源 AI 图像生成模型,同样基于稳定扩散。如果您想知道为什么该模型被称为 Openjourney,那是因为它是在 Midjourney 图像上进行训练的,并且可以在生成的图像中模仿其风格。
Openjourney 背后的公司 PromptHero 允许您与其他模型一起测试该模型,包括稳定扩散(版本 1.5 和 2)、DreamShaper 和 Realistic Vision。注册时,您将获得 25 个免费积分(每生成一张图像就获得一个积分),之后您必须订阅他们的 Pro 订阅套餐,每月费用为 9 美元,每月可以使用 300 个积分以及其他独家功能。

但是,如果您想在本地免费运行它,您可以从 HuggingFace 下载模型文件并使用 Stable Diffusion Web UI 运行它。 Openjourney 也是 HuggingFace 上下载量第二高的 AI 图像生成模型,仅次于 Stable Diffusion。
Openjourney 并未在其网站上列出本地运行模型的任何具体硬件要求,但您可以预期与 Stable Diffusion 类似的硬件要求。这意味着计算机上需要具有 4GB VRAM、16GB RAM 和大约 12 到 15GB 可用空间的专用 GPU 来保存模型及其依赖项。

除非另有说明,否则 Openjourney 生成的图像往往会在写实主义和艺术之间取得平衡。如果您正在寻找一款全能型号,并且喜欢 Midjourney 的外观和感觉,而无需付费订阅,那么 Openjourney 是最好的选择之一。
以上是5 个最佳开源 AI 图像生成器的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容

双子座是Google AI策略的基础 双子座是Google AI代理策略的基石,它利用其先进的多模式功能来处理和生成跨文本,图像,音频,视频和代码的响应。由DeepM开发

“超级乐于宣布,我们正在购买花粉机器人,以将开源机器人带到世界上,” Hugging Face在X上说:“自从Remi Cadene加入Tesla以来,我们已成为开放机器人的最广泛使用的软件平台。

在AI社区的重大发展中,Agentica和AI共同发布了一个名为DeepCoder-14B的开源AI编码模型。与OpenAI等封闭源竞争对手提供代码生成功能
