目录
官方演示
其它功能
视频高光解说
技术实现
使用提示
网友评论
首页 科技周边 人工智能 大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

May 30, 2023 am 08:34 AM
ai 模型

还记得前几天发布的DragGAN吗?

没错,就是那个「轻轻点两下」1秒修图的工具。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

拍的照片表情不好?修!脸型不够瘦?修!脸冲镜头的角度不对?修!

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

搞不好,「让大象转个身」这个远古PS段子,可能就要成真了 

这个AI修图工具演示视频一经发布,瞬间在国内外火得一塌糊涂。

许多网友纷纷直呼,「PS不存在了」。

还没几天,DragGAN非官方实现竟能上手试用了。这一功能已经被集成到InternGPT中,界面长这样↓

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

体验地址:https://igpt.opengvlab.com/

没想到,演示入口一开放,直接被挤爆。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

官方演示

从官方放出的演示视频来看,再现的DragGAN效果绝了。

咧嘴笑

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

先是怎么把一个没笑的人p笑。只要选中两个嘴角,直接Drag就好了。

可以看到,最终生成的结果毫无违和感。因为面部肌肉也在一起变化,不是单纯的咧嘴。

合上嘴

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

脸部编辑

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

这个瘦脸功能大家就太熟悉了,选中两个脸蛋往里挤,输出还是非常自然的。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

男性瘦脸。不过这个有点瘦过了,输出结果一眼假,下巴太尖了。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

这个必须强推!植发!多少秃头人士的福音。

不过从输出结果看,就算选中额头那里,也是全部地方的毛发等比例增长,最后的结果有点像美猴王。

转脸

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

脸部转动也是一个很实用的功能,补齐的部分非常自然。

其它功能

除了小范围的修图,InternGPT本身还有很多其它可以进行的亮眼操作。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

移除遮盖的对象

单击想要在图片中进行操作的部分,在prompt中输入「移除」就可以了。

图像生成

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

这个功能比较有意思,先上传一张图片,输入prompt让DragGAN分割,然后再输入一个prompt生成想要的图片。

露出黑脚了?(不是)

视频高光解说

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

用prompt还可以一键剪辑视频。

交互式视觉问答

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

甚至识别完图片上的信息还能联网直接查询。

交互式图像生成

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

随手的涂鸦都能一键变成美图。

反正看完这些功能小编是真震惊了。所有功能就突出两个特点:「傻瓜式操作,且究极好用」。

这谁能不爱?

技术实现

看了这么多酷炫的功能,那么这个InternGPT到底是什么?

InternGPT(简称iGPT)/InternChat(简称iChat)是一种基于指向语言驱动的视觉交互系统,用户可以通过点击、拖动和绘制与ChatGPT进行互动。

与依赖纯语言的现有交互系统不同,通过整合指向指令,iGPT显著提高了用户与聊天机器人之间的沟通效率,以及聊天机器人在视觉为中心任务中的准确性,尤其在复杂的视觉场景中更是如此。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

论文地址:https://arxiv.org/pdf/2305.05662.pdf

下图就是InternGPT的整体架构。

我们可以看到,这个GPT既可以处理图像、视频,也可以处理语音、文字。

对于图像或视频输入,InternGPT就会用SAM(图像分割模型)、OCR(图像识别模型)等等进行处理。

在识别出地理位置、物品或者线条之后,还有一整个工具箱进行进一步处理,其中都是我们耳熟能详的工具。

比如BLIP(音频)、Stable Diffusion(图像)、Pix2Pix(图像翻译)等等。

同样地,对于文字或者语音输入,InternGPT就会调用GPT-4、LLaMA等模型或工具进行处理,后续同样有一整个工具箱。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

InternGPT的整体架构

使用提示

而在使用过程中,整个流程也是非常方便的。

用户在图片上传成功后,可以发送如下消息与iGPT进行多模态相关的对话:

"what is it in the image?" or "what is the background color of image?".
登录后复制

同样,用户也可以交互式地操作、编辑或者生成图片,具体如下:

· 点击图片上的任意位置,然后按下 Pick 按钮,预览分割区域。也可以按下 OCR 按钮,识别具体位置处存在的所有单词;

· 要在图像中删除掩码区域,可以发送如下消息:

“remove the masked region”
登录后复制

· 要在图像中替换掩码的物体为其他物体,可以发送如下消息:

“replace the masked region with {your prompt}”
登录后复制

· 想生成新图像,可以发送如下消息:

“generate a new image based on its segmentation describing {your prompt}”
登录后复制

· 想通过涂鸦创建新图像,按下 Whiteboard 并在白板上绘制。绘制完成后,需要按下 保存 按钮并发送如下消息:

“generate a new image based on this scribble describing {your prompt}”
登录后复制

网友评论

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

那个令人震惊的DragGAN现在有一个非官方的版本。正式版本将在6月发布,这只是未来的预览。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

DragGAN已经集成到InternGPT了,这么快就出来了,修图神器。

大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN

以上是大象P转身开箱即用!港大、南大、清华等抢先开源「复刻」版DragGAN的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

如何检查CentOS HDFS配置 如何检查CentOS HDFS配置 Apr 14, 2025 pm 07:21 PM

检查CentOS系统中HDFS配置的完整指南本文将指导您如何有效地检查CentOS系统上HDFS的配置和运行状态。以下步骤将帮助您全面了解HDFS的设置和运行情况。验证Hadoop环境变量:首先,确认Hadoop环境变量已正确设置。在终端执行以下命令,验证Hadoop是否已正确安装并配置:hadoopversion检查HDFS配置文件:HDFS的核心配置文件位于/etc/hadoop/conf/目录下,其中core-site.xml和hdfs-site.xml至关重要。使用

centos关机命令行 centos关机命令行 Apr 14, 2025 pm 09:12 PM

CentOS 关机命令为 shutdown,语法为 shutdown [选项] 时间 [信息]。选项包括:-h 立即停止系统;-P 关机后关电源;-r 重新启动;-t 等待时间。时间可指定为立即 (now)、分钟数 ( minutes) 或特定时间 (hh:mm)。可添加信息在系统消息中显示。

CentOS上GitLab的备份方法有哪些 CentOS上GitLab的备份方法有哪些 Apr 14, 2025 pm 05:33 PM

CentOS系统下GitLab的备份与恢复策略为了保障数据安全和可恢复性,CentOS上的GitLab提供了多种备份方法。本文将详细介绍几种常见的备份方法、配置参数以及恢复流程,帮助您建立完善的GitLab备份与恢复策略。一、手动备份利用gitlab-rakegitlab:backup:create命令即可执行手动备份。此命令会备份GitLab仓库、数据库、用户、用户组、密钥和权限等关键信息。默认备份文件存储于/var/opt/gitlab/backups目录,您可通过修改/etc/gitlab

centos安装mysql centos安装mysql Apr 14, 2025 pm 08:09 PM

在 CentOS 上安装 MySQL 涉及以下步骤:添加合适的 MySQL yum 源。执行 yum install mysql-server 命令以安装 MySQL 服务器。使用 mysql_secure_installation 命令进行安全设置,例如设置 root 用户密码。根据需要自定义 MySQL 配置文件。调整 MySQL 参数和优化数据库以提升性能。

CentOS上PyTorch的分布式训练如何操作 CentOS上PyTorch的分布式训练如何操作 Apr 14, 2025 pm 06:36 PM

在CentOS系统上进行PyTorch分布式训练,需要按照以下步骤操作:PyTorch安装:前提是CentOS系统已安装Python和pip。根据您的CUDA版本,从PyTorch官网获取合适的安装命令。对于仅需CPU的训练,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,请确保已安装对应版本的CUDA和cuDNN,并使用相应的PyTorch版本进行安装。分布式环境配置:分布式训练通常需要多台机器或单机多GPU。所

docker原理详解 docker原理详解 Apr 14, 2025 pm 11:57 PM

Docker利用Linux内核特性,提供高效、隔离的应用运行环境。其工作原理如下:1. 镜像作为只读模板,包含运行应用所需的一切;2. 联合文件系统(UnionFS)层叠多个文件系统,只存储差异部分,节省空间并加快速度;3. 守护进程管理镜像和容器,客户端用于交互;4. Namespaces和cgroups实现容器隔离和资源限制;5. 多种网络模式支持容器互联。理解这些核心概念,才能更好地利用Docker。

CentOS下GitLab的日志如何查看 CentOS下GitLab的日志如何查看 Apr 14, 2025 pm 06:18 PM

CentOS系统下查看GitLab日志的完整指南本文将指导您如何查看CentOS系统中GitLab的各种日志,包括主要日志、异常日志以及其他相关日志。请注意,日志文件路径可能因GitLab版本和安装方式而异,若以下路径不存在,请检查GitLab安装目录及配置文件。一、查看GitLab主要日志使用以下命令查看GitLabRails应用程序的主要日志文件:命令:sudocat/var/log/gitlab/gitlab-rails/production.log此命令会显示produc

CentOS上PyTorch的GPU支持情况如何 CentOS上PyTorch的GPU支持情况如何 Apr 14, 2025 pm 06:48 PM

在CentOS系统上启用PyTorchGPU加速,需要安装CUDA、cuDNN以及PyTorch的GPU版本。以下步骤将引导您完成这一过程:CUDA和cuDNN安装确定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA显卡支持的CUDA版本。例如,您的MX450显卡可能支持CUDA11.1或更高版本。下载并安装CUDAToolkit:访问NVIDIACUDAToolkit官网,根据您显卡支持的最高CUDA版本下载并安装相应的版本。安装cuDNN库:前

See all articles