sakana ai＆＃039; s' AI科学家”：下一个爱因斯坦还是工具？-人工智能-PHP中文网

在人工智能中，出现了一项开创性的发展，该发展有望重塑科学发现的过程。 Sakana AI与牛津大学和不列颠哥伦比亚大学的研究人员合作，与牛津大学的AI研究和研究人员合作，推出了“ AI科学家”，这是一个旨在全自动的科学发现的综合系统。这种创新的方法利用了基础模型，尤其是大型语言模型（LLM）的力量，以在各个领域进行独立研究。

AI科学家在AI驱动的研究中代表了一个重大的飞跃。它可以使整个研究生命周期自动化，从产生新颖的思想和实施实验到分析结果并产生科学手稿。该系统进行研究，包括自动同行审查过程，模仿人类科学界的迭代知识创建和验证方法。

sakana ai＆＃039; s' AI科学家”：下一个爱因斯坦还是工具？

概述

Sakana AI介绍了“ AI科学家”，这是一个全自动的系统，可以彻底改变科学发现。
AI科学家可以自动化整个研究过程，从想法生成到纸质写作和同行评审。
AI科学家使用先进的语言模型来生产具有近乎人类准确性和效率的研究论文。
AI科学家面临视觉元素的局限性，分析中的潜在错误以及科学完整性的道德问题。
AI科学家在有希望的同时提出了有关人工智能安全，道德意义以及人类科学家在研究中不断发展的作用的问题。
人工智能科学家的能力表现出巨大的潜力，但他们仍然需要人类的监督以确保准确性和道德标准。

AI科学家的工作原则

AI科学家通过复杂的管道进行操作，该管道整合了几个关键过程。

工作流如下所示：

sakana ai＆＃039; s' AI科学家”：下一个爱因斯坦还是工具？

现在，让我们浏览不同的步骤。

想法产生：系统首先基于提供的起始模板来集思广益，集思广益。该模板通常包括与感兴趣区域相关的现有代码以及带有样式文件和截面标题的乳胶文件夹。为了确保原创性，AI科学家可以搜索语义学者来验证其思想的新颖性。
实验迭代：一旦提出了一个想法，AI科学家就执行提出的实验，获得结果并产生可视化。它精心记录了每个情节和实验结果，创造了纸质写作的全面记录。
纸质写作：AI科学家使用收集的实验数据和可视化的标准机器学习会议制作了简洁而有用的科学论文。它自主使用语义学者引用了相关论文。
自动纸审查：AI科学家的LLM驱动审稿人是至关重要的组成部分。这位自动化审稿人以几乎人类的准确性评估生成的论文，提供可用于改善当前项目或为未来研究方向提供信息的反馈。

生成论文的分析

AI-Scientist生成和审查有关扩散建模，语言建模和理解等领域的论文。让我们检查一下发现。

1。双尺度扩散：低维生成模型的自适应特征平衡

该论文引入了一种新型的自适应双尺度denoising方法，用于低维扩散模型。该方法通过双分支结构以及可学习的，时间到有条件的加权机制来平衡全球结构和本地细节。这种方法表明了几个2D数据集的样本质量的改进。

尽管该方法是创新的，并且得到了经验评估的支持，但它缺乏双重规模架构的彻底理论理由。它遭受了较高的计算成本，可能会限制其实际应用。此外，没有清楚地解释某些部分，缺乏多样化的，现实世界中的数据集和不足的消融研究限制了评估。

2。styleFusion：在字符级语言模型中自适应多种风格的生成

本文介绍了多式适配器，该适配器通过将样式嵌入，样式分类头和StyleadeDeadapter模块集成到GPT中，从而提高了字符级语言模型的样式意识和一致性。它实现了各种数据集的更好的风格一致性和竞争性验证损失。

尽管创新且经过良好的测试，但该模型在某些数据集上的完美风格一致性引起了人们对过度拟合的担忧。推理速度较慢限制了实际适用性，并且本文可以从更高级的样式表示，消融研究以及对自动编码器聚合器机制的更清晰的解释中受益。

3。解锁Grokking：变压器模型中的权重初始化策略的比较研究

本文探讨了重量初始化策略如何影响变形金刚模型中的Grokking现象，特别关注有限领域的算术任务。它比较了五种初始化方法（Pytorch默认方法，Xavier，He，正交和Kaiming正常），发现Xavier和正交表现出了出色的收敛速度和概括性能。

该研究涉及一个独特的主题，并提供了严格的经验分析支持的系统比较。但是，它的范围仅限于小型模型和算术任务，并且缺乏更深的理论见解。此外，可以改善实验设置的清晰度以及对较大变压器应用的更广泛含义。

AI科学家的设计考虑了计算效率，每张纸张的完整论文约为15美元。尽管此初始版本仍然偶尔出现缺陷，但低成本和有希望的结果表明，AI科学家有可能使研究民主化并大幅加速科学进步。

我们认为这标志着科学发现的新时代的曙光，在该时代，AI代理改变了整个研究过程，包括AI研究本身。 AI科学家使我们更接近一个未来，无限，负担得起的创造力和创新可以应对世界上最紧迫的挑战。

另请阅读：A必须阅读：15 Genai开发人员的基本AI论文

AI科学家的代码实施

让我们看一下如何使用Python实施AI科学家的核心功能的简化版本。此示例重点介绍了纸张生成过程：

先决条件

用“ git克隆https://github.com/sakanaai/ai-scientist.git'克隆github存储库克隆

根据您的操作系统，根据在TexLive提供的说明安装“ Texlive”。另外，请参阅上面的GitHub存储库中的说明。

确保您正在使用Python 3.11版本。建议使用单独的虚拟环境。

使用“ Pip install -r unignts.txt”安装“ AI -Scientist”的必要库

用名称为“ OpenAI_API_KEY”设置OpenAI键

现在我们可以准备数据

＃准备Nanogpt数据

Python Data/enwik8/prepar.py

Python Data/Shakespeare_char/prepar.py

python数据/text8/prepar.py

一旦我们按照上述数据准备数据，我们就可以运行基线运行如下

CD模板/Nanogpt && Python persiment.py -out_dir run_0 && python plot.py

CD模板/nanogpt_lite && python perveriment.py -out_dir run_0 && python plot.py

设置2D扩散安装所需的库并运行以下脚本

＃下面提到的带有克隆存储库的代码并安装它

git克隆https://github.com/gregversteeg/npeet.git

CD npet

PIP安装。

PIP安装Scikit-Learn

＃设置2D扩散基线运行

＃此命令运行一个实验脚本，将输出保存到目录，然后绘制结果，只有在实验成功完成时。

CD模板/2D_DIFFUSION && PYTHON PERAVER.PY -OUN_DIR RUN_0 && PYTHON PLOT.PY.PY

设置Grokking

PIP安装Einops

＃设置Grokking基线运行

＃此命令还运行一个实验脚本，将输出保存到目录，然后绘制结果，只有在实验成功完成时。

CD模板/grokking && python persiment.py -out_dir run_0 && python plot.py

登录后复制

科学纸生成

一旦我们设置并运行了上述要求，我们就可以通过运行下面的脚本开始科学纸张生成

＃此命令使用GPT-4O模型运行launch_scientist.py脚本来执行Nanogpt_lite实验并生成2个新想法。

python lunage_scientist.py-模型“ gpt-4O-2024-05-13”  - 体验nanogpt_lite -num-ideas 2

登录后复制

纸质评论

这将创建科学论文作为PDF文件。现在，我们可以查看论文。

进口Openai

来自ai_scientist.perform_review import load_paper，perress_review

客户端= openai.openai（）

型号=“ GPT-4O-2024-05-13”

＃从PDF文件加载纸（RAW文本）

paper_txt = load_paper（“ report.pdf”）

＃获取评论的评论命令

评论= persim_review（

paper_txt，

模型，

客户，

num_reflections = 5，

num_fs_examples = 1，

num_reviews_ensemble = 5，

温度= 0.1，

）

＃检查审核结果

回顾[“总体”]＃总分1-10

审查[“决策”]＃['Accept'，'拒绝']

回顾[“弱点”]＃弱点清单（str）

登录后复制

AI科学家的挑战和缺点

尽管具有突破性的潜力，但AI科学家仍面临一些挑战和局限性：

视觉限制：当前版本缺乏视觉功能，导致论文中视觉元素的问题。图可能是不可读的，表可能会超过页面宽度，并且整体布局可能是次优的。可以通过将多模式基础模型纳入未来的迭代中来解决此限制。
实施错误：AI科学家有时可能会错误地实施他们的想法或与基准进行不公平的比较，这可能会导致误导性结果。这凸显了需要进行强大的错误检查机制和人类监督的必要性。
分析中的关键错误：有时，AI科学家在基本的数值比较中挣扎，这是LLMS的已知问题。这可能导致错误的结论和实验结果的解释。
道德考虑：自动生成和提交论文的能力引起了人们对压倒学术审查过程并有可能降低科学话语质量的担忧。 AI科学家也存在不道德研究或创造意外有害结果的风险，尤其是在获得物理实验的情况下。
模型依赖性：虽然AI科学家的目标是模型不合时宜，但其当前的性能在很大程度上取决于GPT-4和Claude等专有前沿LLM。对封闭模型的依赖可能会限制可访问性和可重复性。
安全问题：该系统修改和执行自己的代码的能力产生了重大的AI安全性。适当的沙箱和安全措施对于防止意外后果至关重要。