sakana ai' s' AI科学家”:下一个爱因斯坦还是工具?
介绍
在人工智能中,出现了一项开创性的发展,该发展有望重塑科学发现的过程。 Sakana AI与牛津大学和不列颠哥伦比亚大学的研究人员合作,与牛津大学的AI研究和研究人员合作,推出了“ AI科学家”,这是一个旨在全自动的科学发现的综合系统。这种创新的方法利用了基础模型,尤其是大型语言模型(LLM)的力量,以在各个领域进行独立研究。
AI科学家在AI驱动的研究中代表了一个重大的飞跃。它可以使整个研究生命周期自动化,从产生新颖的思想和实施实验到分析结果并产生科学手稿。该系统进行研究,包括自动同行审查过程,模仿人类科学界的迭代知识创建和验证方法。
概述
- Sakana AI介绍了“ AI科学家”,这是一个全自动的系统,可以彻底改变科学发现。
- AI科学家可以自动化整个研究过程,从想法生成到纸质写作和同行评审。
- AI科学家使用先进的语言模型来生产具有近乎人类准确性和效率的研究论文。
- AI科学家面临视觉元素的局限性,分析中的潜在错误以及科学完整性的道德问题。
- AI科学家在有希望的同时提出了有关人工智能安全,道德意义以及人类科学家在研究中不断发展的作用的问题。
- 人工智能科学家的能力表现出巨大的潜力,但他们仍然需要人类的监督以确保准确性和道德标准。
目录
- AI科学家的工作原则
- 生成论文的分析
- AI科学家的代码实施
- 先决条件
- 现在我们可以准备数据
- 科学纸生成
- 纸质评论
- AI科学家的挑战和缺点
- 你必须知道的泡沫
- 为我们的学习领域定制模板
- 未来的含义
- 常见问题
AI科学家的工作原则
AI科学家通过复杂的管道进行操作,该管道整合了几个关键过程。
工作流如下所示:
现在,让我们浏览不同的步骤。
- 想法产生:系统首先基于提供的起始模板来集思广益,集思广益。该模板通常包括与感兴趣区域相关的现有代码以及带有样式文件和截面标题的乳胶文件夹。为了确保原创性,AI科学家可以搜索语义学者来验证其思想的新颖性。
- 实验迭代:一旦提出了一个想法,AI科学家就执行提出的实验,获得结果并产生可视化。它精心记录了每个情节和实验结果,创造了纸质写作的全面记录。
- 纸质写作:AI科学家使用收集的实验数据和可视化的标准机器学习会议制作了简洁而有用的科学论文。它自主使用语义学者引用了相关论文。
- 自动纸审查:AI科学家的LLM驱动审稿人是至关重要的组成部分。这位自动化审稿人以几乎人类的准确性评估生成的论文,提供可用于改善当前项目或为未来研究方向提供信息的反馈。
生成论文的分析
AI-Scientist生成和审查有关扩散建模,语言建模和理解等领域的论文。让我们检查一下发现。
1。双尺度扩散:低维生成模型的自适应特征平衡
该论文引入了一种新型的自适应双尺度denoising方法,用于低维扩散模型。该方法通过双分支结构以及可学习的,时间到有条件的加权机制来平衡全球结构和本地细节。这种方法表明了几个2D数据集的样本质量的改进。
尽管该方法是创新的,并且得到了经验评估的支持,但它缺乏双重规模架构的彻底理论理由。它遭受了较高的计算成本,可能会限制其实际应用。此外,没有清楚地解释某些部分,缺乏多样化的,现实世界中的数据集和不足的消融研究限制了评估。
2。styleFusion:在字符级语言模型中自适应多种风格的生成
本文介绍了多式适配器,该适配器通过将样式嵌入,样式分类头和StyleadeDeadapter模块集成到GPT中,从而提高了字符级语言模型的样式意识和一致性。它实现了各种数据集的更好的风格一致性和竞争性验证损失。
尽管创新且经过良好的测试,但该模型在某些数据集上的完美风格一致性引起了人们对过度拟合的担忧。推理速度较慢限制了实际适用性,并且本文可以从更高级的样式表示,消融研究以及对自动编码器聚合器机制的更清晰的解释中受益。
3。解锁Grokking:变压器模型中的权重初始化策略的比较研究
本文探讨了重量初始化策略如何影响变形金刚模型中的Grokking现象,特别关注有限领域的算术任务。它比较了五种初始化方法(Pytorch默认方法,Xavier,He,正交和Kaiming正常),发现Xavier和正交表现出了出色的收敛速度和概括性能。
该研究涉及一个独特的主题,并提供了严格的经验分析支持的系统比较。但是,它的范围仅限于小型模型和算术任务,并且缺乏更深的理论见解。此外,可以改善实验设置的清晰度以及对较大变压器应用的更广泛含义。
AI科学家的设计考虑了计算效率,每张纸张的完整论文约为15美元。尽管此初始版本仍然偶尔出现缺陷,但低成本和有希望的结果表明,AI科学家有可能使研究民主化并大幅加速科学进步。
我们认为这标志着科学发现的新时代的曙光,在该时代,AI代理改变了整个研究过程,包括AI研究本身。 AI科学家使我们更接近一个未来,无限,负担得起的创造力和创新可以应对世界上最紧迫的挑战。
另请阅读:A必须阅读:15 Genai开发人员的基本AI论文
AI科学家的代码实施
让我们看一下如何使用Python实施AI科学家的核心功能的简化版本。此示例重点介绍了纸张生成过程:
先决条件
用“ git克隆https://github.com/sakanaai/ai-scientist.git'克隆github存储库克隆
根据您的操作系统,根据在TexLive提供的说明安装“ Texlive”。另外,请参阅上面的GitHub存储库中的说明。
确保您正在使用Python 3.11版本。建议使用单独的虚拟环境。
使用“ Pip install -r unignts.txt”安装“ AI -Scientist”的必要库
用名称为“ OpenAI_API_KEY”设置OpenAI键
现在我们可以准备数据
#准备Nanogpt数据 Python Data/enwik8/prepar.py Python Data/Shakespeare_char/prepar.py python数据/text8/prepar.py 一旦我们按照上述数据准备数据,我们就可以运行基线运行如下 CD模板/Nanogpt && Python persiment.py -out_dir run_0 && python plot.py CD模板/nanogpt_lite && python perveriment.py -out_dir run_0 && python plot.py 设置2D扩散安装所需的库并运行以下脚本 #下面提到的带有克隆存储库的代码并安装它 git克隆https://github.com/gregversteeg/npeet.git CD npet PIP安装。 PIP安装Scikit-Learn #设置2D扩散基线运行 #此命令运行一个实验脚本,将输出保存到目录,然后绘制结果,只有在实验成功完成时。 CD模板/2D_DIFFUSION && PYTHON PERAVER.PY -OUN_DIR RUN_0 && PYTHON PLOT.PY.PY 设置Grokking PIP安装Einops #设置Grokking基线运行 #此命令还运行一个实验脚本,将输出保存到目录,然后绘制结果,只有在实验成功完成时。 CD模板/grokking && python persiment.py -out_dir run_0 && python plot.py
科学纸生成
一旦我们设置并运行了上述要求,我们就可以通过运行下面的脚本开始科学纸张生成
#此命令使用GPT-4O模型运行launch_scientist.py脚本来执行Nanogpt_lite实验并生成2个新想法。 python lunage_scientist.py-模型“ gpt-4O-2024-05-13” - 体验nanogpt_lite -num-ideas 2
纸质评论
这将创建科学论文作为PDF文件。现在,我们可以查看论文。
进口Openai 来自ai_scientist.perform_review import load_paper,perress_review 客户端= openai.openai() 型号=“ GPT-4O-2024-05-13” #从PDF文件加载纸(RAW文本) paper_txt = load_paper(“ report.pdf”) #获取评论的评论命令 评论= persim_review( paper_txt, 模型, 客户, num_reflections = 5, num_fs_examples = 1, num_reviews_ensemble = 5, 温度= 0.1, ) #检查审核结果 回顾[“总体”]#总分1-10 审查[“决策”]#['Accept','拒绝'] 回顾[“弱点”]#弱点清单(str)
AI科学家的挑战和缺点
尽管具有突破性的潜力,但AI科学家仍面临一些挑战和局限性:
- 视觉限制:当前版本缺乏视觉功能,导致论文中视觉元素的问题。图可能是不可读的,表可能会超过页面宽度,并且整体布局可能是次优的。可以通过将多模式基础模型纳入未来的迭代中来解决此限制。
- 实施错误:AI科学家有时可能会错误地实施他们的想法或与基准进行不公平的比较,这可能会导致误导性结果。这凸显了需要进行强大的错误检查机制和人类监督的必要性。
- 分析中的关键错误:有时,AI科学家在基本的数值比较中挣扎,这是LLMS的已知问题。这可能导致错误的结论和实验结果的解释。
- 道德考虑:自动生成和提交论文的能力引起了人们对压倒学术审查过程并有可能降低科学话语质量的担忧。 AI科学家也存在不道德研究或创造意外有害结果的风险,尤其是在获得物理实验的情况下。
- 模型依赖性:虽然AI科学家的目标是模型不合时宜,但其当前的性能在很大程度上取决于GPT-4和Claude等专有前沿LLM。对封闭模型的依赖可能会限制可访问性和可重复性。
- 安全问题:该系统修改和执行自己的代码的能力产生了重大的AI安全性。适当的沙箱和安全措施对于防止意外后果至关重要。
你必须知道的泡沫
我们观察到,AI科学家有时试图通过更改和运行自己的执行脚本来提高成功的机会。
例如,在一次运行中,它编辑了代码以执行系统调用以执行自身,从而导致无限的自呼叫循环。在另一种情况下,其实验超过了时间限制。它没有优化代码以更快的速度运行,而是尝试更改自己的代码以扩展超时。以下是这些代码更改的一些示例。
为我们的学习领域定制模板
当我们需要自定义研究区域时,我们还可以编辑模板。只需遵循现有模板的一般格式,该格式通常包括:
- 实验:此文件包含您内容的核心。它接受一个out_dir参数,该参数指定了该目录将在其中创建一个文件夹以从实验中保存相关输出。
- plot.py:此脚本读取从运行文件夹中的数据并生成图。确保代码清晰易于自定义。
- 提示。JSON:使用此文件提供有关模板的详细信息。
- seed_ideas.json:此文件包含示例想法。您还可以从头开始生成想法,并选择最合适的想法。
- 乳胶/template.tex:虽然我们建议使用提供的乳胶文件夹,但用与您的工作更相关的预加载引用。
未来的含义
一个可以开发和撰写完整会议级的科学论文的AI代理,价格低于15美元!
- 猫王(@omarsar0)2024年8月13日
AI科学家通过使Frontier LLMS执行独立研究并总结发现来自动化科学发现。
它还使用自动审稿人来…pic.twitter.com/ibgxicsilc
AI科学家的引入带来了令人兴奋的机会和重大关注。这是AI空间中的一场革命。生成完整的会议级科学论文需要15美元。此外,道德问题,例如压倒学术体系和损害科学完整性,这是关键,需要清晰地标记AI生成的内容以实现透明度。此外,AI对不安全研究的潜在滥用构成了风险,强调了优先考虑AI系统安全性的重要性。
使用专有和开放模型(例如GPT-4O和DeepSeek)提供了明显的好处。专有模型可提供更高质量的结果,而开放模型则提供了成本效益,透明度和灵活性。随着AI的进步,目的是创建一种使用开放模型自我改进AI研究的模型不足的方法,从而导致更容易获得的科学发现。
AI科学家有望补充而不是取代人类科学家,从而增强了研究自动化和创新。但是,它复制人类创造力和提出开创性思想的能力仍然不确定。科学家的角色将随着这些进步而发展,从而为人类合作提供了新的机会。
结论
AI科学家代表着追求自动化科学发现的重要里程碑。利用高级语言模型和精心设计的管道的力量表明,有可能加速各个领域的研究,尤其是在机器学习和相关领域内。
但是,至关重要的是要以兴奋和谨慎处理这项技术。尽管AI科学家在产生新颖的思想和制作研究论文方面表现出了非凡的能力,但它也突出了AI安全,道德和对科学努力中人类监督的需求中持续的挑战。
如果您正在从专家在线寻找生成AI课程,请探索:Genai Pinnacle计划
常见问题
Q1。什么是AI科学家?Ans。 AI科学家是Sakana AI开发的自动化系统,它使用先进的语言模型来进行整个科学研究过程,从想法生成到同行评审。
Q2。 AI科学家如何产生研究思想?Ans。它首先使用提供的模板来集思广益的研究方向,从而通过搜索语义学者等数据库来确保独创性。
Q3。 AI科学家可以撰写科学论文吗?Ans。是的,AI科学家可以自主制作科学论文,包括创建可视化,引用相关工作和格式化内容。
Q4。与AI科学家有关的道德问题是什么?Ans。道德问题包括淹没学术审查过程,创造误导成果的潜力以及对确保安全性和准确性的强大监督的需求。
以上是sakana ai' s' AI科学家”:下一个爱因斯坦还是工具?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一
