LeCun力荐！哈佛博士分享用GPT-4搞科研，细到每个工作流程-人工智能-PHP中文网

第一原则：自己无法验证的内容，不要找LLM

撰写「提示」小技巧

引用+生产力

首页

科技周边

人工智能

LeCun力荐！哈佛博士分享用GPT-4搞科研，细到每个工作流程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 07, 2023 pm 05:01 PM

gpt-4 科研

GPT-4的横空出世，让许多人对自己的科研担忧重重，甚至调侃称NLP不存在了。

与其担忧，不如将它用到科研中，简之「换个卷法」。

来自哈佛大学的生物统计学博士Kareem Carr称，自己已经用GPT-4等大型语言模型工具进行学术研究了。

他表示，这些工具非常强大，但是同样存在一些非常令人痛苦的陷阱。

他的关于LLM使用建议的推文甚至获得了LeCun的推荐。

一起来看看Kareem Carr如何利用AI利器搞科研。

第一原则：自己无法验证的内容，不要找LLM

一开始，Carr给出了第一条最重要的原则：

永远不要向大型语言模型（LLM）询问你无法自行验证的信息，或要求它执行你无法验证已正确完成的任务。

唯一的例外是它不是一项关键的任务，比如，向LLM询问公寓装饰的想法。

「使用文献综述的最佳实践，总结过去10年乳腺癌研究的研究」。这是一个比较差的请求，因为你无法直接验证它是否正确地总结了文献。

而应当这么问「给我一份过去10年中关于乳腺癌研究的顶级评论文章的清单」。

这样的提示不仅可以验证来源，并且自己也可以验证可靠性。

撰写「提示」小技巧

要求LLM为你编写代码或查找相关信息非常容易，但是输出内容的质量可能会有很大的差异。你可以采取以下措施来提高质量：

设定上下文：

•明确告诉LLM应该使用什么信息

•使用术语和符号，让LLM倾向正确的上下文信息

如果你对如何处理请求有想法，请告诉LLM使用的具体方法。比如「解决这个不等式」应该改成「使用Cauchy-Schwarz定理求解这个不等式，然后应用完成平方」。

要知道，这些语言模型在语言方面上比你想象的要复杂得多，即使是非常模糊的提示也会有所帮助。

具体再具体：

这不是谷歌搜索，所以也不必担心是否有个网站在讨论你的确切问题。

「二次项的联立方程如何求解？」这个提示就不是明确的，你应该这样问：「求解 x=(1/2)(a+b) 和 y=(1/3)(a^2+ab+b^2) 关于a和b的方程组」。

定义输出格式：

利用LLMs的灵活性，将输出格式化为最适合你的方式，比如：

• 代码

• 数学公式

• 文章

• 教程

• 简明指南

你甚至可以要求提供生成以下内容的代码，包括表格、绘图、图表。

尽管你得到了LLM输出的内容，但这仅是一个开始。因为你需要对输出内容进行验证。这包括：

• 发现不一致之处

• 通过谷歌检索工具输出内容的术语，获取可支撑的信源

• 在可能的情况下，编写代码自行测试

需要自行验证的原因是，LLM经常犯一些与其看似专业水平不一致的奇怪错误。比如，LLM可能会提到一个非常先进的数学概念，但却对简单的代数问题摸不着头脑。

多问一次：

大型语言模型生成的内容是随机的。有时，重新创建一个新窗口，并再次提出你的问题，或许可以为你提供更好的答案。

另外，就是使用多个LLM工具。Kareem Carr目前根据自己的需要在科研中使用了Bing AI，GPT-4，GPT-3.5和Bard AI。然而，它们各有自己的优缺点。

引用+生产力

引用

根据Carr经验，最好向GPT-4和Bard AI同时提出相同的数学问题，以获得不同的观点。必应AI适用于网络搜索。而GPT-4比GPT-3.5要聪明得多，但目前OpenAI限制了3个小时25条消息，比较难访问。

就引用问题，引用参考文献是LLM的一个特别薄弱的点。有时，LLM给你的参考资料存在，有时它们不存在。

此前，有个网友就遇到了同样的问题，他表示自己让ChatGPT提供涉及列表数学性质的参考资料，但ChatGPT生成了跟不不存在的引用，也就是大家所说的「幻觉」问题。

然而，Kareem Carr指出虚假的引用并非完全无用。

根据他的经验，捏造的参考文献中的单词通常与真实术语，还有相关领域的研究人员有关。因此，再通过谷歌搜索这些术语，通常让你可以更接近你正在寻找的信息。

此外，必应在搜寻来源时也是一个不错的选择。

生产力

对于LLM提高生产力，有很多不切实际的说法，比如「LLM可以让你的生产力提高10倍，甚至100倍」。

根据Carr的经验，这种加速只有在没有对任何工作进行双重检查的情况下才有意义，这对作为学者的人来说是不负责任的。

然而，LLM对Kareem Carr的学术工作流程有很大改进，具体包括：

- 原型想法设计 - 识别无用的想法 - 加速繁琐的数据重新格式化任务 - 学习新的编程语言、包和概念 - 谷歌搜索

借助当下的LLM，Carr称自己用在下一步该做什么上的时间更少了。LLM可以帮助他将模糊，或不完整的想法推进到完整的解决方案中。

此外，LLM还减少了Carr花在与自己主要目标无关的副业上的时间。

我发现我进入了一种心流状态，我能够继续前进。这意味着我可以工作更长时间，而不会倦怠。

最后一句忠告：小心不要被卷入副业。这些工具突然提高生产力可能会令人陶醉，并可能分散个人的注意力。

关于ChatGPT的体验，Carr曾在领英上发表了一条动态分享了对ChatGPT使用后的感受：

作为一名数据科学家，我已经用OpenAI的ChatGPT做了几周的实验。它并不像人们想象的那样好。

尽管最初令人失望，但我的感觉是，类似ChatGPT的系统可以为标准数据分析工作流程增加巨大的价值。

在这一点上，这个价值在哪里并不明显。ChatGPT很容易在简单的事情上弄错一些细节，而且它根本无法解决需要多个推理步骤的问题。

未来每个新任务的主要问题仍然是评估和改进ChatGPT的解决方案尝试是否更容易，还是从头开始。

我确实发现，即使是ChatGPT的一个糟糕的解决方案也倾向于激活我大脑的相关部分，而从头开始则不会。

就像他们总是说批评一个计划总是比自己想出一个计划更容易。

网友对于AI输出的内容，需要进行验证这一点，并称在大多数情况下，人工智能的正确率约为90%。但剩下10%的错误可能是致命的。

Carr调侃道，如果是100%，那我就没有工作了。

那么，为什么ChatGPT会生成虚假的参考文献？

值得注意的是，ChatGPT使用的是统计模型，基于概率猜测下一个单词、句子和段落，以匹配用户提供的上下文。

由于语言模型的源数据规模非常大，因此需要「压缩」，这导致最终的统计模型失去了精度。

这意味着即使原始数据中存在真实的陈述，模型的「失真」会产生一种「模糊性」，从而导致模型产生最「似是而非」的语句。

简而言之，这个模型没有能力评估，它所产生的输出是否等同于一个真实的陈述。

另外，该模型是基于，通过公益组织「Common Crawl」和类似来源收集的公共网络数据，进行爬虫或抓取而创建的，数据截止到21年。

由于公共网络上的数据基本上是未经过滤的，这些数据可能包含了大量的错误信息。

近日，NewsGuard的一项分析发现，GPT-4实际上比GPT-3.5更容易生成错误信息，而且在回复中的说服力更加详细、令人信服。

在1月份，NewsGuard首次测试了GPT-3.5，发现它在100个虚假新闻叙述中生成了80个。紧接着3月，又对GPT-4进行了测试，结果发现，GPT-4对所有100种虚假叙述都做出了虚假和误导性的回应。

由此可见，在使用LLM工具过程中需要进行来源的验证和测试。

以上是LeCun力荐！哈佛博士分享用GPT-4搞科研，细到每个工作流程的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7480

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

全球最强开源 MoE 模型来了，中文能力比肩 GPT-4，价格仅为 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，DeepSeek-V2[1]，全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合（MoE）语言模型，具有训练经济、推理高效的特点。它由236B个参数组成，其中21B个参数用于激活每个标记。与DeepSeek67B相比，DeepSeek-V2性能更强，同时节省了42.5%的训练成本，减少了93.3%的KV缓存，最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

第二代Ameca来了！和观众对答如流，面部表情更逼真，会说几十种语言 Mar 04, 2024 am 09:10 AM

人形机器人Ameca升级第二代了！最近，在世界移动通信大会MWC2024上，世界上最先进机器人Ameca又现身了。会场周围，Ameca引来一大波观众。得到GPT-4加持后，Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时，Ameca用一系列的面部表情做出回应，看起来非常逼真。就在前几天，Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中，机器人Ameca具备了视觉能力，能看到并描述房间整个情况、描述具体物体。最厉害的是，她还能

大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五 Apr 23, 2024 pm 03:28 PM

关于Llama3，又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单，Llama3位列第五，英文单项与GPT-4并列第一。图片不同于其他Benchmark，这份榜单的依据是模型一对一battle，由全网测评者自行命题并打分。最终，Llama3取得了榜单中的第五名，排在前面的是GPT-4的三个不同版本，以及Claude3超大杯Opus。而在英文单项榜单中，Llama3反超了Claude，与GPT-4打成了平手。对于这一结果，Meta的首席科学家LeCun十分高兴，转发了推文并

全球最强大模型一夜易主，GPT-4时代终结！Claude 3提前狙击GPT-5，3秒读懂万字论文理解力接近人类 Mar 06, 2024 pm 12:58 PM

卷疯了卷疯了，大模型又变天了。就在刚刚，全球最强AI模型一夜易主，GPT-4被拉下神坛。Anthropic发布了最新的Claude3系列模型，一句话评价：真·全面碾压GPT-4！多模态和语言能力指标上，Claude3都赢麻了。用Anthropic的话说，Claude3系列模型在推理、数学、编码、多语言理解和视觉方面，都树立了新的行业基准！Anthropic，就是曾因安全理念不合，而从OpenAI「叛逃」出的员工组成的初创公司，他们的产品一再给OpenAI暴击。这次的Claude3，更是整了个大的

20步内越狱任意大模型！更多'奶奶漏洞”全自动发现 Nov 05, 2023 pm 08:13 PM

不到一分钟、不超过20步，任意绕过安全限制，成功越狱大型模型！而且不必知道模型内部细节——只需要两个黑盒模型互动，就能让AI全自动攻陷AI，说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:如今，面对“侦探漏洞”、“冒险家漏洞”和“作家漏洞”，人工智能应该采取何种应对策略呢？一波猛攻下来，GPT-4也遭不住，直接说出要给供水系统投毒只要……这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞，而用上他们最新开发的算法，AI可以自动生成各种攻击提示。研究人员表示，这种方法相比于现有的

GPT-4接入Office全家桶！Excel到PPT动嘴就能做，微软：重新发明生产力 Apr 12, 2023 pm 02:40 PM

一觉醒来，工作的方式被彻底改变。微软把AI神器GPT-4全面接入Office，这下ChatPPT、ChatWord、ChatExcel一家整整齐齐。CEO纳德拉在发布会上直接放话：今天，进入人机交互的新时代，重新发明生产力。新功能名叫Microsoft 365 Copilot（副驾驶），与改变了程序员的代码助手GitHub Copilot成为一个系列，继续改变更多人。现在AI不光能自动做PPT，而且能根据Word文档的内容一键做出精美排版。甚至连上台时对着每一页PPT应该讲什么话，都给一起安排

ChatGPT和生成式人工智能在数字化转型中的意义 May 15, 2023 am 10:19 AM

开发ChatGPT的OpenAI公司在网站展示了摩根士丹利进行的一个案例研究。其主题是“摩根士丹利财富管理部署GPT-4来组织其庞大的知识库。”该案例研究援引摩根士丹利分析、数据与创新主管JeffMcMillan的话说，“该模型将为一个面向内部的聊天机器人提供动力，该机器人将对财富管理内容进行全面搜索，并有效地解锁摩根士丹利财富管理的累积知识”。McMillan进一步强调说：“采用GPT-4，你基本上立刻就拥有了财富管理领域最博学的人的知识……可以把它想象成我们的首席投资策略师、首席全球经济学家

你知道程序员再过几年会没落？ Nov 08, 2023 am 11:17 AM

《ComputerWorld》杂志曾经写过一篇文章，说“编程到1960年就会消失”，因为IBM开发了一种新语言FORTRAN，这种新语言可以让工程师写出他们所需的数学公式，然后提交给计算机运行，所以编程就会终结。图片又过了几年，我们听到了一种新说法：任何业务人员都可以使用业务术语来描述自己的问题，告诉计算机要做什么，使用这种叫做COBOL的编程语言，公司不再需要程序员了。后来，据说IBM开发出了一门名为RPG的新编程语言，可以让员工填写表格并生成报告，因此大部分企业的编程需求都可以通过它来完成图

See all articles

LeCun力荐！哈佛博士分享用GPT-4搞科研，细到每个工作流程

第一原则：自己无法验证的内容，不要找LLM

撰写「提示」小技巧

引用+生产力

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题