>数据科学和人工智能工程的不断发展的景观:查看挑战和机遇
>生成的AI(Genai)和大语言模型(LLM)正在重塑专业世界,尤其是在数据科学中。 这个Genai驱动的环境给有抱负和建立的数据科学家带来了前所未有的挑战。本文分享了与传统ML和Genai合作的六年多以来的见解和经验,对成功数据科学家的不断发展的作用提供了观点。
免责声明:
不受欢迎的意见:数据科学家的角色比以往任何时候都更加要求。目录的表
定义“好”数据科学家
挑战#1:高期望,有限的数据和策略“深度学习?我们专注于
在这里学习。数据工程是它所处的位置。” -一个假设的雇主,2015Genai时代的V形数据科学家> >我的旅程始于R和SQL,分析了北欧股票市场的趋势。 我研究的尖端深度学习感觉到了世界。现在,我的重点是LLMS,Genai和Agentic Workfrows,它们使用打字稿构建Genai服务。这种转变反映了对数据专业人员的期望的更广泛的发展 - 从传统的ML/DL到生成AI和LLM。 “好”数据科学家的定义已经扩展。角色差异很大,从A/B测试和统计建模到端到端(E2E)ML管道所有权。 但是,核心技能仍然至关重要:
我的论文强调了在这个快速变化时代成功的V形技巧:
深度AI/ML专业知识
>业务敏锐度编程和系统开发 数据工程
道德考虑与治理
“我们需要AI,Genai,LLMS!我们的竞争对手正在使用Chatgpt。建立聊天机器人!哦,您的第一年没有数据。隐私问题。” - 假设的经理,2023
>
AI是许多组织的重中之重。 Chatgpt的兴起推动了朝着“ AI驱动”的业务奔波。 虽然通过LLMS集成AI似乎很容易,但现实很复杂。
关键挑战突出了期望与现实之间的差距:
一个假设的非AI同事,2024
> AI繁荣导致自称专家的激增。 尽管通过LLM的AI商品化是积极的,但它也稀释了专业知识。 参加及时的工程课程并不会使某人成为AI专家。
这个炒作带来了挑战:自称专家的兴起 :
过分自信和缺乏真正的专业知识可能会阻碍进步。
未对准技能:
>
“数据科学家?您什么?您可以帮助此SQL查询吗?” - 假设的同事,2024
>
>数据科学家角色缺乏明确的定义。 职责差异很大:
“数据,我的朋友,敌人和合作伙伴。我应该使用llms生成合成数据吗?” -
假设数据科学家,2024>垃圾,垃圾(Gigo)仍然是一个重要的问题。许多公司对其数据缺乏全面的了解,从而导致有效地使用AI的挑战。 6。挑战#5:对域专业知识的关键需求>
>
“您不是科学家吗?您不应该知道有关金融和法律的一切吗?使用Chatgpt!” - 一个假设的领域专家,2022-2023
>>> LLM强大,但深厚的领域专业知识仍然至关重要。 与领域专家的合作至关重要:>
上下文理解:提供数据分析中经常缺少的上下文。
“数据管道,模型部署,LLM优化和云基础架构?我只是想训练模型!” - 假设数据科学家,2024
>>操作AI系统至关重要。 了解DataOps,MLOPS,AIOPS和LLMOPS对于成功的生产部署至关重要。
8。挑战#7:适应快速技术进步
“新图书馆与我们的堆栈不兼容,但是它更快。我会适合。” -假设工程经理,2024>
技术变革的迅速步伐既提出了机遇和挑战:
数据科学领域正在迅速发展。 成功需要融合技术专长,业务敏锐度,协作技巧以及致力于持续学习的承诺。
10。参考[1] Elwin,M。(2024)。 V形数据科学家在生成AI时代。
中等。 [链接到原始中等文章] [2-10] [链接到其余参考]
以上是不受欢迎的意见:成为一名好数据科学家比以往任何时候都更难的详细内容。更多信息请关注PHP中文网其他相关文章!