>數據科學和人工智能工程的不斷發展的景觀:查看挑戰和機遇
>生成的AI(Genai)和大語言模型(LLM)正在重塑專業世界,尤其是在數據科學中。 這個Genai驅動的環境給有抱負和建立的數據科學家帶來了前所未有的挑戰。本文分享了與傳統ML和Genai合作的六年多以來的見解和經驗,對成功數據科學家的不斷發展的作用提供了觀點。
免責聲明:
不受歡迎的意見:數據科學家的角色比以往任何時候都更加要求。目錄的表
定義“好”數據科學家
挑戰#1:高期望,有限的數據和策略“深度學習?我們專注於
在這裡學習。數據工程是它所處的位置。” -一個假設的雇主,2015Genai時代的V形數據科學家> >我的旅程始於R和SQL,分析了北歐股票市場的趨勢。 我研究的尖端深度學習感覺到了世界。現在,我的重點是LLMS,Genai和Agentic Workfrows,它們使用打字稿構建Genai服務。這種轉變反映了對數據專業人員的期望的更廣泛的發展 - 從傳統的ML/DL到生成AI和LLM。 “好”數據科學家的定義已經擴展。角色差異很大,從A/B測試和統計建模到端到端(E2E)ML管道所有權。 但是,核心技能仍然至關重要:
我的論文強調了在這個快速變化時代成功的V形技巧:
深度AI/ML專業知識
>業務敏銳度編程和系統開發 數據工程
道德考慮與治理
“我們需要AI,Genai,LLMS!我們的競爭對手正在使用Chatgpt。建立聊天機器人!哦,您的第一年沒有數據。隱私問題。” - 假設的經理,2023
>
AI是許多組織的重中之重。 Chatgpt的興起推動了朝著“ AI驅動”的業務奔波。 雖然通過LLMS集成AI似乎很容易,但現實很複雜。
關鍵挑戰突出了期望與現實之間的差距:
一個假設的非AI同事,2024
> AI繁榮導致自稱專家的激增。 儘管通過LLM的AI商品化是積極的,但它也稀釋了專業知識。 參加及時的工程課程並不會使某人成為AI專家。
這個炒作帶來了挑戰:自稱專家的興起 :
過分自信和缺乏真正的專業知識可能會阻礙進步。
未對準技能:
>
“數據科學家?您什麼?您可以幫助此SQL查詢嗎?” - 假設的同事,2024
>
>數據科學家角色缺乏明確的定義。 職責差異很大:
“數據,我的朋友,敵人和合作夥伴。我應該使用llms生成合成數據嗎?” -
假設數據科學家,2024>垃圾,垃圾(Gigo)仍然是一個重要的問題。許多公司對其數據缺乏全面的了解,從而導致有效地使用AI的挑戰。 6。挑戰#5:對域專業知識的關鍵需求>
>
“您不是科學家嗎?您不應該知道有關金融和法律的一切嗎?使用Chatgpt!” - 一個假設的領域專家,2022-2023
>>> LLM強大,但深厚的領域專業知識仍然至關重要。 與領域專家的合作至關重要:>
上下文理解:提供數據分析中經常缺少的上下文。
“數據管道,模型部署,LLM優化和雲基礎架構?我只是想訓練模型!” - 假設數據科學家,2024
>>操作AI系統至關重要。 了解DataOps,MLOPS,AIOPS和LLMOPS對於成功的生產部署至關重要。
8。挑戰#7:適應快速技術進步
“新圖書館與我們的堆棧不兼容,但是它更快。我會適合。” -假設工程經理,2024>
技術變革的迅速步伐既提出了機遇和挑戰:
數據科學領域正在迅速發展。 成功需要融合技術專長,業務敏銳度,協作技巧以及致力於持續學習的承諾。
10。參考[1] Elwin,M。 (2024)。 V形數據科學家在生成AI時代。
中等。 [鏈接到原始中等文章] [2-10] [鏈接到其餘參考]
以上是不受歡迎的意見:成為一名好數據科學家比以往任何時候都更難的詳細內容。更多資訊請關注PHP中文網其他相關文章!