AIGC(AI- Generated Content,人工智慧生產內容),指利用AI技術自動或協助產生文字、程式碼、圖像、語音、視訊、3D物件等各種形式的內容的生產方式。 AIGC代表了AI技術發展的新趨勢,從感知理解世界到生成創造世界,從分析能力到創作能力。 AIGC也帶來了內容創作的變革,並提高了內容的品質、效率和多樣性。
1.1 文字產生
文字產生是指利用AI技術,根據給定的輸入(如關鍵字、圖片、語音等),自動產生符合語法和邏輯的文字內容,是AIGC的一個重要面向。
文本生成的應用場景非常豐富,包括新聞寫作、小說創作、行銷文案、客服問答、聊天機器人、教育輔導、知識圖譜、摘要生成等。
➤ 文心一言:由百度推出的支援多模態輸出的AI大模型,能夠進行文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等。
➤ ChatGPT:由OpenAI推出基於GPT系列模型的聊天應用,目前已推出GPT-4模型,基於GPT-4模型的ChatGPT可以分析圖片並進行文字、圖片互動。
1.2 程式碼產生
包括程式碼補全、程式碼重構、程式碼最佳化、程式碼註解等,可以涵蓋多種程式語言和領域。基於OpenAI的GPT-4模型,甚至可以做到基於手畫的一張產品原型草稿圖來產生對應的網站程式碼。
➤ Github Copilot:基於OpenAI Codex模型開發的AI輔助程式設計工具,它支援數十種程式語言,可以根據程式碼或註釋,即時地在編輯器中提供程式碼建議和整個函數,也能透過聊天互動達成結對程式設計的體驗。
➤ Cursor:一個獨立的IDE軟體,整合了OpenAI的GPT模型。與Github Copilot類似,Cursor可以透過AI寫程式碼、編輯程式碼和聊天。
1.3 圖片產生
映像產生是指利用人工智慧技術,根據給定的輸入(如自然語言、圖像、視訊等),自動產生符合語義和美感的圖像,是AIGC的一個重要方面。影像生成的應用場景非常廣泛,包括藝術創作、娛樂媒體、教育訓練、電商行銷、醫療診斷等。
➤ 文心一格:由百度推出的AI藝術和創意輔助平台。可根據文字描述、風格選擇,自動產生畫作。
➤ DALL-E2:由OpenAI在推出的一種基於自適應多模態編碼器的生成模型,它能將多模態輸入訊息(如文字、圖片等)融合,自動產生高品質的影像。
➤ Midjourney:一款2022年3月面世的AI繪畫工具,能基於自然語言生成圖片,可選擇不同畫家的藝術風格,還能識別特定鏡頭或攝影術語。此工俱生成的畫作在美術比賽中曾獲一等獎。
1.4 影片產生
影片產生主要分為影片編輯和影片自主生成兩種。影片編輯可用於影片超分、修復和剪輯。影片自主產生可用於影像到影片的轉換,或給定描述性文字產生相符的影片。以下是一些相關的應用:
➤ Deepfake:這是一個基於GAN技術的AI視訊生成平台,可以實現換臉、聲音轉換、表情模仿等功能。用戶只需要上傳一張圖片或一段影片作為參考,就可以自動產生影片。
➤ Make-A-Video:由Meta公司推出的可以將文字轉化為影片的AI系統。它可以根據幾個字或幾行文本,創造出充滿鮮豔色彩、人物和風景的獨一無二的影片。
1.5 3D建模
#基於AIGC的3D建模技術是指利用人工智慧技術,根據給定的輸入(如自然語言、圖像等),自動產生符合語意和美感的3D模型。此領域目前處於較早的探索階段。以下是一些相關的應用或模型:
➤ AICommand:基於Unity的開源AI命令插件,可以透過文字描述產生3D場景,並透過文字對3D場景進行調整優化。 (https://github.com/keijiro/AICommand)
➤ ICON:一個以人物圖片產生3D人物建模的開源AI模型(https: //github.com/YuliangXiu/ICON)。可在線上體驗並下載產生的3D模型:https://huggingface.co/spaces/Yuliang/ICON
ChatGPT在2022年底由OpenAI推出後,在短短兩個月時間內,累計用戶就突破一億,迅速火遍全球。由此,AI的iPhone時刻到來,各大IT廠商隨即快速跟進。以下是截止2023年4月的一些相關應用或模型介紹。
將從以下面向進行評估比較(Poe除外):
#PS:
###################### #2.1 自然語言處理
##評估內容:
➪多輪對話:我們一起來創作兒童故事吧。規則是我先說一句,你再說一句,交替進行。直到我說「故事編完了」就結束。你明白了麼?
➪語言理解:我老闆說1 1=3,我老闆說的都是對的,所以1 1=3,是嗎?
➪語言翻譯:將這段話翻譯成英文:一花獨放不是春,百花齊放春滿園。
➪情感分析:分析這段話的情感色彩:我非常喜歡這部新的電影,它讓我笑了很多次,也讓我感動落淚了。
Bard
2.2 邏輯推理
評估內容:
➪ 在一個架子上有五本書:紅皮書、綠皮書、藍皮書、橙皮書和黃皮書。綠皮書在黃皮書的左邊,黃皮書是左數第三本,紅皮書是從左數第二本,藍皮書在最右邊,請問這些書的順序是怎樣的?
➪ 在一條100米長的直線上有A、B、C三個點,A的位置不確定,A和B之間的距離是5米,A和C之間的距離是10米,B和C之間的距離可能是多少?
#ChatGPT
《文字心一言
ChatGLM
##分數如下:
評估內容:
程式碼解釋:解釋這行python程式碼: my_list = [x for x in my_list if x % 2 == 0]
#Bug偵測:這行程式碼哪裡有BUG: my_list = [x for x in my_list if x % 2 = 0]
ChatGLM
分數如下:
《文字心一言
#文心一言目前可以基於文字描述產生圖片、語音。發表會展現了影片產生能力,不過在實際使用過程中,無法產生影片。
#清華的ChatGLM並不支援多模態能力。
得分如下:
結合以上對比得分,再從Demo和生產(商用)兩個階段進行綜合評估考慮。
評估綜合分數如下:
選型評估如下:
➢ Demo階段:
# 以文心一言作為AI首選,NewBing及ChatGPT作為備選AI,ChatGLM作為自研AIGC的探索方向(需要GPU資源配合)。➢ #生產商用階段,多條線路可選:
############################################################# ####WebGPU作##########
以上是五分鐘技術趣談 | AIGC介紹與應用選項評估的詳細內容。更多資訊請關注PHP中文網其他相關文章!