2024年,北京國際汽車展將於4月25日至5月4日重磅回歸。作為業界首個提出感知決策一體化自動駕駛通用模型的公司,商湯絕影將帶來面向量產的真·端到端自動駕駛解決方案UniAD的上車演示首秀。同時也會展示以多模態場景大腦為核心的AI大模型座艙產品矩陣與全新座艙3D交互作用。
目前,通用人工智慧正在和智慧汽車產業深度融合,基於公司多年技術累積打造的一系列原生態汽車模型,商湯絕影將在北京車展帶來眾多涵蓋智慧駕駛和智慧座艙的AI大模型產品和功能,為大眾展示靈活自適應、深度個人化、安全可信賴、有人文關懷的未來體驗。這些產品和功能的推出,將進一步加速智慧汽車產業的發展與智慧出行的全新體驗。
業界首個感知決策一體化自動駕駛通用模式UniAD上車示範首秀
商湯及其合作實驗室提出了業界首個感知決策一體化自動駕駛通用模式UniAD,並於2023年榮獲國際電腦視覺與模式辨識會議(CVPR)最佳論文。該模型引領了引領學術界和工業界的端到端自動駕駛潮流,實現了端到端自動駕駛的流暢性。未來,自動駕駛將更加普及,商湯的技術將在自動駕駛領域中扮演重要角色,帶領產業實現端到端自動駕駛的趨勢。
最近,特斯拉開始向用戶推送基於端對端演算法的FSD V12版本,引起業界的廣泛關注。在本屆北京車展上,商湯繼影響也將帶來量產為導向的感知決策整合的真·端到端自動駕駛方案-UniAD,並首次面向大眾展示UniAD的實車道路展示成果。
隨著自動駕駛技術的不斷演進,基於規則的智駕方案需要多感測器融合感測器大量投入資源來應對無保護左轉、人車混行等複雜路況。而商湯絕影UniAD方案僅憑攝影機的視覺感知,無需高精度地圖,透過數據學習和驅動就能夠應對城區的複雜環境。不僅如此,在傳統方案較難突破的無中線的鄉村道路上,UniAD同樣可以自如行駛,完成包括大角度左轉橋、避讓佔道車輛及施工區域、繞行跑步行人等一系列高難度操作,真正做到「像人一樣開車」。
為了增強端對端自動駕駛方案可解釋性和交互能力,依托多模態大模型,商湯繼影已研發出新一代自動駕駛大模型DriveAGI,適用場景更寬、性能更高、門檻更低,體驗上做到可感知、可互動、可信賴。作為下一代自動駕駛技術,DriveAGI也將在車展期間展示預覽。
商湯絕影打造敏銳洞察、深度思考、高效執行的多模態場景大腦
近期備受關注的小米SU7開啟將AI大模型帶進座艙。商湯絕影已打造出「多模態場景大腦」為核心的AI大模型座艙產品矩陣,透過多模態大模型、大語言模型、文生成模型等能力組合,為智慧座艙注入強大的環境理解、邏輯思維和內容生成能力。
商湯絕影上車的AI大模型將能夠基於地理位置推薦符合用戶喜好的餐廳、介紹用戶感興趣的外部自然景物,並進行優質景點推薦。不僅如此,基於強大的多模態感知能力,搭載商湯絕影方案的車輛可以準確感知並識別車外的信息,包括周圍車輛的車型、標誌性建築物等,以語音、圖片或者視頻等方式為艙內人員提供更準確和全面的內容,幫助使用者了解並掌握外部環境資訊。
以多模態場景大腦為核心,商湯絕影已經推進量產落地一系列全景感知、主動關懷且富有創造力的AI大模型座艙產品,如「旅醫」、「神筆」、「童伴」等創新功能,大眾將能在商湯絕影展台上感受到深度個人化且有人文關懷的智慧出行新體驗。
Vision Pro“裸眼上車”,商湯絕影全球首創座艙3D視線交互即將亮相
2023年,Apple Vision Pro的橫空出世讓人們領略到了3D互動的魅力,商湯絕影透過深厚的技術研發實力和高效的創新迭代效率,將在車展上帶來兩大全新座艙3D交互演示: 3D Gaze高精視線互動與3D動態手勢互動。
作為全球首創的能夠透過視線定位與螢幕圖示互動的智慧座艙技術,商湯絕影的3D Gaze高精視線互動將讓使用者透過眼神控制中控圖示。 3D 動態手勢互動是業界領先的支援動態手勢和手部微動作辨識的智慧座艙技術,能讓使用者透過手勢「隔空」進行各類座艙互動。
商湯絕影這兩大艙內3D互動功能相互配合,如同「Vision Pro」裸眼上車,為使用者打造更符合人類直覺的自然互動體驗。
AI大模型與汽車產業碰撞、融合之際,商湯絕影將充分發揮多年累積的領先技術優勢和產品創新能力,持續為智慧汽車產業注入AGI的新活力。 4月25日起,歡迎蒞臨商湯絕影展位,共同探索AGI時代智慧汽車的未來出行方式。
以上是端到端自動駕駛、多模態場景大腦、全新3D互動:商湯絕影大模型即將亮相北京車展的詳細內容。更多資訊請關注PHP中文網其他相關文章!