近日,吉利汽車集團攜手科技伙伴階躍星辰,共同宣布了一項重大開源舉措——兩款階躍Step系列多模態大模型正式向全球開發者開放。此次開源的模型包括階躍Step-Video-T2V,這一視頻生成模型以全球領先的參數量和卓越性能脫穎而出,以及階躍Step-Audio,作為業界首款達到產品級標準的開源語音交互大模型。
自2023年起,階躍星辰與吉利汽車集團便建立了緊密的合作關系,雙方聚焦于預訓練大模型的垂直領域探索、應用場景設計以及工程開發實踐。通過深度合作,兩款Step系列大模型的性能得到了顯著提升。具體而言,Step-Video-T2V擁有高達300億的參數量,能夠生成分辨率達到540P、每秒204幀的高質量視頻。在新發布的開源基準數據集Step-Video-T2V-eval測試中,該模型在運動平滑性等多個關鍵指標上超越了同類開源模型。
另一方面,Step-Audio作為語音交互領域的佼佼者,在五大主流公開測試集中均取得了優異成績,特別是在HSK-6評測中表現突出,展現了其強大的技術實力和實用性。這一模型的開源,無疑為語音交互技術的發展注入了新的活力。

吉利汽車集團不僅在AI技術研發上不斷突破,還積極尋求與外部企業的深度融合。此前,吉利已成為首家與DeepSeek完成深度融合的車企,這一舉措彰顯了其在AI領域積極探索和創新的決心。據悉,吉利還將于3月初發布全新的AI智能化戰略,旨在進一步推動AI技術在智能座艙、高階智能駕駛等領域的應用和普及。
此次開源行動,不僅為全球開發者提供了寶貴的多模態大模型研究資源,促進了技術交流與創新,同時也加速了AI技術在汽車及更多領域的落地應用。通過階躍星辰與吉利汽車集團的深度合作,雙方正在智能汽車領域不斷取得新的突破,致力于為用戶提供更加智能、便捷的出行體驗,推動整個汽車行業向智能化方向加速邁進。














