吉利汽車集團與其科技生態(tài)戰(zhàn)略合作伙伴階躍星辰,近日共同揭曉了一項重大合作成果:兩款創(chuàng)新的階躍Step系列多模態(tài)大模型將面向全球開發(fā)者開放源代碼。這一舉措標志著吉利在人工智能領(lǐng)域的又一重要突破。
據(jù)悉,這兩款大模型分別是階躍Step-Video-T2V和階躍Step-Audio。前者被譽為全球參數(shù)量最大的開源視頻生成模型,其強大的能力足以生成高質(zhì)量、204幀、540P分辨率的視頻內(nèi)容。而后者,則是行業(yè)內(nèi)首個達到產(chǎn)品級標準的開源語音交互模型,能夠依據(jù)不同場景需求,靈活生成多樣化的語音表達,實現(xiàn)與用戶的高質(zhì)量對話。

階躍星辰與吉利的合作始于2023年,雙方在預訓練大模型、垂直領(lǐng)域應(yīng)用、場景設(shè)計及工程開發(fā)等多個維度展開了深入合作。這一合作不僅顯著提升了階躍Step系列大模型的性能,還進一步鞏固了吉利在智能科技領(lǐng)域的領(lǐng)先地位。
吉利研發(fā)人員透露,階躍Step-Video-T2V模型憑借其龐大的參數(shù)量,為用戶帶來了前所未有的視頻生成體驗。而階躍Step-Audio模型則通過精準的場景理解和個性化的語音生成,實現(xiàn)了與用戶之間的自然對話,極大地提升了智能交互的體驗。

吉利在智能科技領(lǐng)域的布局遠不止于此。自2021年起,吉利便圍繞芯片、軟件操作系統(tǒng)、數(shù)據(jù)和衛(wèi)星網(wǎng)等核心領(lǐng)域,構(gòu)建了端到端的自研體系和生態(tài)聯(lián)盟。2022年,吉利更是建成了全球首個“云、數(shù)、智”一體化的星睿智算中心,為智能駕駛和智能座艙等應(yīng)用場景提供了強大的算力支持。
吉利在2023年發(fā)布了全球首個汽車行業(yè)全棧自研全場景AI大模型——星睿AI大模型,并獲得了中國通信院的“4+級”行業(yè)最高評級。這一成就不僅彰顯了吉利在AI技術(shù)方面的深厚積累,也為其后續(xù)的智能汽車全域AI技術(shù)體系奠定了堅實基礎(chǔ)。
為了進一步提升智能汽車的交互體驗,吉利還與DeepSeek進行了深度融合,對星睿車控FunctionCall大模型、汽車主動交互端側(cè)大模型等進行了蒸餾訓練。這一舉措將使吉利智能汽車能夠更精準地理解用戶意圖,準確調(diào)用車載接口,同時基于車內(nèi)外場景主動分析用戶潛在需求,為用戶提供更加智能化、個性化的服務(wù)。














