wpk德州官網(wǎng)最新版是一款人氣火爆的德州游戲,全新升級的競技場次,絕對沒有任何的卡頓情況,可以放心大膽的加入對局,每次都是隨機(jī)進(jìn)行匹配,海量話費可以拿到手軟,不需要擔(dān)心作弊的情況,保證游戲的公平公正性
而在訓(xùn)練策略方面,SmolVLA 首先通過通用操作數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,再針對特定任務(wù)進(jìn)行微調(diào),以提升適應(yīng)能力。因此雖然 SmolVLA 的訓(xùn)練數(shù)據(jù)遠(yuǎn)少于現(xiàn)有其他 VLA 模型(僅包括不到 3 萬個任務(wù)記錄),但 Hugging Face 表示,該模型在模擬環(huán)境和真實場景中的表現(xiàn)與大型模型相當(dāng),甚至在部分任務(wù)上實現(xiàn)“超越”。
當(dāng)下,業(yè)界機(jī)器人模型通常采用“視覺-語言-行動”(Vision-Language-Action,VLA)設(shè)計,此類模型嘗試在單一架構(gòu)中整合感知能力、語言理解與行動決策,從而讓機(jī)器人實現(xiàn)自主執(zhí)行復(fù)雜任務(wù)。不過相應(yīng)模型訓(xùn)練成本極高,目前大多數(shù)模型仍為閉源項目,訓(xùn)練過程中依賴昂貴硬件、大量工程資源和大規(guī)模私有數(shù)據(jù)集。
Hugging Face 強(qiáng)調(diào),用戶使用MacBook Pro 筆記本電腦等消費級硬件即可運行 SmolVLA-450M 模型,無需花費大成本采購專用AI訓(xùn)練服務(wù)器。同時用戶也可以考慮采購 Hugging Face 推出的低成本機(jī)器人平臺(SO-100、SO-101 和 LeKiwi)等降低成本。
為此,Hugging Face 推出 SmolVLA 這一輕量級開源模型,使用公開數(shù)據(jù)集進(jìn)行訓(xùn)練,并可在消費級硬件設(shè)備上運行,旨在降低愛好者入門成本,推動通用機(jī)器人智能體的研究進(jìn)展。
Hugging Face 援引自家進(jìn)行的多項基準(zhǔn)測試驗證SmolVLA 的性能,在 LIBERO 與 Meta-World 等模擬測試平臺上,SmolVLA 的表現(xiàn)據(jù)稱優(yōu)于Octo、OpenVLA 等業(yè)界競品,而在使用真實機(jī)器人 SO-100 和 SO-101 進(jìn)行抓取、放置、堆疊與分類任務(wù)中,SmolVLA 也展現(xiàn)出更好的性能。
▲ 圖源Hugging Face(下同)
據(jù)介紹,SmolVLA 在模型架構(gòu)上結(jié)合 Transformer 結(jié)構(gòu)與 flow-matching 解碼器,并采用了四項關(guān)鍵優(yōu)化技術(shù):一是跳過視覺模型中一半層數(shù),以提升推理速度并減小模型體積;二是交替融合自注意力與交叉注意力模塊,提高多模態(tài)信息整合效率;三是減少視覺 Token 數(shù)量以提升處理效率;四是采用更輕量的 SmolVLM2 作為視覺編碼器,從而進(jìn)一步降低硬件要求。
目前,SmolVLA 的基礎(chǔ)模型已在 Hugging Face 平臺上線,完整訓(xùn)練方法也同步在 GitHub 上公開,IT之家附項目頁面如下(https://huggingface.co/lerobot/smolvla_base)。
此外,Hugging Face 透露 SmolVLA 還引入“異步推理架構(gòu)”(Asynchronous Inference Stack),將感知處理(如視覺和語音理解)與動作執(zhí)行進(jìn)行解耦,使機(jī)器人在面對快速變化的環(huán)境時能做出更及時的響應(yīng),大幅提升其實用性。
IT之家 6 月 9 日消息,Hugging Face現(xiàn)已公布 4.5 億參數(shù)開源機(jī)器人模型 SmolVLA,該模型主打高普適性,可在 MacBook Pro等的消費級硬件設(shè)備上運行,旨在幫助開發(fā)者降低入門成本。