本站消息,全鏈數(shù)據(jù)網(wǎng)絡(luò) Chainbase 在 HuggingFace 開源了專為加密領(lǐng)域打造的大語言模型 Theia-Llama-3.1-8B。該模型在困惑度和 BERT 評分上超越了市場主流模型,對加密貨幣世界的理解能力超過大多數(shù)主流開源大模型。Chainbase 團隊構(gòu)建了首個專業(yè) Web3 數(shù)據(jù)集,收錄了 CoinMarketCap 前 2000 項目的資料,并經(jīng)過手動和算法過濾,確保數(shù)據(jù)的準確性、多樣性和專業(yè)性。團隊采用 LoRA 技術(shù)高效微調(diào)模型,并利用 DeepSpeed 等工具加速訓(xùn)練過程。Theia-Llama-3.1-8B 已成功應(yīng)用于 Chainbase DEMO 交互應(yīng)用 TheiaChat,日活用戶超過 30 萬。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。