? ?AI企業深度求索(DeepSeek)在人工智能領域掀起技術風暴。其研發的大語言模型在多項基準測試中表現驚艷,不僅比肩或超越歐美模型,更以低一個數量級的訓練成本實現這一突破。這場技術地震正在動搖AI發展范式——DeepSeek以低成本實現強性能的表現,直接挑戰了行業對“大算力=高性能”的傳統認知,甚至引發連鎖反應:以英偉達為代表的AI芯片巨頭股價應聲下跌,市場開始重新評估算力競賽的商業邏輯。值得關注的是,DeepSeek一方面將大模型代碼及訓練文檔全面開源,另一方面通過專利壁壘守護關鍵技術。
? ?從AI專利分析平臺Maxipat檢索可見,其核心技術專利并未直接歸屬運營主體,而是分散布局于北京深度求索人工智能基礎技術研究有限公司、杭州幻方系公司(幻方科技/幻方人工智能基礎研究院)及寧波積冪信息科技等關聯企業。
? ? 新披露的專利CN118246542A,“人工智能模型訓練數據集的構建方法”,正是通過創的數據序列索引技術,實現了訓練數據存儲與通信資源消耗量級下降,這或許正是其致性價比的底層密碼。從Maxipat的AI對話和解讀中可以獲知:這項專利解決的技術問題是人工智能模型訓練中數據集處理效率低下和資源消耗較大的問題,特別是在大規模數據集訓練時,數據的混合、打亂及切分操作會導致存儲和通信資源的大量消耗。核心技術方案是一種人工智能模型訓練數據集的構建方法,該方法包括將數據集劃分為若干大小相同的數據序列,以數據序列為單位建立索引,根據需求比例抽取樣本數據,將樣本數據以數據序列為單位混合并隨機打亂,將打亂后的樣本數據進行均勻切分得到若干個數據塊,每個數據塊包含若干個完整的數據序列,以及在每一步模型訓練的數據輸入時,通過索引批量讀取相應數據塊作為該步驟的模型訓練數據。
? ?技術優勢在于,該方法通過將數據集切分為數據序列,并以數據序列為單位建立索引,實現了數據的按比例混合、打亂及切分操作,整個過程不會增加冗余數據存儲,從而有效減少了對存儲、通信資源的消耗,提高了數據處理的效率和模型訓練的性能。Maxipat的AI對話和解讀主要作用如下:減少存儲與通信開銷:通過索引管理數據序列(而非物理修改數據),顯著降低冗余數據存儲需求,節省存儲硬件成本(如SSD、內存占用)。異步I/O和批量讀取優化了數據傳輸效率,減少網絡帶寬和存儲I/O的壓力,間接降低分布式訓練中的通信成本。
? ?提升GPU利用率:高效的數據加載(如異步I/O)減少了GPU等待數據的空閑時間,使GPU更專注于計算任務,提高單位GPU的利用率。數據預處理(混合、打亂、切分)通過邏輯操作完成,無需額外計算資源,減少對CPU或輔助硬件的依賴,釋放資源供GPU使用。
? ?縮短訓練周期:數據準備效率的提升(如快速采樣、動態調整比例)加速了迭代實驗過程,縮短整體訓練時間。在相同時間內,用更少的GPU即可完成原定任務,或更快釋放GPU資源供其他任務使用。
支持輕量化訓練流程:通過邏輯索引管理,無需大規模數據復制或重組,降低對高性能存儲設備的依賴,使訓練任務可在成本更低的硬件環境中運行。
原創?佑斌?免責聲明:版權歸原創所有僅供學習參考之用,禁止用于商業用途,部分文章推送時未能及時與原作者取得聯系,若來源標錯誤侵犯到您的權益煩請告知我們將立即刪除。
免責聲明:當前頁為 Deepseek的專利揭秘產品信息展示頁,該頁所展示的 Deepseek的專利揭秘產品信息及價格等相關信息均有企業自行發布與提供, Deepseek的專利揭秘產品真實性、準確性、合法性由店鋪所有企業完全負責。世界工廠網對此不承擔任何保證責任,亦不涉及用戶間因交易而產生的法律關系及法律糾紛,糾紛由會員自行協商解決。
友情提醒:世界工廠網僅作為用戶尋找交易對象,就貨物和服務的交易進行協商,以及獲取各類與貿易相關的服務信息的渠道。為避免產生購買風險,建議您在購買相關產品前務必確認供應商資質及產品質量。過低的價格、夸張的描述、私人銀行賬戶等都有可能是虛假信息,請您謹慎對待,謹防欺詐,對于任何付款行為請您慎重抉擇。
投訴方式:fawu@gongchang.com是處理侵權投訴的專用郵箱,在您的合法權益受到侵害時,請將您真實身份信息及受到侵權的初步證據發送到該郵箱,我們會在5個工作日內給您答復,感謝您對世界工廠網的關注與支持!