Blockify 改寫企業 RAG:用 IdeaBlock 取代 Chunking、壓縮 40 倍、token 減 3 倍

鏈新聞abmedia

企業 AI 資料優化新工具 Blockify 5 月 9 日由 akshay_pachaar 整理推廣、宣稱在 RAG(Retrieval-Augmented Generation)流程中、可把企業資料庫壓縮 40 倍、查詢 token 用量減 3 倍、向量搜尋準確率提升 2.3 倍。Blockify 官方 GitHub說明:產品由 Iternal Technologies 推出、用「IdeaBlock」結構化知識單元取代傳統 chunking、並透過去重合併讓知識庫保持精簡、連貫、可治理。

核心概念:用 IdeaBlock 取代傳統 chunking

Blockify 的技術設計:

傳統做法:把長文件切成固定大小的 chunk、嵌入向量、檢索時取 top-k

Blockify 做法:把原始內容轉換為 IdeaBlock—XML 結構化知識單元

每個 IdeaBlock 內含:自帶問題、可信答案、tag、實體、關鍵字

相似 IdeaBlock 自動去重合併、知識庫不會隨內容增長膨脹

傳統 chunking 的問題是同一資訊可能在多個 chunk 中重複出現、造成檢索冗餘與 token 浪費;IdeaBlock 透過去重把資訊密度提升、同樣內容用更小的儲存空間表達。

具體效益:壓縮 40 倍、token 減 3 倍、準確率升 2.3 倍

Blockify 公布的具體效益指標:

資料壓縮:企業資料庫縮減至原大小約 2.5%(40 倍壓縮)、保留 99% 以上資訊

每查詢 token:從約 303 個(傳統 chunk)降至約 98 個(IdeaBlock)—3.09 倍效率

向量檢索準確率:提升 2.29 倍

整體準確率改善:約 78 倍(含去重與檢索改進綜合效應)

成本節省試算:1 億查詢/年、節省 token 成本約 73.8 萬美元

78 倍的整體準確率提升是綜合效應—去重減少噪音、IdeaBlock 結構化內容對向量檢索友善、單次回答 token 數下降同時減少模型出錯空間。

整合範圍:LlamaIndex、LangChain、Milvus、Cloudflare 等主流框架

Blockify 已整合的開發者工具與基礎設施:

RAG 框架:LlamaIndex、LangChain

知識管理:Obsidian

向量資料庫:Milvus、Elastic、Supabase

邊緣運算:Cloudflare

低程式碼整合:n8n(透過工作流程模板)

Blockify 的整合策略是「不取代既有 RAG 框架、而是作為前置資料優化層」。開發者可在現有 LlamaIndex 或 LangChain 流程中、用 Blockify 替換原本的 chunking 步驟、其餘流程不變。

後續可追蹤的具體事件:Blockify GitHub 星數成長與社群採用率、Iternal Technologies 是否就 IdeaBlock 結構申請或揭露技術細節(目前標榜「patented ingestion」)、以及主流 RAG 框架是否將類似去重邏輯內建為預設功能。

這篇文章 Blockify 改寫企業 RAG:用 IdeaBlock 取代 chunking、壓縮 40 倍、token 減 3 倍 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

阿里雲今日推出團隊代幣方案,包含 10+ 個模型

根據 Beating,阿里雲今天推出其 Team Token Plan,提供對 10+ 個大型語言模型的訂閱服務,包括 Qwen 3.6、Kimi-K2.6、GLM-5.1 和 Wan 2.7。使用者可針對程式碼生成、影像合成及其他任務靈活在不同模型之間切換。 團隊版透過企業管理功能,與個人方案有所不同。管理員可在三個層級:Standard、Premium 和 Elite 之間管理席位分配、追蹤使用情況,並設定預算控管。平台包含多租戶隔離以及企業等級的資料隱私保護,並支援主要 AI 工具,包括 Claude Code 和 Cursor。

GateNews5小時前

東莞在 2025 年生產全球一半的 AI 眼鏡

根據研究機構 Omdia 的資料,總部位於東莞的公司在 2025 年出貨超過 400 萬副 AI 眼鏡,約占全球總量 870 萬副的一半。廣東省的這座城市在出貨量方面位居全球第一,而全球 AI 眼鏡出貨量則較前一年成長 322%。 東莞的市場地位與政府支持 東莞在 AI 眼鏡製造上的主導地位,反映了其既有的電子產業基礎,以及近期推出的政策舉措。東莞最近推出了一系列措施,以支持 XR 智慧終端,涵蓋技術、企業發展、應用以及資金等領域。 東莞市副市長曾建鵬將這座城市的實力歸因於其已建立的電子供應鏈,該供應鏈同時服務合約製造商與在地品牌。 製造生態系:中小型生產商 東莞的 AI 眼鏡熱潮,得益於中國珠江三角洲地區一個更廣泛的、由 6 至 8 家中小型製造商組成的群體。其中許多公司採取雙軌策略:以自有品牌銷售低成本產品,同時承接合約製造工作,並面向商業與消費市場服務於原始設計製造(ODM)客戶。這種做法能在推動出貨量成長的同時,分散財務風險。 較低的研發成本也支持了這種製造模式。業界人士表示,公司可在低於 1,000 萬人民幣(約 141 萬美元)的成本下打造新的 AI 眼鏡,並且每 6 個月

Crypto Frontier7小時前

UXLINK 整合 Origins Network 的 AI 運算基礎設施以支援 Web3 擴容

根據 UXLINK 於 5 月 11 日發布的官方公告,這個 Web3 社交協議宣布與 Origins Network 展開策略合作,將去中心化的 AI 運算基礎設施整合進其生態系統。此合作旨在透過納入 Origins Network 的模組化區塊鏈基礎設施來強化 UXLINK 的平台,提升用於 AI 驅動的去中心化應用程式的運算能力。 此次整合將運用 Origins Network 的「Proof-of-Computation(運算證明)」機制與去中心化 GPU 運算,以提升 AI 模型訓練、資料處理與交易效率,同時降低營運成本。支援社交去中心化交易所交易、流動性質押與 AI 驅動應用程式的 UXLINK 平台,將透過此次合作獲得更佳的可擴展性與跨鏈功能。

GateNews11小時前

騰訊雲在上線當天為 Ryt Bank 的 AI 銀行服務提供支援,服務 50,000 名使用者

根據騰訊雲說法,5 月 11 日,該公司與馬來西亞的數位銀行 Ryt Bank 合作,使用騰訊雲 Chat 支援其以 AI 驅動的對話式銀行服務,透過即時訊息提供服務。該系統在啟用當天處理了 50,000 名活躍用戶且未發生停機,讓客戶能以自然語言提出付款指示,而非在 App 選單中操作。Ryt Bank 在超過七個月內已達到 1.2 百萬用戶。

GateNews13小時前

Reactor 推出即時世界模型示範,吸引 780 萬次觀看

根據 Beating 的說法,Reactor 今天推出其即時世界模型 demo,使使用者能透過基於雲端的 AI 處理產生互動式 3D 場景。該模型在公司的全球低延遲雲端基礎設施上運行,無需本地端硬體。在一段包含紅色跑車穿行異星沙漠景觀的示範影片中,AI 即時渲染地形物理與遙遠的行星物件,同時追蹤玩家操控,吸引超過 780 萬次觀看。

GateNews13小時前

Minara 今天推出首個 Hyperliquid HIP-4 預測市場 AI 為戶助理

根據 BlockBeats,Minara AI 於今天(5 月 11 日)推出 AI Prediction Copilot,成為首個與 Hyperliquid 的 HIP-4 市場整合的預測市場 AI 工具。該系統會分析 BTC 的短期趨勢、支撐與阻力位,以及市場定價差異,以提供 YES/NO 交易建議。Copilot 會即時輸出 AI 概率、市場隱含概率、優勢值(edge value)與預期報酬。

GateNews13小時前
留言
0/400
暫無留言