2010年6月14日 星期一

RDF和語義資料存儲

RDF和語義資料存儲
  社交網路和 電子商務已經向我們表明了許多網路應用必須使用大規模資料存儲,支援上百萬的用戶併發訪問,雲端運算通常被吹捧為解決這一問題最佳辦法,並提出了Web 3.0的概念。資料存儲可以處理非常大的知識庫和資料集編碼,使用W3C資源描述格式(RDF)和W3C SPARQL查詢語言傳遞語義。RDF資料是按照主題-謂詞-物件三元組進行存儲的,重要的RDF資料還存儲了額外的資訊,如版本資訊,臨時查詢資訊等。

  Sesame, Jena, and Mulgara是開源的解決方案,OpenLink Virtuoso是一個萬能伺服器, 最近的基準測試達到了110500三元組/秒,除了SQL和XML資料庫外,它還提供了線上備份亞馬遜S3和安裝RDFizer盒子的功能。Franz AllegroGraph RDFStore提供了一種手段在雲中構建基於RDF的聯合知識庫存儲,它支援SPARQL查詢,Prolog語言和RDFS + +分析。在亞馬遜EC2上,它使用10個大型EC2實例花了6.19小時存儲和索引了10億三元組資料集。可以存儲RDF三元組的SQL/XML產品包括 Oracle 11g,IBM Boca for DB2。在專利方面,微軟一直在想辦法存儲RDF三元組,以及將SPARGL轉換成SQL。

沒有留言: