Chip123 科技應用創新平台

 找回密碼
 申請會員

QQ登錄

只需一步,快速開始

Login

用FB帳號登入

搜索
1 2 3 4

LinkedIn 資料探勘軟體開源

2016-3-18 03:51 PM| 發佈者: SophieWeng@G| 查看: 982| 評論: 0|來自: Linuxpilot

摘要: 商業社交網站 LinkedIn 宣布,將旗下資料探勘軟體 WhereHows 開源,從各資料來源蒐集元資料,作為整合元資料的儲存庫,主要用於企業資訊分析,未來計畫整合其他資料工具,如Kafka、Samza、Gobblin、Nuage等。現在已 ...

商業社交網站 LinkedIn 宣布,將旗下資料探勘軟體 WhereHows 開源,從各資料來源蒐集元資料,作為整合元資料的儲存庫,主要用於企業資訊分析,未來計畫整合其他資料工具,如Kafka、Samza、Gobblin、Nuage等。現在已放於 GitHub 上。

LinkedIn 表示 WhereHows 是整合所有 LinkedIn 的資料處理環境,並且從中萃取 Metadata,並加以管理,主要用於挖掘企業資訊。

WhereHows從各種資料來源蒐集元資料,並且標準化和模型化這些 Metadata,以及作為一種整合 Metadata 的儲存庫(Repository),用於多種分析目的。

LinkedIn表示,WhereHows 已經獲取5萬個資料集的狀態、1.4萬個評論和3.5千萬個工作實行和關聯性資訊,而這些資料分別儲存在 Hadoop、Teradata 或其他叢集,且佔了超過 15PB 的儲存空間。

WhereHows 提供開發者從 API 或 Web 應用程式存取資料,其中API提供其他資料處理和應用程式的自動化,而 Web 應用程式則提供搜尋、視覺化資料集間的關係、註解、討論、社群參與等功能。

而 WhereHows 主要由資料儲存庫、Web 伺服器和後端伺服器所組成,其中資料儲存庫用來儲存所有 Metadata 內容,Web 伺服器則是透過 UI 和 API 來呈現資料,另外,後端伺服器則會定期從其他系統抓取 Metadata。

相關閱讀

您對這篇文章有任何想法嗎?歡迎留言給我們。
您的姓名:
您的電子郵件:
標題:
內容:



首頁|手機版|Chip123 科技應用創新平台 |新契機國際商機整合股份有限公司

GMT+8, 2024-12-19 03:41 PM , Processed in 0.100001 second(s), 16 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回頂部