專為數據科學構建的開源雲端Web電子表格應用程序——GridStuio

介紹

GridStuio是一個雲端的Web電子表格應用程序,也可以說它是數據科學應用程序,完全集成了開源數據科學框架和語言。與Python編程語言完全集成。它旨在提供用於加載,清理,處理和可視化數據的集成工作流。這是通過用Go編寫的電子表格後端與Python運行時的集成操縱其內容來實現的。


專為數據科學構建的開源雲端Web電子表格應用程序——GridStuio


開源首頁

https://github.com/ricklamers/gridstudio

架構概述

該應用程序分為兩部分:

  • (集中式)工作空間管理器
  1. CRUD界面,用於創建,複製,編輯和刪除工作空間。
  2. 代理將流量發送到正確的工作區環境(第2部分)
  • Workspace Go執行環境
  1. 進行單元格解析和支撐電子表格後端
  2. Node.js終端會話
  3. Python解釋器集成

功能概述

  • 你所知道的電子表格應有的功能

使用公式來轉換或生成數據


專為數據科學構建的開源雲端Web電子表格應用程序——GridStuio


  • 腳本直接集成

在電子表格數據上輕鬆運行Python腳本,不用擔心性能,當然服務器配置不能太差


專為數據科學構建的開源雲端Web電子表格應用程序——GridStuio


  • 終端集成

底層基礎基於Ubuntu Linux的操作系統的功能齊全的終端界面來提供執行高級數據科學任務所需的所有控制。

支持的函數

當前,支持以下功能:

  • SUM(value, ...) -總和值

例如:SUM(A1:A10)或SUM(A1,A2)

  • AVERAGE(value, ...) -取數學平均值(平均值)

示例:AVERAGE(A1:A10)或AVERAGE(A1,A2)

  • IF(logical-value, value, value) -如果邏輯功能

示例:IF(A1> 2、1、0)或IF(A1 ==“ random”,RAND(),1)

  • MATHC(string) -獲得數學常數

示例:MATHC(“ pi”)或MATHC(“ e”)或MATHC(“π”)- 當前只有π和e在MATHC中

  • SQRT(number) -取數字的平方根

示例:SQRT(A1)或SQRT(2)

  • CONCATENATE(string-value)或CONCAT(string-value)-連接字符串值

示例:CONCAT(“ Hello,”,“ World!”)

  • NUMBER(value) -將值轉換為數字

例如:NUMBER(“ 0123”)= 123

  • LEN(value) -獲取值的字符串表示形式的長度

例如:LEN(“ abcd”)= 4或LEN(100)= 3

  • COUNT(values) -獲取包含值的單元格數量

示例:COUNT(A1:A10)= 4(如果4個單元格為非空)

  • RAND() -獲取0到1之間的隨機數

示例:RAND()= 0.92892480103

  • FLOOR(number)

示例:FLOOR(1.9)= 1

  • CEIL(number)

例如:CEIL(1.1)= 2

  • ABS(number) -取數字的絕對值

示例:ABS(-12.1)= 12.1

  • VLOOKUP(value, lookup_range, column_index) -根據鍵值查找值

示例:VLOOKUP(A1,Sheet2!$ A $ 1:$ D $ 100,4)-在Sheet2!A1列中查找A1中的值,並在第4列(D)中返回結果。

  • OLS(y_range, x1_range, x2_range, ...) -用形式y〜x1 + x2 + ...執行線性迴歸

示例:OLS(A1:A10,B1:B10,C1:C10),例如包含房價的A1:A10,包含平方米數的B1:B10和計算城市虛擬變量的C1:C10


本地安裝

在本地安裝Grid Studio非常簡單(Docker):

1. 使用以下命令克隆存儲庫:
git clone https://github.com/ricklamers/gridstudio
2. 使用以下命令運行bash腳本(在Windows上使用例如Git Bash):
cd gridstudio && ./run.sh
3. 瀏覽器打開 http://127.0.0.1:8080 Note! 管理員默認賬號: admin 密碼: admin


注意:

1、如果您使用的是Windows,請確保共享驅動器https://docs.docker.com/docker-for-windows/#shared-drives

2、在Linux上,Docker需要sudo訪問權限才能運行。

3、隨時到Github提出問題和反饋


總結

GridStudio是一個強大的雲端電子表格應用程序,雖然目前可能某些功能無法媲美本地的Excel,但是其集成的腳本執行和終端集成為實現更加高級的需求提供了可能!


專為數據科學構建的開源雲端Web電子表格應用程序——GridStuio



分享到:


相關文章: