休息一小段時間,我又回來。今天聊一下如果科學的做技術選型吧。
其實,做技術選型有很多的方式方法。今天我想分享一種可能大家比較特別的一個方法。我覺得也是很科學的辦法之一。
假如有一天老闆問你我們要不要現在上“無服務器架構”?這個時候是不是很多人本能去google,baidu等等搜索一番。但是你很有可能會發現說什麼的都有,基本上很難做判斷。那我們怎麼做科學的分析和選型呢?
其實咱們做開發,基本上不會不用 stack overflow 和github。今天我就利用這兩個網站的開源得數據做一個分析,進行科學得技術選型。
Stack Overflow
SO 提供了自己的數據資源管理器(https://data.stackexchange.com)而且是免費的。 它很好用,非常適合簡單的查詢。 我建議花一些時間查看他們的熱門查詢-有些瀏覽量超過10幾萬。
https://data.stackexchange.com/stackoverflow/queries
我找一個可以查詢 無服務器 的話題的SQL
<code>select
concat
(datepart
(year
, CreationDate),' '
,datepart
(month
, CreationDate))as
dt,count
(1
) num_serverless_mentionsfrom
Postswhere
TitleLIKE
'%serverless%'
group
by
concat
(datepart
(year
, CreationDate),' '
,datepart
(month
, CreationDate))/<code>
參考:https://data.stackexchange.com/stackoverflow/query/1064625
看看下面圖,就知道這個火不火?這個數據是從2011到今年5月份的。
Github
GitHub在Google BigQuery上以免費和公共數據集的形式提供其數據的子集(注意:需要Google登錄)。 提供的表包括有很多github公開的數據。
這是我剛才跑的數據,這些都是免費的。bigquery也都是免費,而且速度也很快,只能說google cloud還是非常有良心的。
<code>select
DATE_TRUNC(cast
(created_atas
date
),MONTH
)as
month
,count
(1
) num_serverless_reposFROM
`githubarchive.month.*`
where
_TABLE_SUFFIXBETWEEN
'201702'
AND
'202005'
and
repo.namelike
'%serverless%'
group
by
1
order
by
1
/<code>
下面是生成圖描述從2017年2月到今年5月份,是不是也是越來越火?現在是不是可以說服領導了。
Github的數據都在這個裡面:https://www.gharchive.org/
如果自己有數據倉庫,也可以放到自己的倉庫做查詢分析。但是相對來講還是google big query。
有沒有學到?一起留言討論