Python之數據清洗，轉換，合併，重塑實操大全

2019-12-05 07:36:00 商業數據分析師

Python之數據清洗實操大全

以下語句均在pycharm中演示，可直接複製到pycharm中查看運行結果

# 數據清洗實操

#1.1數據規整化：清理，轉換，合併，重塑

#1.2數據聚合與分組運算

import numpy as np

import pandas as pd

# 2數據規整化：清理，轉換，合併，重塑

#合併數據集

#2.1 pandas.nmerge:可根據一個或多個鍵將不同的Dataframe的行鏈接起來

#2.2 pandas.concat:可沿著一條軸將多個對象堆疊到一起

#2.3 combine_first:可將重複數據編接在一起，用一個對象中的值填充另一個對象中的缺失值

# 3.數據庫風格的DataFrame合併

#3.1數據集的合併或者連接運算：通過一個或多個鍵將行鏈接起來

df1=pd.DataFrame({"key":['b',"b","a","c","a","a","b"],"data1":range(7)})

print(df1)

df2=pd.DataFrame({"key":["a","b","d"],"data2":range(3)})

print(df2)

#3.2多對一的合併

print(pd.merge(df1,df2))

#若沒有指定用哪一個列進行連接，merge 會將重疊列名當作鍵，指定如下

print(pd.merge(df1,df2,on="key"))

#若兩個對象的列名不同，可分別進行指定：

df3=pd.DataFrame({"1key":['b',"b","a","c","a","a","b"],"data1":range(7)})

df4=pd.DataFrame({"rkey":["a","b","d"],"data2":range(3)})

a=pd.merge(df3,df4,left_on='1key',right_on="rkey")

print(a)

#默認情況下，merge做inner鏈接，結果中的鍵是交集，。外連接求取的是鍵的並集

b=pd.merge(df1,df2,how='outer')

print(b)

#多對多的合併操作

c=pd.merge(df1,df2,on="key",how="left")

print(c)

d=pd.merge(df1,df2,on="key",how="right")

print(d)

#鏈接方式隻影響出現在結果中的鍵，根據多個鍵進行合併，傳入一個由列名組成的列表

left=pd.DataFrame({"key1":["foo","foo","bar"],

"key2":["one","two","one"],

"lva1":[1,2,3]})

print(left)

right=pd.DataFrame({"key1":["foo","foo","bar","bar"],

"key2":["one","one","one","two"],

"rva1":[4,5,6,7]})

print(right)

a1=pd.merge(left,right,on=["key1","key2"],how="outer")

print(a1)

#在進行列——列轉換時，Dataframe對象中的索引會被丟棄

#suffixes選項：指定附加到左右兩個Dataframe對象的重疊列名上的字符串

print(pd.merge(left,right,on="key1"))

print(pd.merge(left,right,on="key1",suffixes=("_left","_right")))

# 索引上的合併

#當Dataframe 中的連接鍵位於其索引中時，傳入left_index=True,right_index=TrUE,以說明索引應該被用作連接鍵

left1=pd.DataFrame({"key":["a","b","a","a","b","c"],

"vakye":range(6)})

print(left1)

right1=pd.DataFrame({"group_val":[3.5,7]},index=["a","b"])

print(right1)

f=pd.merge(left1,right1,left_on="key",right_index=True)

print(f)

#對於層次化索引的數據：

lefth=pd.DataFrame({"key1":["ohio","ohio","ohio","Nevda","Nevda"],

"key2":[2000,2001,2002,2001,2002],

"data":np.arange(5.)})

print(lefth)

righth=pd.DataFrame(np.arange(12).reshape((6,2)),

index=[["Nevada","Nevada","ohio","ohio","ohio","ohio"],

[2001,2000,2000,2000,2001,2002]],

columns=["event1","event2"])

print(righth)

g=pd.merge(lefth,righth,left_on=["key1","key2"],right_index=True)

print(g)

left2=pd.DataFrame({"ohio":[1.,3.,5.],"Nevada":[2.,4.,6.]},

index=list("ace"))

print(left2)

right2=pd.DataFrame({"Missouri":[7.,9.,11.,13.],"Alabama":[8.,10.,12.,14.]}

,index=list("bcde"))

print(right2)

#使用合併雙方的索引：

print(pd.merge(left2,right2,how="outer",left_index=True,right_index=True))

#Dataframe的join 實例方法：

print(left2.join(right2,how="outer"))

#更方便的實現按索引合併，不管有沒有重疊的列，在連接鍵上做左連接，支持參數Dataframe 的某個列之間的連接：

print(left1.join(right1,on="key"))

#對於簡單的索引合併，可以向join傳入一組Dataframe（concat函數也是這個功能）

another=pd.DataFrame([[7.,8.],[9.,10.],[11.,12.],[16.,17.]],

index=list("acef"),columns=["new york","oregon"])

print(another)

print(left2.join([right2,another]))

# 軸連接

#數據合併運算

# 連接，綁定，堆疊

#Numpy 有一個用戶合併原始Numpy數組的concatenation函數

arr=np.arange(12).reshape((3,4))

print(arr)

print(np.concatenate([arr,arr],axis=1))

#pandas 的concat函數：

s1=pd.Series([0,1],index=["a","b"])

s2=pd.Series([2,3,4],index=list("cde"))

s3=pd.Series([5,6],index=list("fg"))

print(s1)

print(s2)

print(s3)

print(pd.concat([s1,s2,s3]))

#默認情況下，coacat在axis=0上工作。傳入axis=1,產生一個DataFrame

print(pd.concat([s1,s2,s3],axis=1))

#這種情況下，另外一條軸上沒有重疊，傳入join ="inner"得到他們的交集：

print(pd.concat([s1,s3],axis=1,join='inner'))

#使用key參數，在連接軸上創建一個層次化索引：

result=pd.concat([s1,s1,s3],keys=["one","two","three"])

print(result)

print(result.unstack())

#沿著axis=1對Series進行合併，keys就會完成為Dataframe的列頭：

print(pd.concat([s1,s2,s3],axis=1,keys=["one","two","three"]))

#對Dataframe對象也是如此：

df1=pd.DataFrame(np.arange(6.).reshape((3,2)),index=list("abc"),

columns=["one","two"])

print(df1)

df2=pd.DataFrame(5+np.arange(4).reshape((2,2)),index=list("ac"),columns=["three","four"])

print(df2)

print(pd.concat([df1,df2],axis=1,keys=["level1","level2"]))

#傳入一個字典，則字典的鍵會被當做keys選項的值：

print(pd.concat({"level1":df1,"level2":df2},axis=1))

#跟當前分析無關的dataframe行索引：

df1=pd.DataFrame(np.random.randn(3,4),columns=list("abcd"))

df2=pd.DataFrame(np.random.randn(2,3),columns=list("bda"))

print(df1)

print(df2)

#傳入ignore_index=True

print(pd.concat([df1,df2],ignore_index=True))

print(pd.concat([df1,df2]))

#合併重疊數據

#關於索引全部或者部分重疊的兩個數據集

#Numpy 的where函數，用於表達一種矢量化的if -else

a=pd.Series([np.nan,2.5,np.nan,3.5,4.5,np.nan],

index=list("fedcba"))

b=pd.Series(np.arange(len(a),dtype=np.float64),

index=list("fedcba"))

print(a)

print(b)

print(np.where(pd.isnull(a),b,a))

#Series的combine_first方法，實現與上面一樣的功能，並會進行數據對齊

print(b[:-2].combine_first(a[2:]))

#對於Dataframe一樣

df1=pd.DataFrame({"a":[1.,np.nan,5.,np.nan],

"b":[np.nan,2.,np.nan,6.],

"c":range(2,18,4)})

print(df1)

df2=pd.DataFrame({"a":[5.,4,np.nan,3.,7.],

"b":[np.nan,3.,4.,6.,8.]})

print(df2)

print(df1.combine_first(df2))

#可以看作參數對象中的數據為調用者對象的缺失數據"打補丁"

#重塑和軸旋轉

#用於重新排列表格型數據的基礎運算：重塑（reshape)和軸向旋轉（pivot)

#重塑層次化索引

#stark:將數據的列旋轉為行

#unstack：將數據的行旋轉為列

data=pd.DataFrame(np.arange(6).reshape(2,3),index=pd.Index(["ohio","colorado"],name="state",

columns=pd.Index(["one","two","three"],name="number")))

print(data)

#用stack方法將行轉為列，得到一個Series：

result=data.stack()

print(result)

print("--------------")

#對於層次化索引的Series，可以用unstack將其重新排為一個Dataframe：

print(result.unstack())

#默認情況下，unstack操作最內層

#傳入分層級別的編號或名稱可對其他級別進行unstack操作

print(result.unstack(0))

print(result.unstack("state"))

#如果不是所有級別值都能在各組找到的話，unstack操作可能會引入缺失值數據:

s1=pd.Series([0,1,2,3],index=list("abcd"))

s2=pd.Series([4,5,6],index=list("cde"))

data2=pd.concat([s1,s2],keys=["one","two"])

print(data2.unstack())

#stack默認會過濾掉缺失數據，因此該運算是可逆的：

print(data2.unstack().stack())

print(data2.unstack().stack(dropna=False))

#對Dataframe進行unstack操作時，作為旋轉軸的級別將會成為結果中的最低級別

df=pd.DataFrame({"left":result,"right":result+5},

columns=pd.Index(["left","right"],name="side"))

print(df)

print(df.unstack("state"))

print(df.unstack("state").stack("side"))

#將"長格式"旋轉為"款格式"

#時間序列數據通常以"長格式（long)或者"堆疊格式（stacked)"存儲在數據庫以及CSV中

ldata=pd.DataFrame({"data":["1959-3-31","1959-3-31","1959-3-31","1959-6-30","1959-6-30","1959-6-30"],

"item":list("riuriu"),

"value":[2710,0,5,2778,2,5]})

print(ldata)

#轉成DataFrame，用pivot方法：

pivoted=pd.pivot_table(ldata,index=["data","item"])

print(pivoted.head())

#得到的Datafrme帶有層次化的列：

pivoted=ldata.pivot("data","item")

print(pivoted)

pivoted["value"]

#假設有兩個需要參與重塑的數據列：

ldata["value2"]=np.random.randn(len(ldata))

print(ldata)

#pivot 其實只是一個快捷方式：用set_index 創建層次化索引，再用unstack重塑

unstacked=ldata.set_index(["data","item"]).unstack("item")

print(unstacked)

#以上時數據的重排，下面是過濾，清理以及其他轉換工作

#數據轉化

# 移除重複數據，DataFrame中出現的重複行：

data=pd.DataFrame({"k1":["one"]*3+["two"]*4,"K2":[1,1,2,3,3,4,4]})

print(data)

#Dataframe的duplicated方法返回一個布爾型Series，表示各行是否是重複行，drop_duplicates方法返回一個移除了重複行的Dataframe

print(data.duplicated())

print(data.drop_duplicates())

#指定部分列進行重複項判斷，如只是希望根據K1列過濾重複項

data["v1"]=range(7)

print(data)

print(data.drop_duplicates("k1"))

#duplicated和drop_duplicates 默認保留重複數值裡第一次出現的組合，傳入keep=last則保留最後一個：

print(data.drop_duplicates(["k1"],keep="last"))

#利用函數或映射進行數據轉換

#根據數組，series或者Dataframe列中的值來實現轉換

data=pd.DataFrame({"food":["bacon","pulled pork","bacon","Pastrami","corned beef","Bacon","pastrami","honey ham","nova lox"],

"counces":[4,3,12,6,7,8,3,5,6]})

print(data)

#編寫一個肉類到動物的映射：

meat_to_animals={"bacon":"pig","pulled pork":"pig","pastrami":"cow","corned beef":"cow","honey ham":"pig","nova lox":"salmon"}

print(meat_to_animals)

#Series 的map 方法：可以接受一個函數或含有映射關係的字典型對象，用於修改對象的數據子集

data["animals"]=data["food"].map(str.lower).map(meat_to_animals)

print(data)

#也可以傳入一個能夠完成全部這些工作的函數：

print(data["food"].map(lambda x:meat_to_animals[x.lower()]))

#替換值

#replace 方法：替換

#利用fillna方法填充缺失數據可以看作替換的一個特殊情況，替換一個值和一次性替換多個值

data=pd.Series([1.,-999.,2.,-999,-1000.,3.])

print(data)

print(data.replace(-999,np.nan))

print(data.replace([-999,-1000],np.nan))

#對不同的值進行不同的替換

print(data.replace([-999,-1000],[np.nan,0]))

#傳入的參數也可以是字典

print(data.replace({-999:np.nan,-1000:0}))

#重命名軸索引軸標籤有一個map方法：

data=pd.DataFrame(np.arange(12).reshape((3,4)),index=["OHio","Colordao","new york"],

columns=["one","two","three","four"])

print(data)

print(data.index.map(str.upper))

#對函數或映射進行轉換，從而得到一個新對象，將其值賦給index ，就可以對Dataframe進行就地修改：

data.index=data.index.map(str.upper)

print(data)

#要創建數據集的轉換版，而不是修改原始數據，用rename

print(data.rename(index=str.title,columns=str.upper))

#rename結合字典型對象可以實現對部分軸標籤的更新

print(data.rename(index={"OHIO":"INDIANA"},columns={"three":"peekaboo"}))

#rename實現了複製Dataframe並對其索引和列標籤進行賦值，就地修改某個數據集，傳入inplace=true

print(data.rename(index={"OHIO":"INDIANA"},inplace=True))

#離散化和麵元劃分

#為了便於分析，連續數據常常被離散化或者拆分為"面元（bin)",用pandas的cut函數：

ages=[20,22,25,27,21,23,37,31,61,45,41,32]

bins=[18,25,35,60,100]

cats=pd.cut(ages,bins)

print(cats)

#pandas 返回的是一個特殊的categorical對象，它含有一個表示不同分類名稱的數組和一個為年齡數據進行標號的屬性

print(cats.categories)

print(cats.codes)

#哪邊是閉端可以通過right=Fslse進行修改：

print(pd.cut(ages,[18,26,36,61,100],right=False))

#設置自己的面元名稱：

group_names=["youth","youngAdult","MiddleAged","senior"]

print(pd.cut(ages,bins,labels=group_names))

#將labels選項設置為一個列表或者數組即可，如果向cut傳入的是面元的數量而不是確切的面元邊界，則它會根據數據的最小值和最大值計算等長面元

data=np.random.randn(20)

print(pd.cut(data,4,precision=2))

#將一些均勻分佈的數據分成了四組，

# qcut函數：根據樣本分位數對數據進行面元劃分，由於qcut使用的是樣本分位數，可以得到大小基本相等的面元（而cut根據數據的分佈情況，可能無法使各個面元中含有相同數量的數據點）

data=np.random.randn(1000)

cats=pd.qcut(data,4)

print(cats)

print(pd.value_counts(cats))

#設置自定義的分位數：

print(pd.qcut(data,[0,0.1,0.5,0.9,1]))

#在聚合和分組運算時會再次用到cut和qcut這兩個離散化函數

#檢測和過濾異常值判斷是否存在異常值（outlier)

print(np.random.seed(12345))

data=pd.DataFrame(np.random.randn(1000,4))

print(data.describe())

#找出某列中絕對值大小超過3的值：

col=data[3]

print(col[np.abs(col>3)])

#選出全部含有"超過3或-3的值"行：

print(data[(np.abs(data)>3).any(1)])

#將值限制在區間-3到3以內：

data[np.abs(data)>3]=np.sign(data)*3

print(data.describe())

#np.sign將這個ufunc返回的是一個由1和-1組成的數列，表示原始值的符號

#排列和隨機採樣

#numpy.random.permutation函數：對Series和Dataframe的列排列

df=pd.DataFrame(np.arange(5*4).reshape(5,4))

print(df)

sampler=np.random.permutation(5)

print(sampler)

#Permutation(5):需要排列的軸的長度，然後就可以在基於ix的索引操作或者take函數中使用該數組

print(df)

print(df.take(sampler))

#選取隨機限子集(非替換）

print(df.take(np.random.permutation(len(df))[:3]))

#用替換的方式產生樣本：

bag=np.array([5,7,-1,6,4])

print(bag)

sampler=np.random.randn(0,len(bag))

print(sampler)

#計算指標/啞變量

#將分類變量（categorical)轉換為"啞變量矩陣（dummY matrix)"或"指標矩陣（Indicator matrix)

df=pd.DataFrame({"key":["b","b","a","c","a","b"],"datal":range(6)})

print(df)

print(pd.get_dummies(df["key"]))

#給Dataframe的列加上一個前綴，以便能夠跟其他數據進行合併

dummies=pd.get_dummies(df["key"],prefix="key")

print(dummies)

df_with_dummy=df[["datal"]].join(dummies)

print(df_with_dummy)

#字符串操作字符串對象的內置方法

val="a,b,guido"

print(val.split(","))

pieces=[x.strip() for x in val.split(",")]

print(pieces)

first,second,third=pieces

print(first+"::"+second+"::"+third)

print("::".join(pieces))

#find找不到返回-1，index找不到引發一個異常

print("guido" in val)

print(val.index(","))

print(val.find(":"))

#傳入空字符串常常用於刪除模式

print(val.count(","))

print(val.replace(",","::"))

print(val.replace(",",""))

print(val)

#正則表達式（regex)

#提供了一種靈活的在文本中搜索或者匹配字符串模式的方法，python內置的re模塊負責對字符串應用正則表達式

#re模塊的函數分為三個大類：模式匹配，替換，拆分

import re

text="foo bar\\t baz \\ tqux"

print(text)

print(re.split("\\s+",text))

regex=re.compile("\\s+")

print(regex.split(text))

#描述一個或者多個空白符的regex是\\s+,調用re.split("\\s+",text)時，正則表達式會先被編輯，然後再在text上調用其他split方法

#可以用re.compile自己編譯一個regex,以得到一個可重用的regex對象，如上所述，如果打算對許多字符串應用同一條正則表達式，強烈建議通過這種方法，可以節省大量的cpu時間，得到匹配的regex的所有模式

print(regex.findall(text))

# finddall:返回字符串中所有的匹配項

#search:只返回第一個匹配項

#match:只匹配字符串的首部

#pandas中矢量化的字符串函數

#通過data.map,所有字符串和正則表達式方法都能被應用於各個值，但是如果存在NA就會報錯，為了解決這個問題，Series有一些能夠跳過NA值的字符串操作方法，通過Series的str屬性即可訪問這些方法

data={"Dave":"[email protected]","Steve":"[email protected]","Rob":"[email protected]","Wes":np.nan}

print(pd.Series(data))

print(data.isnull())

print(data.str.contains("gmail"))

#對字符串進行子串截取

print(data.str[:5])

#數據聚合與分組運算

#對數據集進行分組並對各組應用一個函數，再將數據集準備好之後，通常的任務就是計算分組統計或者生成透視表，pandas提供了一個靈活高效的groupby功能：利用任何可以接受pandas對象或者Numpy數組的函數

#groupby技術：

#分組運算：split(拆分）——>apply(應用）——>combine(合併）

#分組鍵的形式：

#列表或者數組,其長度與待分組的軸一樣

#表示Dataframe某個列名的值

#字典或者Series，給出待分組軸上的值與分組名之間的對應關係

#函數，用於處理軸索引或者索引中的各個標籤

df=pd.DataFrame({"key1":["a","b","b","b","a"],"key2":["one","two","one","two","one"],"data1":np.random.randn(5),"data2":np.random.randn(5)})

print(data)

grouped=df["datal"].groupby(df["key1"])

print(grouped)

#訪問data1，並根據key1調用groupby

#變量grouped是一個GroupBy對象，它實際上還沒有進行任何計算，只是含有一些有關分組鍵df["key1"]的中間數據

#例如，調用GroupBy的mean方法來計算分組平均值

print(grouped.mean())

means=df["datal"].groupby([df["key1"],df["df["key2"]]).mean()

print(means)

#Series根據分組鍵進行了聚合，產生了一個新的Series，其索引為key1列中的唯一值，通過兩個鍵對數據進行了分組後，得到的Series具有一個層次化索引

print(means.unstack())

#分組鍵可以時任何長度適當的數組：

states=np.array(["ohio","california","california","ohio","ohio"])

years=np.array([2005,2005,2006,2005,2006])

df["datal"].groupby([states,years]).mean()

#將列名用作分組鍵：

print(df.groupby("key1").mean())

print(df.groupby(["key1","key2"]).mean())

#Groupby 的Series方法返回一個含有分組大小的Series

df.groupby(["key1","key2"]).size()

#對分組進行迭代：Groupby對象支持迭代，可以產生一個一組二元元組（由分組名和數據塊組成）

for name,group in df.groupby("key1"):

print(name)

print(group)

for(k1,k2),group in df.groupby(["key1","key2"]):

print(k1,k2)

print(group)

#對於多重鍵，元組的第一個元素將會是由鍵值組成的元組，對於數據片段進行操作，如將這些數據片段做成一個字典

pieces=dict(list(df.groupby("key1")))

#groupby默認在axis=0進行分組，通過設置可以在其它任何軸上進行分組，如可以根據dtype對列進行分組

print(df.dtypes)

grouped=df.groupby(df.dtype,axis=1)

dict(list(grouped))

#選取一個或一組列

#對於由Dataframe 產生的Groupby對象，用一個或一組（單個字符串或者字符串數組）列名對其進行索引，就能實現選取部分列進行聚合的目的

print(df.groupby("key1")["datal"])

print(df.groupby("key1")["data2"])

print(df["data1"].groupby(df["key1"]))

print(df[["data2"]].groupby(df["key1"]))

#例如，對部分列進行聚合：計算data2列的平均值並以Dataframe形式得到結果

print(df.groupby(["key1","key2"])[["data2"]].mean())

#返回一個已分組的Dataframe（傳入的是列表或者數據）或者Series（傳入的是標量形式的單個列名）

s_grouped=df.groupby(["key1","key2"])["data2"]

print(s_grouped.mean())

#通過字典或者Series進行分組，除數組外分組信息還可以其他形式存在

people=pd.DataFrame(np.random.randn(5,5),columns=list("abcde"),index=["Joe","Steve","Wes","Jim","Travis"])

people.loc[2:3,["b","c"]]=np.nan

print(people)

#根據分組計算列的sum:

mapping={"a":"red","b":"red","c":"blue","d":"blue","e":"red","f":"orange"}

by_ccolumns=people.groupby(mapping,axis=1)

print(by_ccolumns.sum())

#將mapping這個字典傳給groupby即可，用Series作為分組鍵

map_series=pd.Series(mapping)

print(map_series)

people.groupby(map_series,axis=1).sum()

#這裡Series可以被看作一個固定大小的映射，pandas 會檢查Series 以確保其索引根分組軸時對齊的

#通過函數進行分組

#任何被當作分組鍵的函數都會在各個索引值上被調用一次，其返回值就會被用作分組名稱

print(people.groupby(len).sum())

#將函數跟數組，列表，字典，Series混合使用（任何東西最終都會被轉換為數組）：

key_list=["one","one","one","two","two"]

print(people.groupby([len,key_list]).min())

分享到:

閱讀更多 商業數據分析師 的文章

關鍵字: 清洗俄亥俄州數據庫

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

Python之數據清洗，轉換，合併，重塑實操大全

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

Redis內存分析工具--rdr安裝與使用

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

一行代碼提升遷移性能

利用相似幾何信息，做可泛化3D形狀分割模型

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

分佈式緩存，真香

特徵工程的力量

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

SpringBoot如何優雅的使用RocketMQ

css代碼規範工具stylelint

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪