「Python」巧用pandas,2行代码实现列不同值计数,完爆EXCEL

其实昨天写的“python pandas数据分组计数统计”也用到了这个值统计这个方法,感兴趣的朋友可以查看那篇文章,地址如下:

对于大量数据(几百万以上),excel无法加载,即使很简单的一个计数,我们通常也无法做到,用SQL还得先把数据入库,再SQL出来,麻烦。

「Python」巧用pandas,2行代码实现列不同值计数,完爆EXCEL

excel 文件未完全加载

示例数据如下:

「Python」巧用pandas,2行代码实现列不同值计数,完爆EXCEL

python 不同值计数 示例数据

我们要求的结果也很简单:

「Python」巧用pandas,2行代码实现列不同值计数,完爆EXCEL

python 不同值计数 结果

代码就更简单了,分享给大家,一个小石头有时也难倒英雄汉:

# encoding:utf-8

import pandas as pd

data = pd.read_csv(r'C:\Users\chenht40\Desktop\20181005.csv', encoding = 'gbk')

print (data['地市'].value_counts())

target = data['地市'].value_counts()

target.to_csv('输出目标.csv', encoding = 'gbk')

其实只要二三行就够了。

转给需要的朋友。


分享到:


相關文章: