我有一个CSV文件,它有大约1000行和20列。在这一栏中有一句话:我面临登录问题,需要它的支持,我听不到音频/耳机问题,我无法登录。我尝试的是,隔离问题,找出音频/头戴式耳机报告了多少问题,以及登录问题报告了多少问题,等等
因为我昨天刚开始学习python,所以我需要一些关于如何做的建议。
Ps -我能够找到列中存在的唯一值,但缺乏在此步骤后如何继续:(
感谢阿拉温德·S
回答开始:得票数 0如果你不关心内容,只想计算每个关键字的问题数量(只需设置你自己的关键字列表),那么这段代码应该可以工作:
keywords = ['login', 'audio']
for keyword in keywords:
df['Summary'] = df['Summary'].apply(lambda issue: keyword if keyword in issue else issue)
for elem in df.groupby(['Summary']):
keyword = elem[0]
number_of_issues = elem[1].shape[0]
print('{} issues - {}'.format(keyword, number_of_issues))
总结
以上是真正的电脑专家为你收集整理的我正在尝试使用python中的关键字从单个列形成一个集群的全部内容,希望文章能够帮你解决所遇到的问题。
如果觉得真正的电脑专家网站内容还不错,欢迎将真正的电脑专家推荐给好友。
有话要说...