FWQ
如何读取CSV文件并合并内容并计算出现比例?
如何读取CSV文件并合并内容并计算出现比例? 一分耕耘,一分收获!既然都打开这篇,就坚持看下去,学下去吧!本文主要会给大家讲到等等知识点,如果大家对本文有好的建议或者看到有不足之处,非常欢迎大家积极提出!在后续文章我会继续更新文章相关的内容,希望对大家都有所帮助! 如何读取csv文件后合并内容 在读取csv文件后,可以通过以下步骤合并内容: 1. 获取主键列和待合并列使用pd.read_csv()读取csv文件,并获取主键列(cmd)和待合并列(opt)。 2. 删除重复主键使用set()和sorted()删除cmd列中的重复元素,得到不重复的主键列表。 3. 计算主键出现次数使用counter()计算每个主键出现的次数,得到一个词频字典。 4. 初始化合并后的结果创建一个文件来保存合并后的结果。 5. 遍历主键对于每个主键,执行以下操作: 获取该主键对应的opt列索引。 创建一个新的列表来存储opt列中的值。 遍历opt列索引,将值添加到新列表中。 将新列表转换为字符串,再转换为列表。 6. 计算并输出每个opt的出现比例遍历不重复的opt值,计算每个opt在该主键下出现的次数与主键出现次数的比值,并将其写入结果文件中。 示例代码: import pandas as pd import os data…