行转列排除重复数据并且对比的方法

转列,排除,重复,数据,并且,对比,方法 · 浏览次数 : 300

小编点评

**行转列排除重复数据和对比的方法摘要** **步骤 1:处理标点符号** ``` sed -i 's/\"//g' master ``` **步骤 2:设置行转列** ``` sed -i 's/,/ /g' master ``` **步骤 3:对数据进行处理** ``` sed -i 's/,/ /g' master ``` **步骤 4:将 , 修改为 空格** ``` sed -i 's/ //g' master ``` **步骤 5:对数据进行排序** ``` sort master1 >master2 ``` **步骤 6:去除重复数据** ``` excel ``` **步骤 7:打开 Excel 进行比较** * 选择两个需要对比的数据列。 * 点击“条件格式”。 * 选择“突出显示重复单元格”。 * 设置“重复值”为浅红色填充。 * 选择两个不重复的数据列。 * 点击“开始”>“条件格式”。 * 选择“隐藏重复”。 * 重复值将被设置为灰色填充。 * 点击“取消”。 **最终结果** * 两列中所有重复数据将被隐藏或删除。 * 两列中所有不重复的数据将被保留。

正文

行转列排除重复数据并且对比的方法


摘要

出差成都. 突然发现被人当成Shell脚本小子了
今天让对着投影仪确定文件是否正确和完备
几乎闪瞎我的双眼
感觉国家这么多年的英语教育的确卓有成效
看简写, 耗费大半天也猜不出是啥意思来..

为了能够记录下来,干的事情, 把用到的命令和处理过程记录一下. 
备忘也希望对看到的人有所帮助. 

获取原始数据

数据格式为:
"ABC","BCD",""..... 等的样式. 我这边的处理方式为
另存为文件 例如 master
进行处理: 
1. 第一步 处理标点符号等
sed -i 's/"//g' master
也可以将多语的空格干掉
sed -i 's/ //g' master
2. 第二步设置行转列
可以将 , 修改为 空格 进行下一步的处理. 
sed -i 's/,/ /g' master
注意第一步和第二步一定不要反了..
for i in `cat master` ; do echo $i ; done >master1
进行排序.
sort master1 >master2
然后就可以放入 excel 进行比较了. 

excel去除重复数据

打开excel
将两列需要对比的数据放到 相邻的两个列中.
然后选中这两个列. 
点击 开始 -> 条件格式 -> 突出显示重复单元格 -> 重复值
将重复值 设置为有浅红色填充底色的单元格

然后很容易就可以将两个不重复的数据拉取出来. 

操作处理部分

image

与行转列排除重复数据并且对比的方法相似的内容:

行转列排除重复数据并且对比的方法

行转列排除重复数据并且对比的方法 摘要 出差成都. 突然发现被人当成Shell脚本小子了 今天让对着投影仪确定文件是否正确和完备 几乎闪瞎我的双眼 感觉国家这么多年的英语教育的确卓有成效 看简写, 耗费大半天也猜不出是啥意思来.. 为了能够记录下来,干的事情, 把用到的命令和处理过程记录一下. 备忘

[转帖]010 Linux 文本统计与去重 (wc 和 uniq)

https://my.oschina.net/u/3113381/blog/5427461 wc 命令一般是作为组合命令的一员与其他命令一同起到统计的作用。而一般情况下使用 wc -l 命令较多。 uniq 可检查文本文件中重复出现的行,一般与 sort 命令结合使用。一起组合搭配使用完成统计、排序

【转帖】MySQL索引

数据表如何用索引快速查找 索引是 排好序的快速查找的数据结构 索引存储在文件系统中 索引的文件存储形式与存储引擎有关 索引数据结构:可以是二叉树、红黑树、Hash表、B-Tree、B+Tree 1、二叉树 使用索引的如下图:(如果是使用二叉树结构)每一个节点都存放数据行的磁盘地址【快速定位到数据】

Hbase学习二:Hbase数据特点和架构特点

转载请注明出处: 1.Hbase数据特点 大:一个表可以有上亿行,上百万列。 面向列:面向列表(簇)的存储和权限控制,列(簇)独立检索。 稀疏:对于为空(NULL)的列,并不占用存储空间,因此,表可以设计的非常稀疏。 无模式:每一行都有一个可以排序的主键和任意多的列,列可以根据需要动态增加,同一张表

【pandas小技巧】--反转行列顺序

反转`pandas` `DataFrame`的行列顺序是一种非常实用的操作。在实际应用中,当我们需要对数据进行排列或者排序时,通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集,发现其中的规律和趋势。同时,行列反转还可以帮助我们将数据可视化,使得图表更加易于理解。 除了常规

表格集算表高性能原理:揭秘纯前端百万行数据秒级响应的魔法

最新技术资源(建议收藏) https://www.grapecity.com.cn/resources/ 集算表 (Table Sheet)是一个具备高性能渲染、数据绑定功能、公式计算能力的数据表格,通过全新构建的关系型数据管理器结合结构化公式,在高性能表格的基础上提供排序、筛选、样式、行列冻结、自

[转帖]shell 实现行转列、列转行的几种方法

目录 shell 实现行转列、列转行的几种方法awk行转列 xargs行转列 tr列转行参考资料 shell 实现行转列、列转行的几种方法 awk 行转列 以空格为分隔符 awk -F "+" '{for(i=1;i<=NF;i++) a[i,NR]=$i}END{for(i=1;i<=NF;i++

记一次简单的存储过程和Pivot行转列

首先我很讨厌写存储过程,其次我很讨厌 没办法,主要是需要进行 行转列,项目经理说可以用Pivot。我不是很精通sql,但是我会百度呀~ pivot需要有确定的列名。那我这个项目里面没办法确定,最后问了gpt,使用动态sql(我以前也没用过),不过效果是我想要的,于是乎,改成存储过程吧。 简单的存储过

Pandas 使用教程 CSV - CSV 转 JSON

目录JSON 转换为 CSVCSV 转 JSON行、列操作 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。 A

[转帖]为什么说MySQL单表行数不要超过2000w?

https://segmentfault.com/a/1190000042716913 大家好,我是不才陈某~ 作为在后端圈开车的多年老司机,是不是经常听到过,“mysql 单表最好不要超过 2000w”,“单表超过 2000w 就要考虑数据迁移了”,“你这个表数据都马上要到 2000w 了,难怪查