Python语言之Python 列表去重的4种方式及性能对比-职坐标

海同科技，欢迎您！

就业

学习

资料

IT知识库

编程语言

站

热门城市全国站>

其他省市

快速购买

15692118659

热门课程

IT学院

职坐标首页 IT知识库编程语言 Python

选择在海同提升： 30 天 1510 名，今日申请 54 人 IT技术咨询 >>

Python语言之Python 列表去重的4种方式及性能对比

小职 2020-11-09 来源：Python实用宝典阅读 1201 评论 0

摘要：列表去重是Python中一种常见的处理方式，列表去重的方式有很多，本文讲解了Python列表去重的4种方式以及性能对比，希望对Python 的学习有所帮助。

列表去重是Python中一种常见的处理方式，列表去重的方式有很多，本文讲解了Python列表去重的4种方式以及性能对比，希望对Python 的学习有所帮助。

Python语言之Python 列表去重的4种方式及性能对比

列表去重是Python中一种常见的处理方式，任何编程场景都可能会遇到需要列表去重的情况。

列表去重的方式有很多，本文将一一讲解他们，并进行性能的对比。

让我们先制造一些简单的数据，生成0到99的100万个随机数：

from random import randrange

DUPLICATES = [randrange(100) for _ in range(1000000)]

接下来尝试这4种去重方式中最简单直观的方法：

1. 新建一个数组，遍历原数组，如果值不在新数组里便加入到新数组中。

# 第一种方式

def easy_way():

unique = []

for element in DUPLICATES:

if element not in unique:

unique.append(element)

return unique

进入ipython使用timeit计算其去重耗时：

%timeit easy_way()

# 1.16 s ± 137 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

Python语言之Python 列表去重的4种方式及性能对比

平均耗时在1.16秒左右，但是在这个例子中我们使用了数组作为存储对象，实际上如果我们改成集合存储去重后的结果，性能会快不少：

def easy_way():

unique = set()

for element in DUPLICATES:

if element not in unique:

unique.add(element)

return unique

%timeit easy_way()

# 48.4 ms ± 11.6 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

平均耗时在48毫秒左右，改善明显，这是因为集合和数组的内在数据结构完全不同，集合使用了哈希表，因此速度会比列表快许多，但缺点在于无序。

接下来看看第2种方式：

2. 直接对数组进行集合转化，然后再转回数组：

# 第二种去重方式

def fast_way()

return list(set(DUPLICATES))

耗时：

%timeit fast_way()

# 14.2 ms ± 1.73 ms per loop (mean ± std. dev. of 7 runs, 100 loops each)

平均耗时14毫秒，这种去重方式是最快的，但正如前面所说，集合是无序的，将数组转为集合后再转为列表，就失去了原有列表的顺序。

如果现在有保留原数组顺序的需要，那么这个方式是不可取的，怎么办呢?

3. 保留原有数组顺序的去重

使用dict.fromkeys()函数，可以保留原有数组的顺序并去重：

def save_order():

return list(dict.fromkeys(DUPLICATES))

当然，它会比单纯用集合进行去重的方式耗时稍微久一点：

%timeit save_order()

# 39.5 ms ± 8.66 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

平均耗时在39.5毫秒，我认为这是可以接受的耗时，毕竟保留了原数组的顺序。

但是，dict.fromkeys()仅在Python3.6及以上才支持。

如果你是Python3.6以下的版本，那么可能要考虑第四种方式了。

4. Python3.6以下的列表保留顺序去重

在Python3.6以下，其实也存在fromkeys函数，只不过它由collections提供：

from collections import OrderedDict

def save_order_below_py36():

return list(OrderedDict.fromkeys(DUPLICATES))

耗时：

%timeit save_order_below_py36()

# 71.8 ms ± 16.9 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

平均耗时在72毫秒左右，比 Python3.6 的内置dict.fromkeys()慢一些，因为OrderedDict是用纯Python实现的。

关注“职坐标在线”（Zhizuobiao_Online）公众号，免费获取最新技术干货教程资源哦

python编程语言 python高效开发实战 python语言入门pdf

本文由 @小职发布于职坐标。未经许可，禁止转载。

喜欢 | 0

不喜欢 | 0

看完这篇文章有何感觉？已经有0人表态，0%的人喜欢快给朋友分享吧~

评论（0）

后参与评论

加入IT交流圈

JAVA工程师交流群 +加入

大数据架构师交流群 +加入

人工智能Python交流群 +加入

WEB/H5前端交流群 +加入

职坐标公众号

编程语言 直通车

资料领取
答疑解惑
技术交流
职业测评
面试技巧
高薪秘笈

海同专业团队更多>>

认证System Analyst，System Architect

15年全栈技术研发经验，中南大学、湖南师大等10+所高校特聘讲师

热门就业技能更多>>

【零基础】人工智能+Python全栈开发技术

【零基础】人工智能+Python全栈开发技术

人工智能+Python技术风口浪潮

【零基础】JavaEE高级开发技术

【零基础】JavaEE高级开发技术

起薪高，轻松进名企

【零基础】大数据与分布式架构技术

【零基础】大数据与分布式架构技术

培训大数据分布式架构

Python30天热搜词更多>>

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场匹配合适岗位

验证码手机号，获得海同独家IT培训资料

选择就业方向：: 人工智能物联网; 大数据开发/分析; 人工智能Python; Java全栈开发; WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了，明天再试试吧！

提交

我们会在第一时间安排职业规划师联系您！

您也可以联系我们的职业规划师咨询：

小职老师的微信号：z_zhizuobiao

小职老师的微信号：z_zhizuobiao

版权所有职坐标-一站式AI+学习就业服务平台沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com，All Rights Reserved.
沪公网安备 31011502005948号

关于我们 │ 法律声明 │ 联系我们

©2015 www.zhizuobiao.com All Rights Reserved