|
|

. S2 \* Q; Q1 O# b3 x普通程序员,不学算法,也可以成为大神吗?对不起,这个,绝对不可以。2 M3 b$ L9 }) c2 I, w
# d1 _2 G7 y! ~0 W. f/ |
可是算法好难啊~~看两页书就想睡觉……所以就不学了吗?就一直当普通程序员吗?
q; o3 Z' F: H4 ?如果有一本算法书,看着很轻松……又有代码示例……又有讲解……
$ c* W+ q* y! y9 s- [怎么会有那样的书呢?哎呀,最好学了算法人还能变得很萌……
2 n5 |1 O0 b# h( f, k2 y这个……要求是不是太高了呀?哈哈,有的书真的能满足所有这些要求哦!
' |& |0 J2 `, b/ Y( x5 `* ]0 e# c来,看看这本书有多可爱——) C& |) G1 O% n) t8 f
. H/ ~/ B4 v: \0 v5 F( t- E二分查找
. H+ F* m4 l \6 g `假设要在电话簿中找一个名字以K打头的人,(现在谁还用电话簿!)可以从头开始翻页,直到进入以K打头的部分。但你很可能不这样做,而是从中间开始,因为你知道以K打头的名字在电话簿中间。6 H1 z: ^8 K) i) E" t6 m# `' x

; k ]- u. W2 y又假设要在字典中找一个以O打头的单词,你也将从中间附近开始。* \' }$ V8 \! T" F& ~/ f& p0 |; D
现在假设你登录Facebook。当你这样做时,Facebook必须核实你是否有其网站的账户,因此必须在其数据库中查找你的用户名。如果你的用户名为karlmageddon,Facebook可从以A打头的部分开始查找,但更合乎逻辑的做法是从中间开始查找。
# d+ Y! q9 v& k- B' o6 i$ z这是一个查找问题,在前述所有情况下,都可使用同一种算法来解决问题,这种算法就是二分查找。! \ f6 O% q) c

: j9 w+ q% @+ X7 L, @& l/ n二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。! c8 j( T9 W5 i* l; I' q. K( a
下图是一个例子。
( @2 j" B& p9 A1 P g8 T0 A / x+ b5 x L/ b7 v, f! y6 z
下面的示例说明了二分查找的工作原理。我随便想一个1~100的数字。9 t& Z4 u3 E: ^, X! x5 e3 ?

; Q- G: b3 T4 r" r/ D# Z你的目标是以最少的次数猜到这个数字。你每次猜测后,我会说小了、大了或对了。
+ P+ |5 q( O/ A* q假设你从1开始依次往上猜,猜测过程会是这样。
, p N6 ?1 I/ W$ X" H4 }- k ! W$ `3 b) s+ v7 \* {5 N+ }( P) `
这是简单查找,更准确的说法是傻找。每次猜测都只能排除一个数字。如果我想的数字是99,你得猜99次才能猜到!8 ~- O3 h7 u- t: x* V7 U; T
更佳的查找方式& `! @1 U$ ?$ K
& `1 ~1 O: n `3 g+ C
下面是一种更佳的猜法。从50开始。& q6 m0 z5 g6 Z: g1 t
3 X z4 n6 p# X5 k; [
小了,但排除了一半的数字!至此,你知道1~50都小了。接下来,你猜75。2 ?: y) A! j. D
9 N I. @1 R# q) K' Q7 }8 L+ n
大了,那余下的数字又排除了一半!使用二分查找时,你猜测的是中间的数字,从而每次都将余下的数字排除一半。接下来,你猜63(50和75中间的数字)。
& S% S% O5 W7 B* d7 L2 T( V( Q L# h7 k* A/ ~$ C: l) K" c$ R
这就是二分查找,你学习了第一种算法!每次猜测排除的数字个数如下。3 M, @$ q, Q4 P |5 Y
+ Y! L* j5 H7 I) U
不管我心里想的是哪个数字,你在7次之内都能猜到,因为每次猜测都将排除很多数字!
( r2 e& Y, [ F1 z% ]% r4 W8 ~假设你要在字典中查找一个单词,而该字典包含240 000个单词,你认为每种查找最多需要多少步?! }/ |* x- F+ `5 S- Y0 {. z

6 ^9 K4 L S2 M7 c如果要查找的单词位于字典末尾,使用简单查找将需要240 000步。使用二分查找时,每次排除一半单词,直到最后只剩下一个单词。
8 A# X" u' e+ j# A# V9 F% R
0 b9 U9 F" _& O6 Z5 B6 H% W; S/ f因此,使用二分查找只需18步——少多了!一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步,而简单查找最多需要n步。3 \" \7 ^+ o: {, ?( G; G6 }( t
对数
: y$ e4 x6 N4 ?7 d) \- K你可能不记得什么是对数了,但很可能记得什么是幂。log10100相当于问“将多少个10相乘的结果为100”。答案是两个:10 × 10 = 100。因此,log10100 = 2。对数运算是幂运算的逆运算。
* R( ], t- v @/ h
]; ]4 R, C) U对数是幂运算的逆运算
9 ?9 Q' [7 I9 S7 _. N0 R3 j本书使用大O表示法(稍后介绍)讨论运行时间时,log指的都是log2。使用简单查找法查找元素时,在最糟情况下需要查看每个元素。因此,如果列表包含8个数字,你最多需要检查8个数字。而使用二分查找时,最多需要检查log n个元素。如果列表包含8个元素,你最多需要检查3个元素,因为log 8 = 3(23 = 8)。如果列表包含1024个元素,你最多需要检查10个元素,因为log 1024 = 10(210 =1024)。: T0 L9 n8 a- L9 n6 G0 a2 J
下面来看看如何编写执行二分查找的Python代码。这里的代码示例使用了数组。如果你不熟悉数组,也不用担心,下一章就会介绍。你只需知道,可将一系列元素存储在一系列相邻的桶(bucket),即数组中。这些桶从0开始编号:第一个桶的位置为#0,第二个桶为#1,第三个桶为#2,以此类推。; K' \9 A9 W" j8 ]7 ?4 G
函数binary_search接受一个有序数组和一个元素。如果指定的元素包含在数组中,这个函数将返回其位置。你将跟踪要在其中查找的数组部分——开始时为整个数组。7 P2 F+ F$ n% ~
low = 0high = len(list) - 1
& m) o+ E6 o. ~4 V7 s: b你每次都检查中间的元素。+ \& B% w% s) h! P5 | B1 W
mid = (low + high) / 2 ←---如果(low + high)不是偶数,Python自动将mid向下取整。guess = list[mid]ifguess < item: low = mid + 1 如果猜的数字大了,就修改high。完整的代码如下。7 X6 q1 s% Y1 j
whilelow 1 ←别忘了索引从0开始,第二个位置的索引为1print binary_search(my_list, -1) # => None ←在Python中,None表示空,它意味着没有找到指定的元素运行时间
1 F! T i' h$ e1 K! L6 K) p7 e1 e; l
5 `3 n% I; S4 N; l1 r) @% R, p e每次介绍算法时,我都将讨论其运行时间。一般而言,应选择效率最高的算法,以最大限度地减少运行时间或占用空间。# r$ h4 i; \( t5 A h9 v
1 z) @/ s# b. E: G. _7 U6 O
回到前面的二分查找。使用它可节省多少时间呢?简单查找逐个地检查数字,如果列表包含100个数字,最多需要猜100次。如果列表包含40亿个数字,最多需要猜40亿次。换言之,最多需要猜测的次数与列表长度相同,这被称为线性时间(linear time)。, F7 e( |$ r' P- g
二分查找则不同。如果列表包含100个元素,最多要猜7次;如果列表包含40亿个数字,最多需猜32次。厉害吧?二分查找的运行时间为对数时间(或log时间)。下表总结了我们发现的情况。
0 v3 I( Q4 c9 W$ a- o/ T' W o
) I% `2 X2 J' h8 \, N1 j& i7 S6 T$ z$ F2 i2 m+ d
大O表示法
% |2 n4 z8 S8 j, Q0 _0 ^大O表示法是一种特殊的表示法,指出了算法的速度有多快。谁在乎呢?实际上,你经常要使用别人编写的算法,在这种情况下,知道这些算法的速度大有裨益。本节将介绍大O表示法是什么,并使用它列出一些最常见的算法运行时间。
! M* B/ ?) y3 c8 t4 {算法的运行时间以不同的速度增加0 n7 C: |3 F6 g7 X0 F- O
, }# r$ v3 S6 GBob要为NASA编写一个查找算法,这个算法在火箭即将登陆月球前开始执行,帮助计算着陆地点。
R4 V+ v- B6 M! q ' {! g# E/ a$ m' c, s3 \; k, G# Y
这个示例表明,两种算法的运行时间呈现不同的增速。Bob需要做出决定,是使用简单查找还是二分查找。使用的算法必须快速而准确。一方面,二分查找的速度更快。Bob必须在10秒钟内找出着陆地点,否则火箭将偏离方向。另一方面,简单查找算法编写起来更容易,因此出现bug的可能性更小。Bob可不希望引导火箭着陆的代码中有bug!为确保万无一失,Bob决定计算两种算法在列表包含100个元素的情况下需要的时间。. b+ K; h7 j& i
假设检查一个元素需要1毫秒。使用简单查找时,Bob必须检查100个元素,因此需要100毫秒才能查找完毕。而使用二分查找时,只需检查7个元素(log2100大约为7),因此需要7毫秒就能查找完毕。然而,实际要查找的列表可能包含10亿个元素,在这种情况下,简单查找需要多长时间呢?二分查找又需要多长时间呢?请务必找出这两个问题的答案,再接着往下读。4 F, y$ R" V$ |* E) E3 Y" R
7 }1 c5 Y1 d8 i& Q9 k6 Z
Bob使用包含10亿个元素的列表运行二分查找,运行时间为30毫秒(log21 000 000 000大约为30)。他心里想,二分查找的速度大约为简单查找的15倍,因为列表包含100个元素时,简单查找需要100毫秒,而二分查找需要7毫秒。因此,列表包含10亿个元素时,简单查找需要30 × 15 = 450毫秒,完全符合在10秒内查找完毕的要求。Bob决定使用简单查找。这是正确的选择吗?2 D2 Z j u. X N) `
不是。实际上,Bob错了,而且错得离谱。列表包含10亿个元素时,简单查找需要10亿毫秒,相当于11天!为什么会这样呢?因为二分查找和简单查找的运行时间的增速不同。
7 C8 p$ t7 `- ^ C 5 S2 L, f- U; G n. C7 n% G6 k
也就是说,随着元素数量的增加,二分查找需要的额外时间并不多,而简单查找需要的额外时间却很多。因此,随着列表的增长,二分查找的速度比简单查找快得多。Bob以为二分查找速度为简单查找的15倍,这不对:列表包含10亿个元素时,为3300万倍。有鉴于此,仅知道算法需要多长时间才能运行完毕还不够,还需知道运行时间如何随列表增长而增加。这正是大O表示法的用武之地。' v& K; l9 p5 `! E
0 b4 s1 r: H$ h' t* k; E3 a
大O表示法指出了算法有多快。例如,假设列表包含n 个元素。简单查找需要检查每个元素,因此需要执行n 次操作。使用大O表示法,这个运行时间为O(n)。单位秒呢?没有——大O表示法指的并非以秒为单位的速度。大O表示法让你能够比较操作数,它指出了算法运行时间的增速。
; X" M& p N; C @2 ]( z8 Q& s再来看一个例子。为检查长度为n 的列表,二分查找需要执行log n 次操作。使用大O表示法,这个运行时间怎么表示呢?O(log n)。一般而言,大O表示法像下面这样。# h, _; M& X* ^! @

4 R; ?2 l5 K, M# ^这指出了算法需要执行的操作数。之所以称为大O表示法,是因为操作数前有个大O。这听起来像笑话,但事实如此!
* j" s7 R2 B8 r# T# H" j下面来看一些例子,看看你能否确定这些算法的运行时间。3 f; f$ P; l" G/ F y
理解不同的大O运行时间
5 ^! L5 P, M* D7 C3 N* }3 M, u' d% J/ o4 f6 b9 p
下面的示例,你在家里使用纸和笔就能完成。假设你要画一个网格,它包含16个格子。* {. H f% g$ u9 I+ V# Y
3 V+ ~: z! @6 ^% {+ w1 p: g5 K
算法1! H9 ^8 q) j9 S; N9 M0 O! ? v1 e2 ]
一种方法是以每次画一个的方式画16个格子。记住,大O表示法计算的是操作数。在这个示例中,画一个格子是一次操作,需要画16个格子。如果每次画一个格子,需要执行多少次操作呢?
$ ?' P( V A8 A' D/ _: T5 u 6 ^& w- O. o$ \0 c+ [
画16个格子需要16步。这种算法的运行时间是多少?
/ O8 A$ R3 ^1 L5 z l1 w$ `$ l算法2& i4 _5 L# ~. |4 O$ J6 u% v/ P a z
请尝试这种算法——将纸折起来。
8 w% I5 P3 P( R% Q; f* t
3 ?1 W5 n; |6 A7 b0 n( p0 w在这个示例中,将纸对折一次就是一次操作。第一次对折相当于画了两个格子!
3 i/ O, E: k( U( {再折,再折,再折。5 a# _' w: n! I. K6 K+ Q9 ^
% A0 h$ C) p! _9 P7 |9 c9 B
折4次后再打开,便得到了漂亮的网格!每折一次,格子数就翻倍,折4次就能得到16个格子!
* B9 J/ @- l6 d7 s3 a5 G
9 Q: t# y! W/ i8 H2 y+ S你每折一次,绘制出的格子数都翻倍,因此4步就能“绘制”出16个格子。这种算法的运行时间是多少呢?请搞清楚这两种算法的运行时间之后,再接着往下读。
4 u/ U- R& I" q& B答案如下:算法1的运行时间为O(n),算法2的运行时间为O(log n)。9 W" _; n& c1 f+ @" d
大O表示法指出了最糟情况下的运行时间# U1 d8 }# \; I/ t
# x% G1 S, q7 b3 C) F* M0 J1 d) k
假设你使用简单查找在电话簿中找人。你知道,简单查找的运行时间为O(n),这意味着在最糟情况下,必须查看电话簿中的每个条目。如果要查找的是Adit——电话簿中的第一个人,一次就能找到,无需查看每个条目。考虑到一次就找到了Adit,请问这种算法的运行时间是O(n)还是O(1)呢?
: p( m. D: K2 f简单查找的运行时间总是为O(n)。查找Adit时,一次就找到了,这是最佳的情形,但大O表示法说的是最糟的情形。因此,你可以说,在最糟情况下,必须查看电话簿中的每个条目,对应的运行时间为O(n)。这是一个保证——你知道简单查找的运行时间不可能超过O(n)。
9 d1 i3 M z1 m, ~5 P+ V说明
# a1 a$ t! Y0 j+ N( v除最糟情况下的运行时间外,还应考虑平均情况的运行时间,这很重要。最糟情况和平均情况将在第4章讨论。
$ T1 j) H4 P2 Q! i' p- E/ Z 一些常见的大O运行时间
% ~/ [1 [( e+ s/ I% A# E" A m
2 z. |, t( f0 v0 _% E$ ~下面按从快到慢的顺序列出了你经常会遇到的5种大O运行时间。& U. ?: }' P5 M6 o4 j
% l/ y' A# [4 m4 u5 i# p- Q4 c) [
- O(log n),也叫对数时间,这样的算法包括二分查找。( b, Z; s5 }7 D- m. @5 x. _
- O(n),也叫线性时间,这样的算法包括简单查找。
% A* N# E* P: i. F. F& U - O(n * log n),这样的算法包括第4章将介绍的快速排序——一种速度较快的排序算法。6 d: M: ?- ]3 ?4 i: u2 H1 L) x
- O(n2),这样的算法包括第2章将介绍的选择排序——一种速度较慢的排序算法。
6 K: i. V j& I# @- V5 o `+ O5 f; [ - O(n!),这样的算法包括接下来将介绍的旅行商问题的解决方案——一种非常慢的算法。
; w2 M% B; @8 C* S% `1 E2 z 假设你要绘制一个包含16格的网格,且有5种不同的算法可供选择,这些算法的运行时间如上所示。如果你选择第一种算法,绘制该网格所需的操作数将为4(log 16 = 4)。假设你每秒可执行10次操作,那么绘制该网格需要0.4秒。如果要绘制一个包含1024格的网格呢?这需要执行10(log 1024 = 10)次操作,换言之,绘制这样的网格需要1秒。这是使用第一种算法的情况。
3 Z" R6 y! _- L) J第二种算法更慢,其运行时间为O(n)。即要绘制16个格子,需要执行16次操作;要绘制1024个格子,需要执行1024次操作。执行这些操作需要多少秒呢?
* i8 l% m, d6 A$ c下面按从快到慢的顺序列出了使用这些算法绘制网格所需的时间:* q+ D2 H/ i7 _6 J4 ?
# H/ n; v. }4 }5 h0 b
还有其他的运行时间,但这5种是最常见的。
% ^. I3 j+ Q, h# D8 R这里做了简化,实际上,并不能如此干净利索地将大O运行时间转换为操作数,但就目前而言,这种准确度足够了。等你学习其他一些算法后,第4章将回过头来再次讨论大O表示法。当前,我们获得的主要启示如下。
' K( d( r3 b& \: q3 [! B4 ` G$ D2 l9 l0 f1 G
- 算法的速度指的并非时间,而是操作数的增速。# u9 o O1 }. R& I4 z; u; [
- 谈论算法的速度时,我们说的是随着输入的增加,其运行时间将以什么样的速度增加。* ^4 X* [& u! G. g! \7 A
- 算法的运行时间用大O表示法表示。. y, I& \, g2 G% ^& @$ C
- O(log n)比O(n)快,当需要搜索的元素越多时,前者比后者快得越多。8 E2 j% \6 o. z# [" ]
以上内容来自《算法图解》; a. r3 ]! X3 f4 |$ @
) _ e) S% x. R y4 ]2 S
《算法图解》0 D( {9 K3 R4 q; z1 K) i: y, ?9 Y8 y
( n$ \- \3 _8 V( l9 ^! c1 r
扫码查看详情 q9 z8 W- ^3 F8 A) J
) X0 B7 P3 f7 I* H# T7 ]( E编辑推荐:/ V+ ~. e. H& J& Z
本书示例丰富,图文并茂,以让人容易理解的方式阐释了算法,旨在帮助程序员在日常项目中更好地发挥算法的能量。书中的前三章将帮助你打下基础,带你学习二分查找、大O表示法、两种基本的数据结构以及递归等。余下的篇幅将主要介绍应用广泛的算法,具体内容包括:面对具体问题时的解决技巧,比如,何时采用贪婪算法或动态规划;散列表的应用;图算法;K最近邻算法。
2 i5 I$ F2 n, B2 l扫码或者点击阅读原文购买
! p9 m0 y3 J" Z6 @
: Z( g7 Q( _& X - n- {. q3 ?, p( u; v4 e
作为码书商店的运营人员,诚邀你们进入我们的“CSDN码书福利群”,群里会不定时的给大家赠书书籍、优惠券等,有书籍推荐或者物流方面信息也可群里咨询~目前群已满100人,需要加群的请扫下方二维码添加微信,拉你入群哦~对此次活动不了解的也可咨询~& B+ \; c7 e" v) j( u, @. d9 y
: v" t0 q. e' a& g/ c
* B2 v! L& r' r9 Y& Y) N6 T6 P- u8 s& `
+ O+ H2 l3 i! M* y" U来源:http://www.yidianzixun.com/article/0MIo0Rxx& l8 {* Y1 d& s5 w
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|